
科 研 管 理
Science Research Manage ment Vol .30,No .1
January, 2009
收稿日期:2008-07-02.
基金项目:国家自然科学基金项目(70773015,2008-2010);教育部高等学校博士学科点专项科研基金资助课题(20070141059,2008-2010);辽宁省教育厅人文社会科学研究项目(2008GH14);辽宁省社会科学界联合会立项课题(2007lslktglx -52)。
作者简介:侯海燕(1971-06),女(汉),黑龙江牡丹江人,大连理工大学讲师,博士,硕士生导师,研究方向为科技管理、科学计量学
与科学知识图谱。
刘则渊(1940-05),男(土家族),湖北恩施人,大连理工大学教授、博士生导师,研究方向为战略管理与科技管理。栾春娟(1969-11),女,辽宁大连人,大连理工大学讲师、在职博士生,研究方向为科技管理与专利计量。
文章编号:1000-2995(2009)01-007-01
基于知识图谱的国际科学计量学研究前沿计量分析
侯海燕,刘则渊,栾春娟
(大连理工大学网络-信息-科学-经济计量实验室,辽宁大连 116085)
摘要:通过绘制科学计量学研究前沿知识图谱,界定出七大国际科学计量学研究前沿领域:1、引文理论、科学交流、基础科研评价;2、科学知识图谱理论与方法、网络计量学;3、科学技术合作;4、科学计量学经典概率分布、文献计量学定律、信息计量学;5、科学计量学指标与国家科研绩效评价;6、知识的新产品———科技动力学;
7、科学与技术的关系。其中前沿领域1、2、4属于理论与方法研究领域,而前沿领域3、5、6、7属于应用研究领
域。经过比较发现科学计量学更加侧重于理论与方法研究。关键词:科学计量学;研究前沿;科学知识图谱;共词分析;共引分析中图分类号:G301 文献标识码:A
1引言
“科学计量学是指科学学研究中定量方面的问题。”[1]
1997年,荷兰科学计量学家瑞安(Van 2raan AFJ )指出,科学计量学的核心前沿研究集中
在四个方面:科研指标与科学活动评价;科学技术的文献计量信息系统;科学与技术的交互作用;科学学科领域的认知结构及社会组织结构[2]
。
加菲尔德将科学研究前沿(research fr onts )定义为被引频次最高的核心文献(core highly ci 2ted papers )与引证这些核心文献的来源文献(ci 2ting papers )的集合,前沿的名称可以从来源文献
标题中出现频次最高的单词或词组提取出来
[3]
。
为了证实或修正荷兰科学计量学家定性的经验性研究结论,我们决定借助科学计量学本身的定量研究方法,并结合加菲尔德对科学研究前沿所下
的定义,绘制科学计量学研究前沿知识图谱,形象
地描绘科学计量学前沿课题及重点研究方向的进展情况。
国家哲学社会科学研究“十一五”规划倡导“立足学术前沿,充分运用信息技术等先进手段,提高研究水平。”因此,引入信息技术的前沿方法———科学知识图谱,以美国科学引文索引(SC I )收录的科学计量学权威期刊发表的全部论文为研究对象,借助科学知识图谱,力图客观、科学、系统、形象地展示科学计量学前沿进展的总体图景、发展态势与结构特征,追踪并把握科学计量学的发展态势及其潜力所在,为中国科学计量学界及时跟踪国际前沿,把握正确的研究方向,找准研究的切入点,选择科研项目提供科学的量化依据,对于提高我国科学计量学研究水平,具有重要的理论意义与学术价值。
・
2 数据来源与方法
《科学计量学》(Scient ometrics)是世界上最早的、也是唯一的一份以科学计量学的学科名称命名的国际性期刊,匈牙利科学计量学家舒伯特(Schubert A)认为,对于这本期刊的研究将很好地反映科学计量学领域的发展[4]。我们研究的数据是《科学计量学》于1978年创刊至2004年间发表的全部1927篇论文,分析的基本数据单元包括论文标题中的单词以及32345条引文。数据来源于美国I SI(科学情报研究所)的W eb of Sci2 ence,数据最后的更新时间为2005年2月15日。
在本研究中,我们将共词分析和共引分析相结合[5],借助科学知识图谱[6]展示科学计量学的前沿研究课题及其结构。科学知识图谱(Mapp ing Kno wledge Do mains)是将信息可视化技术、应用数学、图形学、计算机科学等与科学计量学结合起来的交叉科学研究方法,可将科学前沿领域的海量文献数据信息转换为可视化图像,展示单凭个人经验难以直观获得的学科前沿领域的总体图景、发展态势与结构特征等等。新世纪初,复杂网络分析与信息可视化技术的引入使得科学知识图谱技术突飞猛进。来自于不同学科领域的学者在信息科学、管理科学等领域绘制出了各种类型的科学知识图谱。国内对科学知识图谱方法的引入和应用,近几年才刚刚起步。从事科学计量学和信息技术研究的学者将科学知识图谱广泛应用于管理学、知识管理、科学计量学等科学技术前沿领域的可视化研究。
本研究所采用的具体方法包括借助文献共引分析方法(Docu ment Co-citati on Analysis),找到《科学计量学》被引频次最高的核心文献,借助尺度分析(Multidi m ensi onal Scaling)、因子分析方法(Fact orAnalysis)和共词分析(Co-word analy2 sis)界定科学计量学主要的前沿领域。
3 分析与结果
为了追踪科学计量学的前沿研究领域,我们首先借助文献共引分析方法,找到《科学计量学》从1978-2004年的全部引文中被引频次最高的(超过20次)69个核心文献,通过尺度分析、主成分分析绘制出该69个核心文献的共引图谱(见图1),在图1中我们用每一篇核心文献标题中的主要词汇对该篇文献进行标注。
在主成分分析中,由于初始因子的综合性太强,难以找出因子的实际意义,需要通过旋转坐标轴,降低因子的综合性以凸显其实际意义。因此我们应用最大方差法(Vari m ax)进行正交旋转,萃取出八个主成分,累计方差贡献率达到871413%。我们注意到,主成分七仅包含一个文献———埃格赫的《信息计量学导论》(Egghe L, 1990,I ntr oducti on of I nf or metrics),该文献同时属于两个主成分,在主成分七中的因子负载为014,而在主成分四中的因子负载为01693,因此我们认为该文献应归属于主成分四。去除主成分七之后,我们最后得到了七个主成分(见表1),累计方差贡献率为861531%。在图1中我们用线的粗细来表示主成分影响力的大小,边界线越粗,表示该主成分的方差贡献率越大,影响越大。
表1 科学计量学研究前沿主成分列表
Tab.1 Result of PCA of research fron ts of sc i en tom etr i cs
主成分初始特征值
方差
贡献率%
累计方差
贡献率%
旋转后的因子
负载平方和
方差
贡献率%
累计方差
贡献率%
1引文理论、科学交流、基础科研评价30.31843.93943.93918.324261557261557 2科学知识图谱理论与方法、网络计量学101748151577591516131980201262461818 3科学技术合作8163112150872102491597131908601727 4科学计量学经典概率分布、文献计量学定律、
信息计量学
610558177580179981423121207721934 5科学计量学指标与科研绩效评价217954105184185071979111563841498 6知识的新产品--科技动力学185311237861087190711314851811 7科学与技术的关系1433162786171414971720861531・166
・科 研 管 理2009年
在每一个前沿领域的来源文献群体中,我们剔除掉仅仅引证了一篇该领域的核心文献的来源文献,找到至少引用了两个该群体中核心文献的来源文献,对这些来源文献的标题做词频分析,以使得词频分析的结果能够更加具有代表性。在图1中列出了每一个来源文献群体使用频次最高的单词及其被引频次,我们遵循加菲尔德的方法,从这些使用频次最高的单词或词组中提取出了七个前沿研究领域的名称:1、引文理论、科学交流、基础研究评价(Citati on theory,Science Communica2 ti on,Basic Research A ssess ment);2、科学知识图谱理论与方法、网络计量学(Mapp ing of Science, W ebometrics);3、科学技术合作(Collaborati on in Science and Technol ogy);4、科学计量学经典概率分布、文献计量学定律、信息计量学(Scient ometric D istributi on,B ibli ometric la w,I nfor metrics);5、科学计量学指标与国家科研绩效评价(Scientific I n2 dicat or and Evaluati on of Nati onal Research Perf or m2 ance);6、知识的新产品———科技动力学(Ne w Pr oducti on of Knowledge:Dyna m ics of Science and Technol ogy);7、科学与技术的关系(L inkage be2 t w een Science and Technol ogy)。
在表2中我们列出了每个前沿课题中最早的初始文献及被引频次最高的最有影响的文献,以便追踪每一个前沿领域衍生与发展的知识基础。
表2 科学计量学研究前沿的初始性文献及最有影响力的文献
Tab12 Represen t a ti ve docu m en t a ti on of research fron ts of sc i en tom etr i cs
前沿文献类型代表性文献标题文献作者出版时间被引频次
1初始文献《科学的结构》Structure of Scientific Revoluti on,1962K UHN TS196252最有影响的文献《引文索引》Citati on I ndexing119791G ARF I ELD E197988
2初始文献及最有影
响的文献
《科学论文的网络》Net w orks of Scientific Papers PR I CE DJD196559
3初始文献及最有影
响的文献
《小科学,大科学》L ittle Science,B ig Science119631PR I CE DJD19631
4初始文献及最有影
响的文献
《科学生产力频率分布》The Frequency D istributi on of
Scientific Pr oductivity
LOTK A AJ192668
5初始文献
《作为期刊评价工具的引文分析》Citati on analysis as a t ool in
j ournal evaluati on
G ARF I ELD E197246最有影响的文献
《科学计量学数据文档:96个国家29种期刊所有主要科学
领域的全面指标系统,1981-1985》
Scient ometric data files:A comp rehensive set of indicat ors on29
j ournals of96countries in all maj or science fields and subfields
1981-19851
SCHUBERT A1972
6初始文献及最有影
响的文献
《知识的新产品:当今社会科学研究的动力学》Ne w Pr oducti on
of Knowledge:The Dyna m ics of Science and Research in Conte m2
porary S ocieties
GI B BONS M199430
7初始文献及最有影
响的文献
《美国技术与公共科学之间不断增长的联系》The increasing
linkage bet w een US technol ogy and public science11997
NAR I N F199721
方差贡献率最大的主成分代表最活跃的前沿研究领域,因此对引文分析理论、科学交流与基础研究评价的研究是科学计量学最活跃的、影响力最大的前沿研究领域。从每一个前沿领域所使用的高频词汇中我们发现,主成分1中的引文分析理论与方法几乎被所有其它前沿研究所应用。在主成分1中被引频次最高的、最有影响的文献就是加菲尔德的《引文索引》,著名科学社会学家默
第1期侯海燕,刘则渊等:基于知识图谱的国际科学计量学研究前沿计量分析・167 ・
顿指出,加菲尔德的《引文索引》是科学计量学发
展史上的奠基性大事之一,这部著作为科学计量研究构筑起了结构框架,奠定了理论基础,开辟了应用引文分析理论与方法评估科学活动的科学计量学主流研究方向[7,8]
。对科学交流的研究来源于旧有的社会学传统,主要研究科学交流实践(主要是引证行为)深层次的社会根源,及其社会组织结构的发展,其最早的初始文献就是1962年
出版的库恩的《科学的结构》
(见表2),另外科学社会学与科学知识社会学的开篇之作都成为
科学交流研究所经常引证的核心文献,如默顿的《科学社会学》和拉图尔的《实验室生活》等。基
础研究评价的研究主要应用引文理论对基础研究
中的科学进步进行引文计量。瑞安认为,科学计量学理论研究最关注的一个核心问题是:什么是科技进步?科学家网络以及它的外部特征如出版物和引文实践如何与“进步”的概念相联系?又如何与社会相互影响?这个问题正是前沿课题1所关注的核心。在图2中我们看到,前沿研究领域1在1987年达到最高峰,之后开始逐渐下滑,到了1994年重新开始回升,1998年达到一个小高潮后经过几年的下降,于2004年又大幅度上升
。
图1 科学计量学研究前沿知识图谱,1978-2004
F i g .1 D ocu m en t Co -c it a ti on M ap of sc i en tom etr i cs,1978-2004
影响力居第二位的科学知识图谱与网络计量
学研究起源于普赖斯1965年所著的《科学论文的网络》,这篇文献同时也是对科学知识图谱研究的衍生与发展最有影响的文献,该研究领域于上世纪80年代中期开始趋热,并于2001年达到研究的高峰(见图2)。科学知识图谱研究在发展的过程中,逐渐吸收了图书馆学与情报科学领域中的信息可视化技术手段(I nf or mati on V isualiza 2ti on ),成为以引文分析理论和共词分析方法为支撑的学科结构研究的主流方法。网络计量学兴起于上世纪90年代中后期,1996年,国际上第一篇网络信息计量研究的文献《关于万维网文献的研
究》
(An I nvestigati on of Docu ments fr om the World W ide W eb )发表,首次对网络特征作了计量研究。1997年,丹麦网络计量学家阿尔曼德和英格沃森(T .C .A l m ind,P .I ng wersen )首次提出了“网络计
量学”
(W ebometrics )术语。比利时信息计量学家鲁索1997年在以网络计量学命名的网络期刊Cyber metrics 上首次对网络引文(Sitati on )进行了研究,成为被科学计量学界引证频次最高的网络计量学文献,也引发了对网上信息的相互引证、传递、分布、组织等等一系列的计量研究。
对科技合作的研究(前沿3)起源于普赖斯1963年在《小科学,大科学》中一篇有关无形学院
・科 研 管 理2009年
中科学合作的研究文献,这篇文献同样也是对科技合作研究领域的衍生和发展都起到了关键性作用的文献。继普赖斯之后,美国科学计量学家比沃(Beaver D)在1978至1979年间连续发表了三篇关于科学合作研究的文献,也被从事科学合作研究学者们视作合作研究的开山力作。这之后,合作研究于1985年达到第一次高潮,经过80年代末期的低潮之后,于90年代初开始升温(见图3)。2000年,在柏林创立了基于因特网的对科技合作进行研究的国际组织———COLLNET,并召开了第一届COLLNET会议(The First COLLNET Meeting,1-4,Sep te mber),使得科学合作的研究逐渐走向制度化[9],并于2001年达到了近年来的最高潮。从科技合作领域所使用的频次最高的单词中,我们可以总结出,科技合作研究主要以作者、出版物为研究对象,在国家以及国际水平上研究科学合作的模式,最热门的领域为物理学,而对于技术领域的合作研究只相当于科学领域的十分之一,尚属合作研究中的冷门
。
第1期侯海燕,刘则渊等:基于知识图谱的国际科学计量学研究前沿计量分析・169
・
前沿研究领域4发端于1926年洛特卡的《科学生产力频率分布》,以及其它经典的文献计量学和科学计量学定律及分布规律。20世纪80年代,一些信息科学家在研究范围、方法、模型以及应用等方面都对其进行了扩展,不再仅仅局限于科学文献分布的集中与离散规律、或文献作者的科学生产力分布规律等的研究,而是以信息作为研究的基本数据单元,主要应用数学、统计学等定量的方法来分析信息的动态特性及内在规律,由此产生了信息计量学(I nf or metrics,又译情报计量学)这一新的术语[9]。1987年,信息计量学被国际信息科学(情报科学)界正式承认,因此也掀起了信息计量学研究的第一次热潮,并于1994年达到最高峰(见图2)。
科学计量学指标与国家科研绩效评价(前沿5)起源于1972年加菲尔德的《作为期刊评价工具的引文分析》一文,同样以引文分析理论与方法为基础,但与前沿领域1的引证行为的社会根源研究、领域2的引文网络结构研究不同的是,前沿领域5更加关注出版物的产出及其引文影响,并站在宏观层面上,通过建立一套科学计量学指标系统对不同国家的科研绩效进行评价与比较。对该前沿领域产生深远影响的核心文献《科学计量学数据文档:96个国家29种期刊所有主要科学领域的全面指标系统,1981-1985》的标题正是该领域研究焦点的最恰当的概括。指标与评价研究于1992年达到最高峰,但从1996年开始则呈下降趋势(见图3)[10]。
前沿领域6和7属于20世纪90年代中后期新兴起的应用研究领域(见图3)。知识的新产品———科技动力学研究侧重于知识产品(包括科学与技术)在创新系统中的流动、溢出等活动的研究,科学与技术的关系研究顾名思义侧重于探讨科学与技术分界面上的“突破性事件”(包括科学在新技术发展中所扮演的角色、科学出版物与专利间的相互引证等等),以便更好地理解创新的起源。从高频词的使用情况来看,这两个前沿领域有不少相似之处,比如具有强烈的技术兴趣,对知识活动的偏好以及对大学、、产业三螺旋结构的重视,乃至对于具有社会经济重要性的科学技术领域的关注等等。从这一侧面来看,这两个前沿领域应该能够逐渐交叉、融合,在不久的将来形成规模[11]。
瑞安认为,科学计量学主要属于应用研究领域,但我们的研究结果却显示出理论研究在科学计量学中的影响力超过了应用研究。从主成分分析结果来看,属于理论与方法研究的前沿课题居第一位、第二位和第四位,而属于应用研究的前沿课题仅居第三、五、六和末位。我们又比较了每一个前沿研究领域的总论文数,也就是核心文献及来源文献数量的总和,发现仍旧是理论与方法研究的文献所占比重大(见图4)。引文分析理论、科学知识图谱以及经典分布与信息计量学方面的文献共有971篇,占全部1535篇前沿文献的63126%,而属于应用研究的科技合作、科学计量学指标与国家科研绩效评价、知识的新产品和科学与技术的关系方面的文献总数为5篇,仅占36174%。因此从总体上来看,科学计量学本身应该属于方法研究领域,是探讨科学技术规律、评价、与管理的方法和手段,但它又有其自身的理论问题,必须以理论研究作为坚实的基础,同时又有很强的应用性,并以不断完善的研究方法与手段来推动新的应用研究课题的衍生与发展[12,13]
。
图4 科学计量学前沿研究论文数比重
Fi g.4 Percent age of output of papers of the research fronts
4 结论
通过绘制科学计量学研究前沿知识图谱,我
・170 ・科 研 管 理
2009年
们发现科学计量学的研究前沿集中在7个领域,其中引文分析理论、科学交流与基础研究评价的研究是科学计量学最活跃的、影响力最大的前沿研究领域。经过比较我们发现科学计量学侧重于理论与方法的研究,与瑞安的经验性结论正相反。不过,这七个前沿研究领域却与瑞安所指出的四个科学计量学核心前沿研究领域相契合,我们的研究结论证实了,荷兰科学计量学家凭经验性研究所总结出的四个科学计量学前沿研究领域虽然宏观了一些,但基本上是正确的。
在后续研究中,我们认为在科学计量学领域还有诸多问题值得进一步探讨:诸如在不同的历史时期,科学计量学研究者们所关注的前沿课题有什么不同?科学计量学的主要研究方法与理论模型如何变迁?科学计量学具有怎样的学术核心结构?分支学科之间具有怎样的交叉、渗透和衍生趋势?等等。这些问题有待于科学计量学的研究者们共同努力来完成。
参考文献:
[1] 蒋国华.科学计量学和情报计量学:今天和明天[J ].科学
学和科技管理.1997,18(8):33.
[2] Vanraan AFJ.Scient ometrics:State -of -the -art [J ].Sci 2
ent ometrics,1997,38(1):205-218.
[3] Garfield E .Research fr onts .Corrent contents .
[4] Schubert A.The web of Scient ometrics:A statistical overvie w
of the first 50volumes of the j ournal [J ].Scient ometrics .2002,53:3-20.
[5] B raa m,RR.,Moed,HF .&Van Raan AFJ.Mapp ing of Sci 2
ence by Combined Co -citati on and Word Analysis .Ⅰ.Structural A s pects .JASI S,1991,42(4):233-251.[6] S mall,H.G .&Griffith,B.C .The structure of scientific lit 2
eratures I :I dentifying and graphing s pecialties [J ].Science Studies .1974,4(1):17-40.
[7] 侯海燕.科学计量学知识图谱:五十位最有影响的科学计
量学家[J ].科学学研究,2007,25(3):404-406.
[8] 侯海燕,刘则渊,陈悦,姜春林,尹丽春,庞杰.当代国际科
学学研究热点演进趋势知识图谱[J ].科研管理,2006,27
(3):90-96.
[9] 刘则渊等,科学学理论体系建构的思考:基于科学计量学
的中外科学学进展研究报告[J ].科学学研究,2006,24
(1):1-17.
[10] 栾春娟,陈悦,刘则渊.三螺旋创新模式下的全球学术界
专利竞争[J ].情报杂志.2008(4).
[11] 陈悦,刘则渊.悄然兴起的科学知识图谱[J ].科学学研
究,2005,23(2):149-154.
[12] 尹丽春,姜春林,殷福亮.基于CSCD 和SC I 的跨省区科
学合作网络可视化分析[J ].图书情报工作,2007,8(51):
62-65.
[13] 杨中楷,孙玉涛.基于专利引用的国家技术力量指标比
较[J ].科学学与科学技术管理,2005(10):11-14.
Quan tit a ti ve ana lysis on the research fron t of
i n terna ti ona l sc i en to m etr i cs ba sed on mapp i n g of knowledge
Hou Haiyan,L iu Zeyuan,Luan Chunjuan
(W I SE LAB,Da li a n Un i versity of Technology,Da li a n 116023,Ch i n a)
Abstract:U sing mapp ing of science and infor mati on visualizati on,69most cited papers in the internati onal j ournals of scient o 2metrics during 1978-2004are analyzed .The docu ment co -citati on map identifies seven core research fr onts:citati on theory,science communicati on,basic research assess ment;mapp ing of science,webometrics;collaborati on in science and technol ogy;scient ometric distributi on,bibli ometric la w,infor metrics;scientific indicat or and evaluati on of nati onal research perfor mance;ne w p r oducti on of knowledge -dyna m ics of science and technol ogy;linkage bet w een science and technol ogy .Key words:scient ometrics;research fr ont;mapp ing of science;co -word analysis;co -citati on analysis
