Web of Science™核心合集遴选标准

1.背景

Web of Science™是一个基于Web而构建的动态的数字研究环境,通过强大的检索技术和基于内容的连接能力,将高质量的信息资源、独特的信息分析工具和专业的信息管理软件无缝地整合在一起,兼具知识的检索、提取、分析、评价、管理与发表等多项功能,从而加速科学发现与创新的进程。在内容上,Web of Science™以Web of Science™核心合集(著名的三大引文索引Science Citation Index Expanded®, Social Science Citation Index®, Arts & Humanities Citation Index®)为核心,凭藉独特的引文检索机制和强大的交叉检索功能,有效地整合了学术期刊(Web of Science™核心合集)、技术专利(Derwent Innovations Index)、化学反应(Chemistry)、研究基金(eSearch)、 Internet资源(Current Web Contents)、学术分析与评价工具(Essential Science Indicators)、学术社区(HighlyCited.com)及其它重要的学术信息资源,提供了自然科学、工程技术、生物医学、社会科学、艺术与人文等多个领域中高质量、可信赖的学术信息,从而大大扩展和加深了单个信息资源所能提供的学术研究信息. Web of Science™平台上所有数据库中的信息都是经过精心挑选的,它只收录那些对研究者有用的出版物、网站内容和其它学术资源。

这些学术信息是由许多不同的媒介以不同的格式提供的。这些媒介形式包括期刊(印刷版或电子版)、书籍和会议录、网站内容,以及ISI外部的数据库。Web of Science™的编辑内容是多学科的,涵盖自然科学、社会科学以及艺术与人文领域的所有学科。现在可获得的学术信息的数量超乎你的想象。因此,2002年编辑发展部采用的筛选程序会比以前更有价值。   

2.选择程序

本文主要向大家介绍编辑发展部的筛选程序, 其中要特别详细地介绍有关为Web of Science™核心合集(包括Science Citation Index Expanded, Social Sciences Index, Arts & Humanities Citation Index)、Current  Contents筛选期刊、为Proceedings(包括ISTP/ISSHP)筛选会议录和为Current Web Contents 筛选网站内容的程序。

2.1期刊选择程序

首先介绍一下期刊选择的总的程序。 Eugene Garfield博士认为期刊的覆盖面实际是一个经济学的实例。对一个无用的文献条目的索引与一个有用的文献条目的索引成本是一样的。这样,对每个覆盖面的讨论就转换为商业的讨论。一个性价比高的索引必须严格限制它的收录范围,尽可能地只收录那些可能对用户有用的信息。基于这种理解, Garfield 博士着手建立了编辑发展部沿用至今的期刊选择程序。

选择程序包括4个主要方面,即考查期刊出版标准、编辑内容、国际多样性和引文分析。

不能说这4个方面孰重孰轻。对期刊的每一项评价都有它的作用,每个考察因子都有它的侧重面。

2.1.1  出版标准

对一本期刊我们首先看它的基本出版标准。这包括时效性、编辑惯例、英文文献编目信息和同行评议过程等方面。

时效性   Current Contents®是一个现刊题录数据库,从中我们可找到最新的信息, 从而可以尽量避免收录那些发表旧的或过时的信息的期刊。对一个期刊来说,能按照它固定的出版周期准时出版是很重要的。即使是在全球享有盛誉的期刊如Nature Neuroscience, 或 Molecular Cell, 也必须按时出版。通过了筛选过程并开始被收录就表明这个出版物符合我们的选刊标准,而且能按时出版。任何一个产品有一个共同的收录原则: 我们在完成评价前必须能按时收到三期期刊。这个原则没有例外。

国际编辑惯例  数据库索引一个文章的目的是希望帮助读者通过检索能找到它。基于这一原则,一些编辑惯例是必需的。这些包括能反映一定信息的期刊名称,描述性的论文标题,每个作者的完整的地址信息,及所有参考文献(引文)的完整的文献编目信息。这些很简单,但可以使文章容易被找到。

英文文献编目信息   因为数据库是英文的数据库,而且英文是当今在学术交流中使用最广泛的语言,因此我们更多地关注那些至少有英文文献编目信息的期刊。在此必须提及这样一种情况,即有一些以英文出版的期刊有时会出现一篇文章,其文献编目信息是以其它语言发表的,这样就需要翻译标题和关键词。ISI每年需翻译所收录的出版物中的50000多条条款。这是一项花费很大的工作,因此我们正努力控制我们翻译的工作量。翻译部门能处理所有的欧洲语言。至今我们还没有翻译过亚洲语言。因此我们对亚洲国家做了许多特别的努力,包括中国和韩国,以使越来越多的期刊有完全翻译的标题和关键词,以及音译的作者名和地址。我们也直接与这些国家的编辑和出版商联系,使文献的参考文献部分也被翻译或音译。

同行评议过程  我们希望所有的学术期刊都能把同行评议作为编辑发行过程的一个部分。通过同行评议过程可以保证期刊中论文的质量。它也能保证参考文献的完整性。

2.1.2编辑内容

我们需要仔细考察一个期刊的编辑内容,以确定它在一个或多个ISI数据库中的位置。科学研究持续发展,新的专业领域不断涌现,促使新的边缘学科的期刊出版发行。编辑人员就需要确定这本期刊是否能使数据库的内容更加丰富,或者这个研究课题已有多个期刊涉及。

2.1.3 国际多样性

我们在论文水平上考察期刊,看其作者是否来自世界各地。我们也注重期刊编辑和编委会的国际多样性。在过去40年里应用这一原则,数据库在期刊水平,以及多学科的领域范围都具有完全国际性。

地域性期刊

无论如何,为了全面地反映全球范围内科学研究和发展情况,并在每个学科范畴有较平衡的收录,也力求收录最优秀的地域性期刊。当评估一本地域性期刊而不是国际性期刊时,尽量比较它与同地区的其它期刊的内容。如果这个区域还没有同类期刊被收录,那么我们可以认为有必要收录这个地区的这本期刊。

2.1.4  引文分析

通过所建立的引文数据库,编辑会得到许多引文数据。这些数据有助于确定对研究团体最重要、最有用和最有影响力的出版物。我们通过对引文数据的分析衡量它的应用,通过衡量它的应用确定它的重要性和影响力。

引文数据在期刊评价中的基本作用对评价新的期刊(也就是第1卷)和已有的期刊(即发行了数年的期刊)有所不同。

当评价第1卷时,它没有引文的历史。这时我们可以用ISI的引文数据确定这本期刊中的主要的作者或编委会的成员以前发表在其它期刊上的论文是否有被引用的记录, 以确定:

这本期刊是否能吸引那些论文被证明有用、且经常被研究社团引用 的作者?这些作者本身是否对某个特定的研究领域有影响力?
对已有的期刊我们用引文数据计算影响因子。  

影响因子是一本期刊最近发表的论文在某一年收到引文次数的平均数。例如2000年Nature Genetics的影响因子是30.910。这表明这本期刊在过去两年发表的论文在2000年平均收到30条引文。

在此给大家介绍一下Nature Genetics的影响因子的计算。

在2000年里,共引用了1998和1999年发表的文章12, 766 次,1998年和1999年共发表了413篇论文。用引文数12, 766除以413,得到它的影响因子为 30.910. 

引文分析总是有上下文关系的,这意味着影响因子或被引频次只有在与编辑内容相似的期刊相比时才有意义。Nature Genetics 是属于 ‘Genetics & Heredity’ 目录下的。在2000年,Journal Citation Reports®  中在这个目录下共有111种期刊,它们的影响因子从 Nature Genetics 的 30.910 到 Human Genome News 的 0.076。 

在这个目录中影响因子较低的部分我们看到一些地域性期刊,如德国的Silvae Genetica,Korean Journal of Genetics, 和意大利的Caryologia。

2.1.5中文期刊的收录

截止到2002年6月,目前在Web of Science™总共收录了73种中国出版的期刊,其中66种是被Science Citation Index Expanded收录的。在这66种期刊中, 14 种是被Science Citation Index 光盘版收录的。在Social Sciences Citation Index®中有3种中文期刊, Arts & Humanities Citation Index® 中有4种中文期刊。

除了这些中文期刊的收录,Web of Science™中还有许多中国的研究人员发表的文章。这些文章发表在各国的期刊上,作者地址表明是中国研究者的论文。在 1981–2001年间ISI数据库中有来自中国的230,700 多篇论文。

从1981至1985这个区间开始,纵观日本5年发表论文的数量,我们可以看到有一个数量的激增。在中国1981至 1985年,有14, 500 篇中国论文被收录,在1997 至2001年间,ISI收录了115,200 篇中国论文。

必须再次提及这些论文至少有英文的文献编目信息(如标题、摘要和关键词)和音译的作者姓名。

2.2  会议录选择程序

下面介绍Proceedingssm中会议录的收集。会议录主要有两种来源,即发表在期刊上的会议文献和发表在书籍上的会议文献。

众所周知发表以书籍形式发表的会议录是自然科学,尤其是工程学领域进行学术交流的主要工具。但在发展迅速的生物医学领域,会议录主要以登载在期刊上的形式出版。 例如在生命科学领域,信息的即时发布非常重要,而期刊就是最好的出版媒介。

2.2.1  以期刊形式出版的会议录

以期刊形式出版的会议录文献是从Web of Science™收录的8,900多种期刊中精选出来的。作为索引过程的一个组成部分,期刊中的每篇论文都按文献类型分类。如果一篇论文实际上是在会议上交流的,那么它就会按会议文献编码,并自动以完整的会议文献形式被Proceedings 收录。发表会议录的期刊的收录标准与上面所提到的相同。

…以书籍出版的会议录的获得和挑选是根据一套特别的方针。会议录的获得非常重要,因此我们先看一下这个程序。 

2.2.2  以书籍形式出版的会议录的获得

出版社关系部通过各种工具和来源获得以书籍形式出版的会议录,包括: 

学术出版机构  一般直接与主要的出版商和专业的团体联系。通过这些渠道该部门获得有关会议录出版和即将召开会议的信息。这些出版商和团体会提供出版的会议录,当这些会议录被收录时,会通知这些团体。

关注会议通知和期刊文献  会关注期刊和其它信息资源如网站、讨论表和定期出版物中有关已出版的会议录或将召开的会议的信息。

引文分析   编辑用的引文数据定位—获得和评价—已有一些引文数据的会议录。

除了这些方法,还对其它数据库中的会议文献的收录进行评价,以保证我们对会议文献的了解尽可能全面。

2.2.3以书籍形式出版的会议录的评价

编辑发展部根据一套现有的标准评价我们收到的会议录。这些标准包括: 

基本编辑标准  编辑对每本会议录进行考察以确定它遵守基本的编辑标准,如顺序的页码、时效性、国际编辑惯例和关键词等。

内容  一个出版物的总体质量可从参考文献的完整性上进行评估。另外,编辑还会考评它的内容以保证它能丰富收录的学科或子学科或丰富收录的地域性,或者它能使我们收录的享有声望的学术社团或组织的会议录保持完整。例如在过去的10年收录American Psychological Association召开的每一个年会。 

版权和会议日期  为保证Proceedings 的即时性,出版的会议录必须在一定的时间段内收录。会议必须是目前或近四年内召开的,并有一个科技会议的名称。但在Arts & Humanities 中这个限制会放松一点。所有的会议日期必须注明以保证会议录是第一版出版,以前没有被索引过。我们认为这个政策很合适,不过对有关Mediaeval Philosophy的会议录比Neuroscientists会议录的时间限制要宽松。 

会议名称和地点  区分会议文献与其它出版物的一个关键因素是会议文献首先在会议中交流。因此会议文献必须包含会议的地点和会议名称才能被Proceedings 收录。

所有有全文的会议文献  Proceedings 列出了所有有全文的会议文献的书目信息。这样收录的会议录包含所有有全文的会议文献。那些只有会议摘要、概要或报告的会议录目前是不在收录之列的。 

Web of Science™平台提供一个统一的环境从而使研究者可以无缝检索和连接到各种信息资源中。除了传统的出版媒体(如期刊和会议录),还将收录范围延伸到只能在互联网上找到的研究导向的资料。

挑选最好的最有用的学术网站内容是一个新的挑战。这类信息资源在很多方面与期刊和会议录不同,而且最初只供专业的研究者作用。衡量它们的有用性需要发展一个全新的评价方法,但它们的最终目的相同,也就是节省研究者的时间,使他们能迅速找到最好的最相关的学术内容。

我们现在来看一下对挑选的网站内容的评估。

2.3  网站内容挑选过程

评价和选择学术性的、研究导向的网站内容需要发展一套专门的评价标准,和一个专为电子的网络环境定制的评选过程。用于期刊和会议录的评价指标,如同行评议、引文数据和出版标准对电子的、非连接的出版环境是不适用的。

网络上的学术资源需要人力和技术的共同贡献。Current Web Contents的发展保证了有一个编辑队伍用最新的计算机设备和软件展开检索。编辑们不仅是一个学科的专家,而且对在线媒体的技术部分也很精通。

2.3.1  编辑政策的定义和应用

编辑收录了每个网站的广泛详细的元数据以用于评估。这个纯粹的信息数据可由一些评价标准补充。这些评价标准包括以下因子:
• 权威性
• 准确性
• 及时性
• 导航系统和页面设计
• 内容和实用性
• 范围
• 面对的读者群的水平
• 文字水平

所有这些因子都很重要,尤其是 作者或网站主办机构的权威性。我在这里花一点时间来介绍ISI的编辑是如何实现这一点的。

2.3.2  如何建立权威性?

Current Web Contents的一个重要价值是其内容可信,具有权威性。为实现这一点,编辑必须考察网站的主办者的学术地位
•  如果是个人站点,编辑需确定这个站点的主人是否具有站点相关领域的高级学位。站点主人在相关领域有博士学位的网站通常被收录。
•  如果是一个组织、机构或社会团体主办的网站,编辑需确定这个社团具有良好的声誉。编辑还需考虑组织机构已存在的时间和机构的大小,它是否是一个学术团体,及它的学术出版物。
•  当网站由政府机构或有声望的研究机构主办时,它的权威性是显而易见的。
•  当评估一个商业性的网站时,它必须不具有任何偏见才能有权威性。

2.3.3  Current Web Contents中的网站

这些原则的应用使得收录了上千种多学科的著名的网站内容。世界领先的学术、合作和管理研究机构主办了这些网站。这些网站分布在Current Contents的所有版本和学科中。

有些网站与Current Contents Connect®的两个或多个版本相关,或与一个版本中的多个学科相关。例如, 疾病控制和预防中心的网站(the Center for Disease Control and Prevention site)覆盖广泛的领域,从生物医学研究到公共健康。 因此,它在Current Contents Connect 中的临床医学、生命科学和农业生物学和环境科学,及社会和行为科学等版本中都有收录。

Current Contents Connect七个版本中网站的分布与目前期刊文献的学科分布格局类似,即生命科学占主导地位。工程计算与技术( Engineering Computing & Technology)网站也不计其数。生命科学和工程网站几乎分别占了22%。临床医学占所有网站的 17%,农业生物学和环境科学、社会科学各占13%,物理化学和地球科学占7%,艺术与人文占6%。

Current Contents eSearchTM中编辑使用的一些元数据是可以检索的。元数据包括网站的描述、或摘要,是由编辑在彻底评估了整个网站内撰写的。这个数据还包括ISI关键词、作者、出版商、语言、文献类型(如参考书目、数据库、图像文件等)、文件格式(如 HTML, JPEG, JavaScript 等)和提供者的类型(如学术机构、政府部门等)。

2.3.4 可得到的全文文献

通过仔细的评估和分类过程,可以为研究社团提供与其研究最相关的网站内容。这些条款可能在网站水平或在网站的文献水平。

在 Current Contents eSearch的发行中,为用户提供与网站中150,000 个数字文件的连接。ISI 的编辑核查了每篇文献的文献类型和编辑内容等项目。这引起文件主要包括以下三大类:
•  预印本
•  基金信息
•  研究活动。  研究活动包括会议录、会议摘要、技术报告、学位论文、操作指南和医学条款等 

每个文献被完全索引。检索得到的结果按类型分类。检索结果可按类型过滤,并且可通过检索结果中的某个条目连接全文。

另外,编辑发现在一些网站以两种或多种格式提供文献。这避免重复收录,编辑会只与其中的一个版本连接, PDF是首选格式。

我们也花了很大精力将一个单独的文件与其来源联系起来。一个网站如MHN: Mental Help Net包含基金信息,这些信息最初是从其它的网站如NIH, NIHM和Alzheimer’s Association Web sites来的。会从原始来源找到这些文件,而不会从二级来源中找到这些文件。这个方法避免了有关基金实际来源的模糊性。

2.3.5  网站示例

下面是Current Web Contents收录的一个权威网站。 通过使用Current Contents Connect中的检索引擎eSearch 不同的文件能正确地分类,从而可以在这些享有盛誉的网站中找到它们:

Resource Type Parent URL Title
Funding http://www.aas.org American Astronomical Society
Funding http://www.cancer.org American Cancer Society
Funding http://www.cdc.gov Centers for Disease Control and Prevention
     
Resource Type Parent URL Title
Preprints http://www.cis.upenn.edu/~alur/
onlinepub.html
Computer and Information
Science - Online Publications
(University of Pennsylvania)
Preprints http://www.lns.cornell.edu/public/
CLNS/CLNS.html
Cornell Laboratory of Nuclear
Studies Reports Index
Preprints http://graphics.lcs.mit.edu/
publications.html
MIT Computer Graphics Group Publications
     
Resource Type Parent URL Title
Research Activities http://touch.caltech.edu Caltech Micromachining Lab
Research Activities http://www.cma.ca Canadian Medical Association
Research Activities http://www.cdc.gov/ Centers for Disease Control and Prevention


2.3.6  Current Web Content中的中国网站

下面是Current Web Contents中收录的优秀的中国网站的例子。GAB Agent Databases网是一个每月更新的复合的数据库和研究界面,提供与关 GABA 受体的数据。提供的信息类型包括DNA序列、蛋白序列、三维药物结构、发表的文献、实验室、研究人员、和其它的网站。这个网站也提供研究实例以及预订的e-distribution信息。它与Hong Kong University of Science and Technology 的联合奠定了它的权威性。

Hong Kong Polytechnic University Department of Applied Mathematics 网站提供该系的信息、教职员工、计划、学术研究以及研究会和会议计划,并与相关信息连接。研究部分提供1999年至今的预印本的全文连接,主要是以后记形式(PostScript)。该网站由Hong Kong Polytechnic University Department of Applied Mathematics 主办,奠定了它的学术权威性。

始终致力于为研究者和学者提供最好的、有用的文献资料。在编辑专家和最新技术的共同作用下,会秉承一贯传统,努力去评估、分类和索引最好的学术网站和其中的内容。 专业人员的介入得到了高质量的易管理的结果,这在期刊和会议录的选择中已得到证实。专业人士的介入在过滤和筛选网站资源时更加重要。

3.结语

希望通过本文的介绍能让大家对Web of Science™有一个广泛深入的了解。我们保证会经过精心的挑选带给您世界上最好的学术资源。我们将学术资源与最新的技术结合起来,从而使您找到最全面的信息。我们已经利用现有的技术实现了与精心挑选的网站内容的全文连接。我们会继续挑选和过滤材料,以提供当前的或回溯的高质量学术信息。

如何提交会议录文集被Conference Proceedings Citation Index(即:ISI Proceedings,以前称为:ISTP)收录?

如果只有纸本形式出版的会议录,请将会议录文集邮寄到以下地址:
Publication Processing
Thomson Reuters
1500 Spring Garden Street
Fourth Floor
Philadelphia, PA 19130
USA

如果是在线形式出版的(XML,PDF,或相结合的形式)请将可以直接访问的信息发送到ts.proceedings@thomson.com。这个email地址也可以作为您希望推荐收录某个会议录文集的联系方式。

如果希望知道我们的收录过程,请您访问如下连接:
http://isiwebofknowledge.com/products_tools/multidisciplinary/webofscience/cpci/cpciessay/

其它参考信息:
Web of Science™核心合集选刊过程
Web of Science™平台上信息资源的收集 (详细介绍)
http://www.thomsonscientific.com.cn/publishing/journalselectionstandard/

(关于会议录收录,具体请查看: 2.2 会议录选择程序。)
想要具体了解汤森路透科技集团选刊遴选过程
http://thomsonreuters.com/products_services/science/free/essays/journal_selection_process/