Essential Science Indicators 常见问题

基本科学指标数据库以何种类型数据为特色?

答:基本科学指标数据库的特色数据类型包括高被引科学家排序、机构(大学、公司和政府研究机构)排序、国家和期刊的排序,排序分为单个和所有领域。还有可供检索的“高被引论文”以及被称作“热门论文”的专门论文集。基本科学指标数据库的另一个独特之处是提供被称为“研究前沿”的专业领域列表,其通过算法得出的主题反映当前深入研究和有突破性的科学领域。每个科学领域的篇均被引频次基线以及被引频次百分位点均列表显示。简要的编辑讨论对数据分析和理解提供了指导,并提高了产品中统计表,统计图和其他数据集的适读性。一种称作“特殊话题”的编辑特色点评是对某些选择的研究领域给予的特殊关注。

什么类型的文献被纳入统计范围?

答:这类文献定义为常规科研论文,综述型论文,汇编资料和研究札记。而致编者信,改正通知及摘要不算在内。只有被Thomson Scientific索引的杂志文章或论文才纳入计数。

什么是被引频次的界值?

答:设置被引频次的界值用来在每个领域中按大致相同的比例入选实体。对于科学家而言,在每个领域中的前1%的姓名入选,按照这一比例,每个学科领域可以诠释出特定的被引截止频次。对于机构这个比例也是1%,但是对于国家和杂志是50%。高被引论文的入选的是在某一领域和年份的前1%,而热门论文入选的是当前两个月时间内某一领域的前0.1%。

什么是基线?

答:基线是大的论文组中每篇论文累积被引频次的度量,它为特定领域和年份的论文组提供了期望的被引频次。由于被引频次是高度倾斜的,许多论文并非频繁被引,相对地,高被引论文也占极少部分,因此,平均被引频次不能认为代表分布的集中趋势,而只能作为指标或标准。同样地,百分位数或其他的固定百分率法能显示出特定引用分布顶端部分的被引频次。因此,基线提供的是相对平均数而百分位数提供的是相对构成比。

高被引论文和热门论文是如何入选的?

答:高被引论文和热点论文是根据特定领域和特定时间段的百分位数的排位选择的。高被引论文在近10年的数据中选出,而热门论文是指在相当近期(近2年里)论文且当前时期显示出异乎寻常被引频次。高被引论文和热门论文均可通过各种特征属性进行检索。

论文是如何排序的?

答:论文根据总被引频次,期刊名称和出版年份排序。

科学家、机构、国家和期刊是如何排序的?

答:科学家、机构、国家和期刊根据总被引频次、论文总数、篇均被引频次和姓名的字母顺序排序。

用什么标准确定高被引论文?

答:由于被引频次因领域的不同而不同,以及较老的文献被引次数要多于近期论文,因此,高被引论文入选程序考虑了这些因素。首先是计算不同被引频次水平论文的数量,找出每个领域和年份的被引频次以及构成分布。然后根据这些分布入选各领域/年份中论文的相同比例选定入选的界值。

什么是热门论文?

答:热门论文是指与同领域和同时期出版的论文相比,在出版后很快就得到较高引用的论文。热门论文入选的条件是出版时间不超过2年,而且是在当前两个月内被引。根据以上条件,最后每个领域前0.1%的论文得以入选。

用什么标准确定热门论文?

答:如果一篇论文在达到其领域和近两个月内的被引频次界值就被选作热门论文。在编制出各个领域和时间组的被引频次分布后,选择在各领域和时间段论文被引计数最稠密的顶端小部分选定界值,而这一小部分定为抽取论文的前0.1%。

百分位数这个词的含义是什么?

答:百分位数这个词表示一个被引频次的界值,当论文以被引计数的降序排列时,在这一界值或高于这一界值,论文固定部分开始下降。百分位数在此用于指出按照被引频次排序的顶级论文的固定部分。我们根据领域和年份选定列出的百分位数水平有0.01%、0.1%、1.0%、10%、20.00%和50.00%(50.00%相应于被引频次的中位数值)。

什么是研究前沿?

答:研究前沿是在专门主题中通过聚类分析确定的被称作核心论文的一组高被引论文。聚类分析以论文之间相互引证或共引的次数为标准聚类。由于研究前沿的论文不是根据基本科学指标数据库中期刊种类或论文中出现的词汇分类,而纯粹是基于引用模式,因此,它为高被引论文提供了另一种分类方式。

包含什么期刊?

答:计数基于一个分为22大领域的期刊集。按照期刊的唯一归类来定义这些领域,即一种期刊不可能归入一个以上的领域。包含多学科领域的期刊诸如《科学》和《自然》,它们中单独的文章在经过对其引文和参考文献的特殊分析后将会归入22大类中的一个。

期刊分类中的22大领域是哪些?

答:期刊分类中的22大领域是:农业科学、生物学与生物化学、化学、临床医学、计算机科学、经济学与商贸学、工程学、环境/生态学、地球科学、免疫学、材料科学、数学、微生物学、分子生物学与遗传学、综合交叉学科、神经科学和行为学、药理学与毒理学、物理学、植物学与动物学、心理学/精神病学、社会科学以及空间科学。

机构的计数如何确定?

答:机构的计数基于作者所发表的论文中给出的所属机构。如果论文中至少有一位作者的地址是某机构的,那么论文就可以划归给该机构。无论第一作者与否,所有作者地址均考虑在内。如果在一篇论文中一个机构名称多次出现,那么在确定论文和被引计数上仅算作一次。论文中所有独立的机构都占有同等的权重,以及该论文接受的所有引用都会被记入在每一所机构的被引论文中。除了记录仅限于汤姆森科技标引过的期刊外,编制被引计数时在所引条目上不受限制。

计数(被引频次、论文、论文篇均被引频次)的时间段为多长?

答:计数的时间段为10年,外加当前年度的月份(数据每两个月更新)。这意味着,在这任何在这10+年时间段内的论文可被同时间段的任何记录所引用。时间段是以数据库年份(文献进入数据库的实际年份,与出版年份略微不同)界定的。在达后11年的时间后,计数文件返回到10年加2个月的时间段上,以便于下一次2月更新。

平均被引频次是如何确定的?

答:基于论文出版年到当前的累加被引频次,计算10年里每一年的平均被引频次。平均值等于单篇论文被引频次之和除以论文总数。

什么是机构名称重合?

答:机构名称重合现象是指当有机构同名时,一个名称可能代表一个以上的机构。在不同的地理位置上存在着相似命名的机构是可能的。对于这样的机构察看高被引论文来揭示是否包括不同地理位置同名的机构。

采用什么对论文及被引频次的计数方法来确定国家/地区计数?

答:国家的计数基于所发表的论文中给出的机构的隶属国家。如果论文中至少有一个地址是某国家/地区的,那么论文就可以划归给该国家/地区。无论地址的排位如何,所有地址均考虑在内。如果在一篇论文中一个国家/地区名称多次出现,那么该论文对于该国家/地区只能做一次计数。论文中所有独立的国家/地区都占有同等的权重,以及该论文接受的所有引用都会被记入在所有国家/地区的被引论文中。除了记录仅限于Thomson Scientific标引过的期刊外,编制被引计数时在所引条目上不受限制。

如何处理国家名称变更和统一?

答:国家名称的统一是国家/地区名称或疆界变化反映。例如,西德和东德统一成德国已经十年。英国已被当作一个国家/地区来对待,而不以英格兰、苏格兰、威尔士和北爱尔兰单独记录。

如何处理排名连接?

答:国家、机构、作者和期刊排名的连接是按各自名称的字顺原则排列的。

我如何计算一个作者、国家、研究机构或期刊的篇均被引频的相对值?

答:排名中给出的篇均被引频次可与世界平均水平比较得出相对值,方法是把它除以在基线部分里平均被引频次表中的“所有年”的平均值。比率大于1,表示篇均被引次数高于其所在领域的世界平均水平。

如何判断论文接受的引用数是否高于其领域及年份的期望值,或者处在哪个百分位点上?

答:一篇论文在某一特定研究领域和年份的被引总数可与基线里的平均被引频次比较。如果被引数大于该领域和年份内的平均值,那么它就超过了期望值。被引水平也可由该领域和年份的百分位点表中最相近的百分数来校准。可用的百分点水平有0.01%、0.1%、1.0%、10.00%、20.00%和50.00%(50.00%相应于被引频次的中位数值)。此百分数值即表示该领域和年份内引用次数大于或等于该百分数的论文所占的分数。

为什么我的论文没有在基本科学指标数据库中?

答:没有在基本科学指标数据库中的原因可能有很多。可以从两方面来考虑:论文排名和科学家排名。论文排名: 1. 只有研究论文和综述才会被基本科学指标数据库收录,您的文章是否属于不同的类型? 2. 基本科学指标数据库的时段是依据出版年份划分的,即论文进入Web of Science 核心合集的年份。发表年头或年尾的论文,在Web of Science 核心合集处理后的年份都将可能与论文上呈现的出版年份不同。这将会对该论文是否符合其出版年限造成影响。 3. 该论文的领域和年度是什么?进入Web of Science 核心合集主页的InCites站点,在左边的导航栏下拉至期刊列表,找到期刊名称以确定您的论文所属的领域。 4. 该领域和年份的论文前1%的阈值是多少?在基本科学指标数据库的首页中,进入引文分析-基线。点击“查看百分位点表”,然后查阅该领域。科学家排名:科学家的排名是根据特定领域中该科学家论文的总被引频次。进入Web of Science 核心合集主页的InCites站点,左边的导航栏下拉至期刊列表,找到期刊名称以确定您的论文所属的领域。如果这些论文分布在1个以上的领域,那么您某个领域的被引频次就会低于总体被引频次,并可能因此导致您不能出现在前1%当中。