科学探索|PNAS发文:“同质化”论文暴增从根本上阻碍了科学的进步( 二 )


6)具有足够影响力的论文,出现的可能性降低 。
至于为什么会出现这种现象,作者认为在理论上可能存在两方面因素,一是大量的新论文可能会剥夺专家和学者充分认识和理解一个新想法所需的时间和认知程度 。二是过多新想法之间的竞争也可能会妨碍学者们发现或者将注意力集中在一个更有前景的idea上 。
随着每年各学科领域科研成果数量的持续增长,这种影响会只增不减,且不可避免,除非采取政策措施重组科学生产的价值链,使大众的注意力集中在有前途的、新颖的想法上 。

实验证明及分析
总结来看,在大多数学科领域中,高引用量的经典论文一直持续占据主导地位,这导致新论文的引用几率较低,并随着时间的推移淹没在了海量论文库中 。此外,从内容上来讲,最新发表的论文更倾向于扩展现有理论,而不是进行底层创新,很少有打破常规的新观点被提出 。以下是241门细分学科和9000万篇论文的实证结论:
一、在大多数学科中,引用最多的论文获得了更高的引用份额 。
如图1(A),引用次数最多的论文在最大研究领域的基尼系数为0.5,相当于贫富差距最大的两个国家的系数水平——只有中国和南非的基尼系数高于0.5 。重要的是,论文引用份额的严重失衡,导致研究方向出现明显的“马太效应” 。
科学探索|PNAS发文:“同质化”论文暴增从根本上阻碍了科学的进步
文章图片


图1:不同学科论文引用量的动态变化过程
左图(A)表明,当某个领域发表的论文越多,被引用最多的论文在新引用中所占比例就会越大;右图(B)表明,当某个领域发表的论文越多,高引用论文的排名就越稳定 。
如电气和电子工程领域,如果每年有10000篇论文出版,前0.1%的论文获得1.5%的引用概率,前1%的论文获得8.6%的引用;如果发表50000篇论文,前0.1%的论文获得3.5%的引用,前1%的论文获得11.9%的引用;如果发表10万篇论文,前0.1%的论文获得5.7%的引用,前1%的论文获得16.7%的引文 。相比之下,随着每年论文发表量的增多,50%低引用论文在新引用中所占份额明显下降,从每年10000篇论文 43.7%的引用次数占比,下降到每年50000篇和100000篇论文占比仅稍稍高于20% 。
二、在范围更大的学科领域,论文发表数量越多,引用最多的论文在高引排名中的波动越小 。
如图1(B)所示,在引用最多的前50篇论文中,论文发表的本年和下一年之间在排名上存在明显的相关性 。而在随后的几年,如果预测前50名引用最多的论文的斯皮尔曼等级系数,该系数从一年1000篇论文的0.25,增加到了一年100000篇论文的0.74 。这是因为当研究范围较大时,引用最多的论文每年都会保持其引用次数,而其他所有论文的引用次数都会减少 。
科学探索|PNAS发文:“同质化”论文暴增从根本上阻碍了科学的进步
文章图片


图2:引用衰减率
图(A)表明尽管有大量新论文发表,引用最多的论文平均每年保持在高引用前列;图(B-C)表明除引用最多的论文外,所有论文在该研究领域的引用次数均逐年减少 。图(D)表明在所有学科领域,只有引用最多的论文每年保持高引用水平,其他所有论文平均每年的引用量都较少 。
上图显示了在不同引用份额上论文本年与上一年引用的预测比率 。可以看出,在论文发表量少的年份,引用最多的论文比例明显低于1,与引用较少的论文没有太大区别 。然而,当论文发表量增加时,引用最多的论文比例接近1,明显超过引用量较少的论文 。如果某领域一年发表100000篇新论文,引用最多的论文平均每年收到的引用数量不会出现明显下降,但在年度引用最多的论文中,排名前1%的论文每年平均会损失约17%的引用次数,而排名前5%及以下的论文会损失四分之一的引用次数 。