关于COVID-19的科学出版物的“泛滥”

在现代信息社会中,任何也影响公民安全与健康的重要社会过程都伴随着大量虚假信息。参与过程的参与者越多,主题领域越复杂,操纵和错误信息传播的空间就越大。这种错误信息可能比造成威胁的事件更加危险。



今天有关COVID-19疾病的信息占主导地位,并伴随着许多虚假信息。在这方面,需要可靠的信息,该信息具有一定的技巧,可以从经过同行评审的科学期刊中获得。

许多电子科学图书馆和期刊(例如国家免疫和呼吸疾病中心,JAMA网络,Elsevier)在其网站上组织了SARS-CoV-2冠状病毒出版物的特殊部分。但是,每天有超过10篇关于该主题的科学文章发表。了解这种信息流并不容易。如果自2003年以来18年以来引用次数最多的冠状病毒出版物已经吸引了3400多个来源(根据Google Scholar),那么尽管有此文章发表,但已有900多个来源引用了武汉市2019年新型冠状病毒感染患者的临床特征文章。就在一个月前!这种情况可以称为关于COVID-19的科学文章的“大流行”。

让我们尝试构建出版物流程,并确定其中有趣的模式。由于在医学领域缺乏专门知识,本文仅介绍文献计量分析的结果,而没有尝试在病毒学背景下解释所揭示的事实。

不明飞行物护理分钟


大流行的COVID-19是由SARS-CoV-2冠状病毒(2019-nCoV)引起的潜在的严重急性呼吸道感染,已在全球正式宣布。关于Habré的很多信息都涉及此主题-始终记住,它既可靠又有用,反之亦然。

我们敦促您不要批评任何已发布的信息。


官方资料

, .

洗手,照顾亲人,尽可能呆在家里并远程工作。

阅读有关以下内容的出版物:冠状病毒 | 远程工作

源数据的特征


原始数据是2020年3月20日使用Google Scholar搜索引擎收集的10,000多种学术出版物的信息。不幸的是,由于主要的俄罗斯文献计量系统eLibrary具有防止数据收集的强大保护系统,因此在该搜索系统中很少有国内出版物被索引。

总共对以下关键字进行了三个搜索查询:“ COVID-19”“冠状病毒”“ SARS-CoV-2”(图1)。

图。1-通过关键字搜索科学出版物的结果

在科学出版物中,比SARS-CoV-2病毒的名称更常使用COVID-19疾病。根据Google学术搜索,有关冠状病毒以及相关主题的文章和书籍总数超过15万。收集的出版物的年度统计数据如图2

所示。 2-按年份分配出版物的收集信息

在图中可以看到两个峰值,分别是2003年和2012年。这些峰值对应于两次冠状病毒感染的爆发:SARS-CoV(严重急性呼吸道综合症,称为SARS)和MERS-CoV(中东呼吸综合症)。尽管事实上出版物的信息收集都集中在较新的出版物上,但是由于COVID-19大流行的当前状况,很难不注意到科学活动的增加。在有关此主题的最受欢迎文章的引用动态中也可以观察到这种趋势。出版一种新型冠状病毒的患者的严重急性呼吸综合征鉴定有关的冠状病毒自2003年以来的18年,根据谷歌学术,吸引了超过3400名的来源。在本出版物中武汉市在短短一个月内感染了2019年新型冠状病毒的患者的临床特征,而新的冠状病毒已被900多次引用!这种情况被称为有关COVID-19的科学文章的“大流行”,因为它已经影响了全世界的科学家。对如此大量出版物的研究需要使用特殊的分析方法,本文将对此进行演示。

关于“冠状病毒”主题的科学出版物地图


使用地图以图形形式进行分析似乎方便而直观。有关科学出版物的其他信息可通过考虑引用之间的主题联系来获得。根据收集的数据,构建引文图,为方便起见,将其核心描述为热图(图3)。

图。 3-关于“冠状病毒”主题的科学出版物地图

如图3.A所示,该地图形成一个语义空间,其中每个部分都有特定的主题重点。出版物的接近程度决定了它们的主题相似性。主题地点的相互安排取决于相关研究主题之间的联系。那些。地图的两个区域彼此之间越近,它们在研究主题上的相似性就越高。

在地图上(图3.A),可以观察到两个大型星团。位于图左侧(图3.A的6-11区)的星团包含研究冠状病毒在COVID-19出现之前进行的研究结果。这可以通过搜索查询“ COVID-19”(图3.B)和“冠状病毒(2020年以后)”(图3.B)。请求“ SARS-CoV-2”(图4.E)找到的出版物同时出现在左侧和右侧(图3.A的第3区)。

除了群集主题外,重要的是要了解群集的发布时间。图4显示了主题为“冠状病毒”的科学论文和书籍的编年顺序,其中出版年份以彩色表示。


图。4-冠状病毒科学出版物出现的时间顺序说明

最早的出版物位于地图的左上角,即2020年的出版物-在右侧的单独分组中。

有关年代的信息使我们能够追踪区域与主题发展之间的因果关系。

专题集群概述


让我们更详细地考虑构造图的主要区域(图5)。


图。 5-主题为“冠状病毒”的科学出版物地图,上面标有主题领域

,主要出版物专门研究病毒。它的上部包括较早的出版物,其中更多地关注了病毒的蛋白质结构的研究。该地区的下部集中了对特定冠状病毒的研究结果,包括SARS(2003)和MERS(2012)。

在2002年底和2003年初,出现了一种疾病,在媒体上被称为“非典型肺炎”。该病毒在亚洲传播。一直以来,有8000多例感染病例被记录下来,其中有800多例是致命的。出版物的高峰(与之前提到的有关)与这种疾病有关,出版物本身紧凑地位于SARS地区(图5)。

MERS-CoV区域包括与2012年中东呼吸综合症相关的出版物,该出版物在23个国家/地区发行,包括沙特阿拉伯,也门,阿拉伯联合酋长国,法国,德国,意大利。

地图左侧的三个孤立的簇(3区,第8区,图3.A)涉及对动物(猫,狗和牛)中病毒的研究。

地图的右侧包含有关COVID-19及其对社会的影响的出版物。COVID-19簇具有复杂的结构,由与研究病毒本身及其传播模型相关的主题部分组成。还有一个单独的出版物领域,涉及通过放射学方法揭示疾病的特殊性。

在地图左右两部分之间,有大约20种出版物的“桥梁”(图3.A,2区的3区和4区)。这些出版物都有引文链接,而相关出版物则以大致相等的比例位于相对的集群中。在这些出版物中,有关于疫苗开发,病毒起源的鉴定以及其传播预后的主题,同时考虑了对类似感染的现有数据的分析。

构造的地图使您可以直观地看到冠状病毒不同研究主题之间的“自然”关系,并且可以用作直观和可视化的工具来分析作者团队,科学期刊和其他研究对象的主题重点。以下部分将演示此功能。

作者活动分析


对于正在考虑的出版物,确定了3000多位作者,其中50位(出版物数量最多)显示在图表中(图6)。


图。 6-50个关于“冠状病毒”主题的最多发表者,

在确定作者统计信息时,仅使用姓氏和名字缩写。这种方法有几个缺点,因为一方面,由于同一姓氏在其母语和英语中的拼写差异,可以将同一个人视为不同的人。另一方面,如果两个不同的作者具有相同的姓氏和名字缩写,则可以将它们记录为一个人(这个问题对于中国作家尤为重要,因为他们都是有关COVID-19的主题)。因此,作者及其出版物的实际数量将与所提供的统计数据有所不同。

考虑最活跃的作者的主题重点。图7显示了7个最新发表的作者的个性化主题地图。使用以前发布的有关“冠状病毒”主题的科学出版物地图制作个人地图。


图。 7 –七种最流行的冠状病毒作者的个人主题卡是香港大学微生物学系的成员Patrick Cy Woo

教授Susanna Kar Pui Lau教授。作者拥有超过100种出版物(其中至少40种与冠状病毒研究有关)。它们具有相当高的Hirsch指数,但是到目前为止,还没有关于COVID-19主题的出版物被记录下来。

由于李姓的盛行,Y Li档案中可以同时代表几个人:Yun Li(Yun Li,密歇根大学教授或多伦多大学教授),Lei Yuan(Lei Yuan,武汉大学员工)。因此,分析此配置文件的发布活动没有意义。类似的考虑适用于W LiChen JY Yang的个人资料Ziad A.Memish

博士)目前是沙特阿拉伯卫生部(沙特阿拉伯卫生部)穆罕默德·本·阿卜杜勒·阿齐兹亲王医院的传染病高级顾问和研究部门负责人。他还是Alfaisal大学(沙特阿拉伯利雅得)医学院的教授,以及全球卫生系的副教授。休伯特(美国乔治亚州埃默里大学罗林斯公共卫生学院)。

Ziad Memish被专家社区认可为对抗疾病感染的专家。国际传染病学会执行委员会成员。他获得了许多不同的奖项,在国际会议上发表了大量的科学出版物和报告,并且是两种期刊(《流行病学杂志》和《全球卫生》)的主编。他有关冠状病毒的大部分出版物都位于3区的第6区(图3.A),其中包括有关中东呼吸系统疾病的出版物。他们的出版时间是在疾病传播期间。此时,Ziad Memish担任沙特阿拉伯卫生部副部长。

在齐亚德·梅米什(Ziad Memish)地图上,关于COVID-19的问题,有四本出版物专门致力于诊断和应对病毒的大规模传播。

因此,作为对个人活动的分析的结果,可以确定的是,2020年出版物的增长属于中国作家,由于文献计量分析中姓氏和缩写的普遍存在,他们可能被误认为同一个人。具有国际权威的研究人员在发布有关冠状病毒及其相关疾病COVID-19的信息上表现出中等活动。

发布者活动分析


许多信息资源(包括Habr)可以在其网站上更方便地访问有关COVID-19的信息,这些信息在组织的特殊部分中聚集了相关信息。简化对经过验证的信息的访问是防止虚假信息传播的好方法,这可能导致负面后果。科学出版商也使用这种方法。同时,有必要注意确保此类组织发布的信息的可靠性和质量的额外责任。通过发布未经充分验证的信息,出版商将冒着分散或误导科学家进行研究的风险,这可能导致抗冠状病毒的效力下降。

随着科学文章审阅工作量的增加,研究出版者在讨论中的主题方面的活动似乎很有趣。为此,图8显示了科学文章在相应来源中的位置统计,对于这些来源,还显示了发现的冠状病毒出版物总数的比较估计值以及有关COVID-19主题的出版物数目。


图。 8-统计的杂志和文献计量平台的出版物数量(浅蓝色表示有关“冠状病毒”主题的出版物的总数,深蓝色表示有关COVID-19主题的出版物的数量。)

应注意,有关COVID主题的出版物比例很大-19组成所谓的预印本文章,即在正式发表之前在同行评审的科学杂志上发表的文章(此类文章可从medrxiv.org和arxiv.org获得)。一方面,预印本的放置使科学家能够比其他科学家更早地宣布自己在获得科学结果方面的优势,另一方面,可以纠正在文章正式发表之前可以发现的错误。由于数据将公开提供,因此减少了将其知识产权结果用于商业用途的可能性。大量有关该主题的文章的预印本也就不足为奇了,因为由于其相关性,研究人员希望尽早发布研究结果,而不必等待官方科学出版商规定的审查程序完成。另一个有趣的功能是,尽管存在与冠状病毒相关的其他主题的文章,但仍未提供有关COVID-19主题的出版物的资源。此功能将在下面更详细地讨论。

我们使用构造后的地图来分析科学期刊,就像使用它来分析作者的活动一样。图9显示了已审阅的期刊和电子图书馆的主题图。


图。 9-发布有关冠状病毒主题

ScienceDirect(sciencedirect.com)的信息的科学期刊和电子图书馆的专题图。由世界最大的出版社之一爱思唯尔(Elsevier)实施的获取科学期刊的系统(还管理科学出版物Scopus的数据库)。该系统提供对2600多种科学期刊的出版物的访问(收费和免费)。对这个出版社的批评主要是针对科学活动的过度商业化。

ScienceDirect代表14%属于所收集数据核心内容的出版物。涵盖了冠状病毒的所有主题(图9.A),发布动态与一般统计相对应。按比例突出显示了有关2003年冠状病毒和2012年中东呼吸系统疾病的主题。与病毒的临床研究主题相比,以较小的体积介绍了COVID-19疾病传播的建模和机制主题。

病毒学杂志(jvi.asm.org)。病毒学杂志是一本经过同行评审的杂志,自1967年以来一直发表。目前,文章每两周以电子方式发布。该杂志涵盖了有关病毒性质的研究结果,报告了新发现,并指出了研究的新方向。最初的研究文章涵盖了动物,古细菌,细菌,真菌,植物和原生动物的病毒。在正在研究的关键问题中,包括病毒结构的分析,病毒基因组的复制,病毒的进化,病毒与细胞的相互作用等

。专题图(图9.B)表明,该期刊几乎涵盖了有关冠状病毒的所有主题,其中包括:除了COVID-19。关于该主题仅收集了一份出版物(武汉市新型冠状病毒对受体的识别:基于SARS冠状病毒十年长期结构研究的分析()。其中,使用术语2019-nCoV代替术语COVID-19,根据该术语,在发布者的网站上手动发现了2个与主题COVID-19相关的出版物。尽管其他病毒感染的报道范围很广,但出版物数量如此之少(与其他出版商相比),可能是由于编辑政策,较高的要求以及对所发表材料的仔细审查(该网站表明编辑接受的平均响应时间为27天,做出肯定的决定与发布之间的时间为11天)。

比较本期刊和所考虑的ScienceDirect系统中出版物的时间顺序也很有趣。这些来源在覆盖范围和大约属于所收集数据核心的出版物数量方面都有相似之处。同时,ScienceDirect中关于2003年和2012年病毒感染暴发的出版物的动态情况看起来相似,而《病毒学杂志》的活动却在减弱。这可能是由于对冠状病毒主题或发布资源的兴趣减少,以及针对性的编辑政策(例如,对研究技术的科学新颖性的额外要求)所致。

国家生物技术信息中心(ncbi.nlm.nih.gov)。美国国家生物技术信息中心成立于1988年,以处理和存储分子生物学数据。 NCBI维护着一个蛋白质域,DNA,(GenBank)和RNA,医学和生物学科学文章(PubMed)以及物种分类学(TaxBrowser)的数据库。

该资源包含核心中所收集出版物的4%多一点。几乎所有出版物的发布时间都晚于2003年(图9.B),因此,该资源实际上并未显示在主题地图的顶部。同样在此资源中,与宠物病毒有关的主题覆盖率较低。 COVID-19科学文章主要位于相应群的中心部分,致力于病毒的临床研究以及对其传播的预测。

SpringerLink(link.springer.com)。 Springer出版社的科学期刊访问系统,专门从事自然科学领域的工作。多年来,在SpringerLink中以“冠状病毒”为主题的出版物发行量与Elsevier相当,但数量较小(约为3倍,图9.G)。在出版物统计中的特征中,可以注意到许多始于1995年的出版物,这些出版物主要揭示了动物(包括家畜)冠状病毒的研究结果。有关COVID-19的出版物的主要方向是临床研究和后果模型。

medRxiv(medrxiv.org)。一个免费的在线资源,用于发布医疗领域的完整但未发布的文章和专着(预印本)。该来源目前出版了有关COVID-19主题的最多出版物(图8、9.E)。在有关冠状病毒的其他主题的出版物中未注明该来源。

Wiley在线图书馆(onlinelibrary.wiley.com)。 Wiley科学期刊访问系统类似于Elsevier和Springer。威利(Wiley)精选了5,000多篇与COVID-19相关的公开研究文章。关于COVID-19的大多数出版物都涉及SARS-CoV-2结构的研究结果。

牛津大学出版社(academic.oup.com)。资料来源在人文,社会科学,法学,科学和医学领域的300多种期刊中发表文章,其中三分之二与科学和专业组织合作发表。
牛津大学出版社关于冠状病毒的出版物主要针对特定​​人类冠状病毒的研究。关于COVID-19,收集了16种出版物,其主要目的是研究SARS-CoV-2病毒传播的起源和机制。

大自然(nature.com)它是自然科学领域最古老,最受尊敬的科学期刊之一,每月拥有超过一百万的读者。对于该期刊(图9.I),可以注意到2016年冠状病毒出版物的“激增”。这些统计数据与其他考虑的来源不同。今年,主要发表了关于冠状病毒结构的研究结果(例如,SARS和MERS:对新兴冠状病毒的最新见解)。由于该期刊的信誉,出版物的引文评级相当高。

所有考虑到的资源都有便捷的搜索引擎,可用于及时识别冠状病毒的相关研究结果。

关于SARS-CoV-2起源的出版物的研究


使用开发的地图来研究有关冠状病毒的话题也很有趣,这些话题引起了争议和科学讨论。其中之一是有关冠状病毒人工起源的版本与工程蝙蝠病毒相关的出版物,引发了关于风险研究的争论。由于缺少引文链接,因此在数据收集过程中找不到该出版物,因为其评级较低(这是一种奇怪的情况,因为它是由著名的出版商Nature出版的)。两页的文章中提及该出版物。没有可靠的证据支持SARS-CoV-2实验室工程的主张,它声称没有足够证据证明SARS-CoV-2病毒是人为来源的(图10)。


图。10-与SARS-CoV-2起源有关的主题的精选出版物

在这方面,在前面提到的文章《武汉的新型冠状病毒对受体的识别:基于SARS十年结构的长期分析的分析》中发表的研究结果特别受关注。病毒学杂志冠状病毒。但是,由于缺乏基因工程领域的专门知识,因此无法进行进一步的分析。

发现


总结本次审查,有必要指出及时获取科学研究成果以应对错误信息的重要性。但是,过多的已发布信息以及该主题的科学复杂性降低了这种应对措施的有效性。大量已发表的结果增加了验证结果正确性的读者和审阅者的负担。这种情况不仅是诸如冠状病毒大流行这样的罕见事件的特征,也是整个科学行业的特征。分析需要新的信息处理方法,本文演示了其中一种。

从收集到的科学出版物中获得的,已更正为核心的信息可能对专家有用,因此,它们作为单独的表格显示xlsx文件

PS在评论中,很高兴听到专家对《病毒学杂志》的编辑政策以及SARS-CoV-2人工版本的可靠性的意见。

All Articles