"Pandemia" de publicaciones científicas sobre COVID-19

En la sociedad de la información moderna, cualquier proceso socialmente importante que también afecte la seguridad y la salud de los ciudadanos va acompañado de una corriente de información falsa. Cuantos más participantes en el proceso y más complejo sea el área temática, mayor será el espacio para la manipulación y la difusión de información errónea. Tal información errónea puede ser más peligrosa que la ocurrencia que creó la amenaza.



La información sobre la enfermedad COVID-19 hoy domina a cualquier otra y se acompaña de mucha información falsa. En este sentido, existe la necesidad de información confiable, que con cierta habilidad se puede obtener de revistas científicas revisadas por pares.

Muchas bibliotecas y revistas científicas electrónicas (como el Centro Nacional de Inmunización y Enfermedades Respiratorias, JAMA Network, Elsevier) han organizado secciones especiales de publicaciones de coronavirus SARS-CoV-2 en sus sitios web. Sin embargo, se publican más de 10 artículos científicos por día sobre este tema. Comprender este flujo de información no es fácil. Si la publicación de coronavirus más citada desde 2003 durante 18 años ha atraído más de 3400 fuentes (según Google Scholar), entonces el artículo Características clínicas de pacientes infectados con el nuevo coronavirus 2019 en Wuhan ya ha sido citado por más de 900 fuentes, a pesar de que este artículo fue publicado solo hace un mes! Esta situación se puede llamar una "pandemia" de artículos científicos sobre COVID-19.

Intentemos estructurar el flujo de publicaciones e identificar patrones interesantes en él. Debido a la falta de conocimiento especial en el campo de la medicina, este artículo presenta solo los resultados de un análisis bibliométrico, sin intentar interpretar los hechos revelados en el contexto de la virología.

Minuto de atención ovni


La pandemia COVID-19, una infección respiratoria aguda potencialmente grave causada por el coronavirus SARS-CoV-2 (2019-nCoV), se ha anunciado oficialmente en el mundo. Hay mucha información sobre Habré sobre este tema; recuerde siempre que puede ser confiable / útil, y viceversa.

Le instamos a que sea crítico con cualquier información publicada.


Fuentes oficiales

, .

Lávese las manos, cuide a sus seres queridos, quédese en casa siempre que sea posible y trabaje de forma remota.

Leer publicaciones sobre: coronavirus | trabajo remoto

Características de los datos fuente.


Los datos de origen fueron información sobre más de 10,000 publicaciones académicas recopiladas el 20 de marzo de 2020 utilizando el motor de búsqueda Google Scholar. Desafortunadamente, pocas publicaciones nacionales están indexadas en este sistema de búsqueda debido al hecho de que el principal sistema bibliométrico ruso eLibrary tiene un fuerte sistema de protección contra la recopilación de datos.

En total, se realizaron tres consultas de búsqueda para las siguientes palabras clave: "COVID-19" , "coronavirus" y "SARS-CoV-2" (Figura 1).

Higo. 1 - Resultados de búsqueda de publicaciones científicas por palabras clave

El nombre de la enfermedad COVID-19 se usa con más frecuencia en publicaciones científicas que el nombre del virus SARS-CoV-2. Total de artículos y libros sobre coronavirus, así como temas relacionados, según Google Scholar más de 150 mil. Las estadísticas anuales de las publicaciones recopiladas se muestran en la Figura 2.

Fig. 2 - Distribución de información recopilada en publicaciones por año

Se pueden observar dos picos en el diagrama, en referencia a 2003 y 2012. Estos picos corresponden a dos brotes de infecciones por coronavirus: SARS-CoV (síndrome respiratorio agudo severo, conocido como SARS) y MERS-CoV (síndrome respiratorio del Medio Oriente). A pesar de que la recopilación de información sobre publicaciones se centró en las más nuevas, es difícil no notar un salto en la actividad científica debido a la situación actual con la pandemia de COVID-19. Esta tendencia también se puede observar en la dinámica de citas de los artículos más populares sobre este tema. La publicación Identificación de un nuevo coronavirus en pacientes con síndrome respiratorio agudo severo sobre coronavirus desde 2003 durante 18 años, según Google Scholar, atrajo a más de 3400 fuentes. En esta publicación¡Las características clínicas de los pacientes infectados con el nuevo coronavirus 2019 en Wuhan sobre un nuevo coronavirus en solo un mes ya tienen más de 900 citas! Esta situación se denomina "pandemia" de artículos científicos sobre COVID-19, ya que ha afectado a científicos de todo el mundo. El estudio de un volumen de publicaciones tan elevado requiere el uso de métodos de análisis especiales, que se demostrarán en este artículo.

Mapa de publicaciones científicas sobre el tema "Coronavirus"


El análisis en forma gráfica usando mapas parece conveniente e intuitivo. Se puede obtener información adicional sobre publicaciones científicas considerando el vínculo temático entre ellas, como se refleja en la cita. Sobre la base de los datos recopilados, se construyó un gráfico de citas, cuyo núcleo se representa por conveniencia como un mapa de calor (Figura 3).

Higo. 3 - Mapa de publicaciones científicas sobre el tema "Coronavirus"

Presentado en la Figura 3.A, el mapa forma un espacio semántico en el que cada sección tiene un enfoque temático específico. La proximidad de la publicación determina su similitud temática. La disposición mutua de los sitios temáticos está determinada por los enlaces entre los temas de investigación relevantes. Aquellos. cuanto más cercanas están las dos áreas del mapa, más similares son entre sí en el tema de la investigación.

En el mapa (Figura 3.A), se pueden observar dos grandes grupos. El grupo ubicado en el lado izquierdo del mapa (sectores 6-11, Figura 3.A) contiene los resultados de los estudios de coronavirus realizados antes del advenimiento de COVID-19. Esto se evidencia por la distribución del número de publicaciones encontradas por las consultas de búsqueda "COVID-19" (Figura 3.B) y"Coronavirus (después de 2020)" (Figura 3.B). Las publicaciones encontradas por la solicitud "SARS-CoV-2" (Figura 4.E) están presentes tanto en los grupos izquierdo como derecho (sector 3, Figura 3.A).

Además del tema de los grupos, es importante entender a qué hora se publicaron sus publicaciones. La Figura 4 muestra la cronología de la colocación de artículos científicos y libros sobre el tema "Coronavirus", donde el año de publicación se indica en color.


Higo. 4 - Ilustración de la cronología de la aparición de publicaciones científicas sobre coronavirus.

Las primeras publicaciones se encuentran en la esquina superior izquierda del mapa, publicaciones para 2020, en un grupo separado a la derecha.

La información sobre la cronología nos permite rastrear las relaciones causa-efecto entre las regiones y el desarrollo de temas.

Resumen del clúster temático


Consideremos con más detalle las áreas principales del mapa construido (Figura 5).


Higo. 5 - Mapa de publicaciones científicas sobre el tema "Coronavirus" con las áreas temáticas marcadas en él. Las

publicaciones del grupo principal están dedicadas al estudio de los virus. Su parte superior incluye publicaciones anteriores, en las que se presta más atención al estudio de la estructura proteica de los virus. En la parte baja de la región se concentran los resultados de estudios de coronavirus específicos, incluidos el SARS (2003) y el MERS (2012).

A finales de 2002 y principios de 2003, apareció una enfermedad, que se llamó la "neumonía atípica" en los medios de comunicación. El virus se propagó en Asia. Durante todo el tiempo, se notaron más de 8000 casos de infección, más de 800 de ellos fueron mortales. El pico de publicaciones, que se observó anteriormente, está asociado con esta enfermedad, y las publicaciones mismas están ubicadas de manera compacta en el área del SARS (Figura 5).

El área MERS-CoV incluye publicaciones relacionadas con el Síndrome Respiratorio del Medio Oriente 2012, que se distribuyó en 23 países, incluidos Arabia Saudita, Yemen, Emiratos Árabes Unidos, Francia, Alemania e Italia.

Tres grupos aislados en el lado izquierdo del mapa (zona 3, sector 8, Figura 3.A) se relacionan con el estudio de virus en animales (gatos, perros y ganado).

El lado derecho del mapa contiene publicaciones sobre COVID-19 y sus consecuencias para la sociedad. El clúster COVID-19 tiene una estructura compleja y consta de secciones temáticas relacionadas tanto con el estudio del virus como con el modelo de su propagación. También hay un área separada de publicaciones relacionadas con las peculiaridades de revelar una enfermedad por métodos de radiología.

Entre los dos grandes grupos de las partes izquierda y derecha del mapa hay un "puente" de aproximadamente 20 publicaciones (sectores 3 y 4 de la zona 2, Figura 3.A). Estas publicaciones tienen enlaces para citas, y las publicaciones relacionadas se encuentran en grupos opuestos en proporciones aproximadamente iguales. Entre estas publicaciones se encuentran temas sobre el desarrollo de una vacuna, sobre la identificación del origen del virus, así como sobre el pronóstico de su propagación, teniendo en cuenta el análisis de los datos disponibles sobre infecciones similares.

El mapa construido le permite ver visualmente la relación "natural" entre los diferentes temas de investigación de los coronavirus y puede usarse como una herramienta visual e intuitiva para analizar el enfoque temático de los equipos de autores, revistas científicas y otros objetos de investigación. Esta característica se demostrará en las siguientes secciones.

Análisis de la actividad de los autores.


Para las publicaciones bajo consideración, se identificaron más de 3000 autores, 50 de ellos (con el mayor número de publicaciones) se presentan en el diagrama (Figura 6).


Higo. 6 - 50 autores más publicados sobre el tema "Coronavirus".

Al determinar las estadísticas sobre los autores, solo se utilizaron sus apellidos e iniciales. Este enfoque tiene varias desventajas, ya que, por un lado, las mismas personas pueden considerarse diferentes debido a las diferencias en la ortografía de los apellidos en sus idiomas nativo e inglés. Por otro lado, se pueden registrar dos autores diferentes como una sola persona si tienen los mismos apellidos e iniciales (este problema es especialmente relevante para los autores chinos, que son los principales en el tema sobre COVID-19). Por esta razón, el número real de autores y sus publicaciones diferirán de las estadísticas proporcionadas.

Considere el enfoque temático de los autores más activos. La Figura 7 muestra mapas temáticos personalizados de los 7 autores más publicados. Los mapas personales se construyeron utilizando el mapa publicado previamente de publicaciones científicas sobre el tema "Coronavirus".


Higo. 7 –Tarjetas temáticas personales para los siete autores de Coronavirus más publicados Los

profesores Patrick Cy Woo y Susanna Kar Pui Lau son miembros del Departamento de Microbiología de la Universidad de Hong Kong. Los autores tienen más de 100 publicaciones (de las cuales al menos 40 están relacionadas con el estudio de los coronavirus). Tienen índices de Hirsch bastante altos, pero hasta ahora no se han registrado publicaciones sobre el tema COVID-19.

Debido a la prevalencia del apellido Lee, varias personas pueden ser representadas bajo el perfil de Y Li a la vez: Yun Li (Yun Li, profesor de la Universidad de Michigan o profesor de la Universidad de Toronto), Lei Yuan (Lei Yuan, empleado de la Universidad de Wuhan) y otros. Por este motivo, no tiene sentido analizar la actividad de las publicaciones de este perfil. Consideraciones similares se aplican a los perfiles de W Li , J Chen e Y Yang .

Dr. Ziad A. Memish) es actualmente un consultor sénior sobre enfermedades infecciosas y el jefe del departamento de investigación del Hospital Prince Mohammed bin Abdel Aziz en Riad (Ministerio de Salud de Arabia Saudita). También es profesor en la Facultad de Medicina de la Universidad Alfaisal (Riad, Arabia Saudita) y profesor asociado en el Departamento de Salud Global. Hubert (Rollins School of Public Health, Emory University, Georgia, EE. UU.).

Ziad Memish es reconocido por la comunidad de expertos como especialista en la lucha contra las infecciones de enfermedades. Miembro de la Junta Ejecutiva de la Sociedad Internacional de Enfermedades Infecciosas. Tiene muchos premios diferentes, una gran lista de publicaciones científicas e informes en conferencias internacionales, es el editor jefe de dos revistas (Journal of Epidemiology and Global Health). La mayoría de sus publicaciones sobre coronavirus se encuentran en el sector 6 de la zona 3 (Figura 3.A), que incluye publicaciones sobre la enfermedad respiratoria de Oriente Medio. Su tiempo de publicación es para el período de propagación de la enfermedad. En este punto, Ziad Memish se desempeñó como Viceministro de Salud de Arabia Saudita.

Sobre el tema de COVID-19 en el mapa de Ziad Memish, hay cuatro publicaciones dedicadas al diagnóstico y la lucha contra la propagación masiva del virus.

Por lo tanto, como resultado del análisis de la actividad personal, se puede establecer que el aumento en las publicaciones de 2020 se refiere a autores chinos, quienes, debido a la prevalencia de apellidos e iniciales durante el análisis bibliométrico, pueden confundirse con las mismas personas. Investigadores con autoridad internacional han mostrado una actividad moderada en relación con la publicación de información sobre el coronavirus y su enfermedad asociada COVID-19.

Análisis de la actividad editorial.


Muchos recursos de información (incluido Habr) para un acceso más conveniente a la información sobre COVID-19 en sus sitios web organizaron secciones especiales donde se agrega información relevante. Simplificar el acceso a la información verificada es una buena forma de combatir la difusión de información falsa, lo que puede tener consecuencias negativas. Los editores científicos también usan este enfoque. Al mismo tiempo, es necesario tener en cuenta la responsabilidad adicional de garantizar la fiabilidad y la calidad de la información publicada por dichas organizaciones. Al publicar información insuficientemente verificada, los editores corren el riesgo de distraer o engañar a los científicos que realizan investigaciones, lo que puede conducir a una disminución en la efectividad de la lucha contra los coronavirus.

En relación con el aumento del volumen de trabajo en la revisión de artículos científicos, parece interesante estudiar la actividad de los editores en relación con el tema en discusión. Para hacer esto, la Figura 8 muestra estadísticas sobre la ubicación de artículos científicos en la fuente correspondiente, y para las fuentes, también se muestran estimaciones comparativas del número total de publicaciones de coronavirus encontradas y el número de publicaciones sobre el tema COVID-19.


Higo. 8 - Estadísticas sobre el número de publicaciones recopiladas para revistas y plataformas bibliométricas (el azul claro indica el número total de publicaciones recopiladas sobre el tema "Coronavirus", el azul oscuro indica el número de publicaciones sobre el tema COVID-19)

Cabe señalar que una gran proporción de publicaciones sobre el tema COVID -19 componen las llamadas preimpresionesartículos, es decir artículos publicados antes de su publicación oficial en una revista científica revisada por pares (dichos artículos están disponibles en medrxiv.org y arxiv.org). Por un lado, la colocación de preimpresiones permite a los científicos declarar su superioridad en la obtención de resultados científicos antes que otros, y por otro, corregir las imprecisiones que pueden identificarse antes de que el artículo se publique oficialmente. Esto reduce la posibilidad de uso comercial de los resultados de su propiedad intelectual, ya que los datos estarán disponibles públicamente. No es sorprendente una gran cantidad de preimpresiones de artículos sobre el tema, ya que debido a su relevancia, los investigadores buscan publicar los resultados de su investigación lo antes posible, sin esperar la finalización de los procedimientos de revisión previstos por los editores científicos oficiales.Otra característica interesante es la disponibilidad de fuentes que no tienen publicaciones sobre el tema COVID-19, a pesar de la disponibilidad de artículos sobre otros temas relacionados con los coronavirus. Esta característica se discutirá con más detalle a continuación.

Utilizamos el mapa construido para el análisis de revistas científicas de la misma manera que lo usamos para analizar la actividad de los autores. La Figura 9 muestra los mapas temáticos de las revistas revisadas y las bibliotecas electrónicas.


Higo. 9 - Mapas temáticos de revistas científicas y bibliotecas electrónicas que publican información sobre el tema de Coronavirus

ScienceDirect (sciencedirect.com) . El sistema de acceso a revistas científicas, implementado por una de las editoriales más grandes del mundo, Elsevier (que también administra la base de datos de publicaciones científicas Scopus). El sistema proporciona acceso (de pago y gratuito) a publicaciones de más de 2600 revistas científicas. La crítica de esta editorial está dirigida principalmente a la comercialización excesiva de la actividad científica.

ScienceDirect representa el 14% de las publicaciones que se encuentran en el núcleo de los datos recopilados. Todos los temas cubiertos en coronavirus están cubiertos (Figura 9.A), y la dinámica de publicación corresponde a estadísticas generales. Los temas sobre el coronavirus de 2003 y la enfermedad respiratoria del Medio Oriente de 2012 se destacan de manera proporcional. El tema del modelado y los mecanismos de propagación de la enfermedad COVID-19 se presenta en un volumen menor en comparación con el tema de los estudios clínicos del virus.

Revista de Virología (jvi.asm.org). Journal of Virology es una revista revisada por pares y se ha publicado desde 1967. Actualmente, los artículos se publican electrónicamente cada dos semanas. La revista cubre los resultados de estudios sobre la naturaleza de los virus, informes sobre nuevos descubrimientos y señala nuevas direcciones en la investigación. Los artículos originales de investigación cubren virus de animales, arqueas, bacterias, hongos, plantas y protozoos. Entre los problemas clave que se están investigando: el análisis de la estructura de los virus, la replicación del genoma viral, la evolución de los virus, la interacción de virus y células, etc.

El mapa temático (Figura 9.B) muestra que en esta revista se cubren prácticamente todos los temas sobre coronavirus, por a excepción de COVID-19. Solo se recopiló una publicación sobre este tema (Reconocimiento del receptor por el nuevo coronavirus de Wuhan: un análisis basado en estudios estructurales de una década de duración del coronavirus del SARS ). En él, en lugar del término COVID-19, se usa 2019-nCoV, según el cual se descubrieron manualmente 2 publicaciones más relacionadas con el tema COVID-19 en el sitio web del editor. Una cantidad tan pequeña de publicaciones (en comparación con otras editoriales), a pesar de la amplia cobertura de otras infecciones virales, probablemente se deba a la política editorial, los altos requisitos y la revisión cuidadosa de los materiales publicados (el sitio web indica que el tiempo promedio de respuesta del editor para la aceptación es de 27 días, el tiempo entre una decisión positiva y la publicación es de 11 días).

También es interesante comparar la cronología de la publicación en esta revista y en el sistema ScienceDirect considerado. Estas fuentes tienen similitudes tanto en la cobertura como en el número aproximado de publicaciones que se encuentran en el núcleo de los datos recopilados. Al mismo tiempo, la dinámica de las publicaciones en ScienceDirect para brotes de infecciones virales en 2003 y 2012 es similar, mientras que para Journal of Virology, la actividad se está desvaneciendo. Esto puede deberse tanto a una disminución del interés en temas de coronavirus o recursos de publicación, como a políticas editoriales específicas (por ejemplo, requisitos adicionales para la novedad científica de la tecnología de investigación).

El Centro Nacional de Información Biotecnológica (ncbi.nlm.nih.gov). El Centro Nacional de Información Biotecnológica de EE. UU. Se estableció en 1988 para procesar y almacenar datos de biología molecular. El NCBI mantiene una base de datos de dominios de proteínas, ADN, (GenBank) y ARN, artículos científicos médicos y biológicos (PubMed) y taxonomía de especies (TaxBrowser).

Esta fuente contiene un poco más del 4% de las publicaciones recopiladas en el núcleo. Casi todas las publicaciones se publicaron después de 2003 (Figura 9.B), por lo que esta fuente prácticamente no se presenta en la parte superior del mapa temático. También en esta fuente hay poca cobertura de temas relacionados con virus de mascotas. Los artículos científicos de COVID-19 se encuentran principalmente en la parte central del grupo correspondiente y están dedicados a estudios clínicos del virus, así como a la predicción de su propagación.

SpringerLink (link.springer.com) . Sistema de acceso para revistas científicas de Springer Publishing House, especializado en trabajos en ciencias naturales. La distribución de publicaciones sobre el tema "Coronavirus" y a lo largo de los años en SpringerLink es comparable a la de Elsevier, pero en un volumen menor (aproximadamente 3 veces, Figura 9.G). Entre las características en las estadísticas de publicaciones se puede observar una gran cantidad de publicaciones que datan de 1995, que revelan principalmente los resultados de estudios de coronavirus en animales (incluidos los domésticos). Las principales direcciones de las publicaciones sobre COVID-19 son estudios clínicos y modelos de consecuencias.

medRxiv (medrxiv.org). Un recurso en línea gratuito para publicar artículos y monografías (preimpresiones) completas pero no publicadas en el campo de la atención médica. El mayor número de publicaciones sobre el tema de COVID-19 es publicado actualmente por esta misma fuente (Figuras 8, 9.E). Esta fuente no se ha observado en publicaciones sobre otros temas sobre coronavirus.

Biblioteca en línea de Wiley (onlinelibrary.wiley.com) . Sistema de acceso a la revista científica Wiley similar a Elsevier y Springer. Wiley compiló una selección de más de 5,000 artículos de investigación abiertos relacionados con COVID-19. La mayoría de las publicaciones sobre COVID-19 se relacionan con los resultados de estudios de la estructura del SARS-CoV-2.

Oxford University Press (academic.oup.com). La fuente publica artículos de más de 300 revistas en humanidades, ciencias sociales, jurisprudencia, ciencia y medicina, dos tercios de los cuales se publican en colaboración con organizaciones científicas y profesionales.
Las publicaciones de Oxford University Press sobre Coronavirus están dirigidas principalmente al estudio de coronavirus humanos específicos. Con respecto a COVID-19, se recolectaron 16 publicaciones, cuyo objetivo principal es estudiar el origen y los mecanismos de propagación del virus SARS-CoV-2.

Naturaleza (nature.com). Es una de las revistas científicas más antiguas y respetadas en el campo de las ciencias naturales, tiene más de un millón de lectores por mes. Para esta revista (Figura 9.I), se puede observar un "aumento" en las publicaciones sobre coronavirus para 2016. Estas estadísticas difieren de otras fuentes consideradas. Este año, se publicaron principalmente los resultados de estudios sobre la estructura de los coronavirus (por ejemplo, SARS y MERS: percepciones recientes sobre los coronavirus emergentes ). Las publicaciones tienen una calificación de citas bastante alta debido a la credibilidad de la revista.

Todas las fuentes consideradas tienen motores de búsqueda convenientes y pueden usarse para la identificación oportuna de los resultados de estudios relevantes de coronavirus.

Estudio de publicaciones sobre el origen del SARS-CoV-2


También es interesante utilizar el mapa desarrollado para estudiar temas sobre coronavirus que causan controversia y discusión científica. Una de ellas es la versión sobre el origen artificial del coronavirus asociado con la publicación El virus del murciélago modificado provoca debate sobre investigaciones riesgosas . Esta publicación no se encontró durante la recopilación de datos debido a su baja calificación debido a la falta de enlaces de citas (lo cual es una circunstancia extraña porque fue publicado por la prestigiosa editorial Nature). Esta publicación tampoco se menciona en el artículo de dos páginas No hay evidencia creíble que respalde las afirmaciones de la ingeniería de laboratorio del SARS-CoV-2, que alega evidencia insuficiente del origen artificial del virus SARS-CoV-2 (Figura 10).


Higo. 10 - Publicaciones seleccionadas sobre un tema relacionado con el origen del SARS-CoV-2

A este respecto, los resultados de la investigación publicados en el artículo mencionado anteriormente Reconocimiento del receptor por el nuevo coronavirus de Wuhan: un análisis basado en estudios estructurales de la década y el largo del SARS son de particular interés. Coronavirus de la Revista de Virología. Sin embargo, debido a la falta de conocimiento especializado en el campo de la ingeniería genética, no es posible realizar más análisis.

recomendaciones


Resumiendo la presente revisión, es necesario señalar la importancia del acceso oportuno a los resultados de la investigación científica para contrarrestar la desinformación. Sin embargo, el exceso de volumen de información publicada, así como la complejidad científica del tema, reduce la efectividad de tal contraataque. Una gran cantidad de resultados publicados aumentan la carga tanto para los lectores como para los revisores que verifican la exactitud de los resultados. Esta situación es característica no solo para eventos raros como la pandemia de coronavirus, sino también para toda la industria científica. La analítica requiere nuevos enfoques para el procesamiento de la información, uno de los cuales se demostró en este artículo.

La información obtenida en las publicaciones científicas recopiladas que se han corregido al núcleo puede ser útil para los especialistas, por lo tanto, se presentan en la tabla como un documento separado.archivo xlsx .

PD: En los comentarios es interesante escuchar la opinión de expertos con respecto a la política editorial del Journal of Virology, así como la confiabilidad de la versión artificial de SARS-CoV-2.

All Articles