"Pandemia" de publicações científicas sobre COVID-19

Na sociedade da informação moderna, todos os processos socialmente importantes que também afetam a segurança e a saúde dos cidadãos são acompanhados por um fluxo de informações falsas. Quanto mais participantes no processo e mais complexa a área de assunto, maior o espaço para manipulação e a disseminação de informações erradas. Essa desinformação pode ser mais perigosa do que a ocorrência que criou a ameaça.



Hoje, as informações sobre a doença COVID-19 dominam outras e são acompanhadas por muitas informações falsas. Nesse sentido, são necessárias informações confiáveis, que com certa habilidade podem ser obtidas em periódicos científicos revisados ​​por pares.

Muitas bibliotecas e jornais científicos eletrônicos (como o Centro Nacional de Imunização e Doenças Respiratórias, JAMA Network, Elsevier) organizaram seções especiais das publicações sobre o SARS-CoV-2 em seus sites. No entanto, mais de 10 artigos científicos são publicados por dia sobre este tópico. Compreender esse fluxo de informações não é fácil. Se a publicação de coronavírus mais citada desde 2003 por 18 anos atraiu mais de 3400 fontes (de acordo com o Google Scholar), o artigo Recursos clínicos de pacientes infectados com o novo coronavírus de 2019 em Wuhan já foi citado por mais de 900 fontes, apesar do fato de este artigo ter sido publicado. há apenas um mês! Essa situação pode ser chamada de “pandemia” de artigos científicos sobre o COVID-19.

Vamos tentar estruturar o fluxo de publicações e identificar padrões interessantes nele. Devido à falta de conhecimentos especiais no campo da medicina, este artigo apresenta apenas os resultados de uma análise bibliométrica, sem tentar interpretar os fatos revelados no contexto da virologia.

Minuto de Cuidados com OVNI


A pandemia de COVID-19, uma infecção respiratória aguda potencialmente grave causada pelo coronavírus SARS-CoV-2 (2019-nCoV), foi anunciada oficialmente no mundo. Há muitas informações sobre Habré sobre esse tópico - lembre-se sempre de que pode ser confiável / útil e vice-versa.

Pedimos que você seja crítico com qualquer informação publicada.



Lave as mãos, cuide de seus entes queridos, fique em casa sempre que possível e trabalhe remotamente.

Leia publicações sobre: coronavírus | trabalho remoto

Características dos dados de origem


Os dados de origem eram informações sobre mais de 10.000 publicações acadêmicas coletadas em 20 de março de 2020 usando o mecanismo de pesquisa do Google Scholar. Infelizmente, poucas publicações domésticas são indexadas neste sistema de pesquisa devido ao fato de que o principal sistema bibliométrico russo eLibrary possui um forte sistema de proteção contra a coleta de dados.

No total, foram realizadas três consultas de pesquisa para as seguintes palavras-chave: “COVID-19” , “coronavírus” e “SARS-CoV-2” (Figura 1).

FIG. 1 - Resultados da pesquisa de publicações científicas por palavras-chave

O nome da doença COVID-19 é usado com mais frequência em publicações científicas do que o nome do vírus SARS-CoV-2. Total de artigos e livros sobre coronavírus, bem como tópicos relacionados, segundo o Google Scholar mais de 150 mil. As estatísticas anuais das publicações coletadas são mostradas na Figura 2.

Fig. 2 - Distribuição das informações coletadas das publicações por ano

Dois picos podem ser observados no diagrama, referentes a 2003 e 2012. Esses picos correspondem a dois surtos de infecções por coronavírus: SARS-CoV (síndrome respiratória aguda grave, conhecida como SARS) e MERS-CoV (síndrome respiratória do Oriente Médio). Apesar de a coleta de informações das publicações ter sido focada nas mais recentes, é difícil não notar um salto na atividade científica devido à situação atual da pandemia do COVID-19. Essa tendência também pode ser observada na dinâmica de citação dos artigos mais populares sobre esse tema. A publicação Identificação de um novo coronavírus em pacientes com síndrome respiratória aguda grave sobre coronavírus desde 2003 por 18 anos, segundo o Google Scholar, atraiu mais de 3400 fontes. Nesta publicaçãoAs características clínicas dos pacientes infectados com o novo coronavírus de 2019 em Wuhan sobre um novo coronavírus em apenas um mês já têm mais de 900 citações! Essa situação é chamada de “pandemia” de artigos científicos sobre o COVID-19, pois afetou cientistas de todo o mundo. O estudo de um volume tão elevado de publicações requer o uso de métodos de análise especiais, que serão demonstrados neste artigo.

Mapa de publicações científicas sobre o tema "Coronavírus"


A análise em forma gráfica usando mapas parece conveniente e intuitiva. Informações adicionais sobre publicações científicas podem ser obtidas considerando o vínculo temático entre elas, conforme refletido na citação. Com base nos dados coletados, um gráfico de citação foi construído, cujo núcleo é representado por conveniência como um mapa de calor (Figura 3).

FIG. 3 - Mapa de publicações científicas sobre o tema "Coronavírus"

Apresentado na Figura 3.A, o mapa forma um espaço semântico no qual cada seção tem um foco temático específico. A proximidade da publicação determina sua similaridade temática. O arranjo mútuo de sites temáticos é determinado pelos links entre os tópicos de pesquisa relevantes. Essa. quanto mais próximas as duas áreas do mapa estiverem, mais semelhantes elas serão no tópico da pesquisa.

No mapa (Figura 3.A), dois grandes aglomerados podem ser observados. O cluster localizado no lado esquerdo do mapa (setores 6 a 11, Figura 3.A) contém os resultados de estudos de coronavírus realizados antes do advento do COVID-19. Isso é evidenciado pela distribuição do número de publicações encontradas pelas consultas de pesquisa "COVID-19" (Figura 3.B) e“Coronavírus (após 2020)” (Figura 3.B). As publicações encontradas pela solicitação “SARS-CoV-2” (Figura 4.E) estão presentes nos clusters esquerdo e direito (setor 3, Figura 3.A).

Além do tópico de clusters, é importante entender a que horas suas publicações foram publicadas. A Figura 4 mostra a cronologia da colocação de artigos e livros científicos sobre o tema “Coronavírus”, onde o ano de publicação é indicado em cores.


FIG. 4 - Ilustração da cronologia do surgimento de publicações científicas sobre coronavírus

As primeiras publicações estão localizadas no canto superior esquerdo do mapa, publicações para 2020 - em um grupo separado à direita.

Informações sobre a cronologia permitem rastrear as relações de causa-efeito entre as regiões e o desenvolvimento de tópicos.

Visão geral do cluster temático


Vamos considerar com mais detalhes as principais áreas do mapa construído (Figura 5).


FIG. 5 - Mapa das publicações científicas sobre o tema “Coronavírus”, com as áreas temáticas marcadas,

publicações do grupo principal são dedicadas ao estudo de vírus. Sua parte superior inclui publicações anteriores, nas quais é dada mais atenção ao estudo da estrutura proteica dos vírus. Na parte baixa da região estão concentrados os resultados de estudos de coronavírus específicos, incluindo SARS (2003) e MERS (2012).

No final de 2002 e no início de 2003, surgiu uma doença chamada "pneumonia atípica" na mídia. O vírus se espalhou na Ásia. Durante todo o tempo, mais de 8000 casos de infecção foram notificados, mais de 800 deles foram fatais. O pico de publicações, observado anteriormente, está associado a esta doença e as próprias publicações estão localizadas compactamente na área da SARS (Figura 5).

A área MERS-CoV inclui publicações relacionadas à Síndrome Respiratória do Oriente Médio 2012, distribuída em 23 países, incluindo Arábia Saudita, Iêmen, Emirados Árabes Unidos, França, Alemanha, Itália.

Três grupos isolados no lado esquerdo do mapa (zona 3, setor 8, Figura 3.A) estão relacionados ao estudo de vírus em animais (gatos, cães e gado).

O lado direito do mapa contém publicações sobre o COVID-19 e suas conseqüências para a sociedade. O cluster COVID-19 possui uma estrutura complexa e consiste em seções temáticas relacionadas ao estudo do próprio vírus e à modelagem de sua disseminação. Há também uma área separada de publicações relacionadas às peculiaridades de revelar uma doença por métodos de radiologia.

Entre os dois grandes aglomerados das partes esquerda e direita do mapa, há uma "ponte" de cerca de 20 publicações (setores 3 e 4 da zona 2, Figura 3.A). Essas publicações têm links para citação, e as publicações relacionadas estão localizadas em grupos opostos em proporções aproximadamente iguais. Entre essas publicações, estão tópicos sobre o desenvolvimento de uma vacina, a identificação da origem do vírus e o prognóstico de sua disseminação, levando em consideração a análise dos dados disponíveis sobre infecções semelhantes.

O mapa construído permite que você veja visualmente a relação "natural" entre os diferentes tópicos de pesquisa dos coronavírus e pode ser usado como uma ferramenta intuitiva e visual para analisar o foco temático das equipes de autores, revistas científicas e outros objetos de pesquisa. Esse recurso será demonstrado nas seções a seguir.

Análise da atividade dos autores


Para as publicações em consideração, foram identificados mais de 3000 autores, 50 deles (com o maior número de publicações) são apresentados no diagrama (Figura 6).


FIG. 6 - 50 autores mais publicados sobre o tema “Coronavírus”.

Ao determinar as estatísticas dos autores, apenas sobrenomes e iniciais foram utilizados. Essa abordagem tem várias desvantagens, pois, por um lado, as mesmas pessoas podem ser consideradas diferentes devido a diferenças na ortografia dos sobrenomes nos idiomas nativo e inglês. Por outro lado, dois autores diferentes podem ser registrados como uma pessoa se tiverem os mesmos sobrenomes e iniciais (esse problema é especialmente relevante para autores chineses, que estão mais no tópico sobre o COVID-19). Por esse motivo, o número real de autores e suas publicações diferirá das estatísticas fornecidas.

Considere o foco temático dos autores mais ativos. A Figura 7 mostra mapas temáticos personalizados dos 7 autores mais publicados. Os mapas pessoais foram construídos usando o mapa de publicações científicas publicado anteriormente sobre o tópico “Coronavírus”.


FIG. 7 - Cartões temáticos pessoais para os sete autores de Coronavírus mais publicados

Professores Patrick Cy Woo e Susanna Kar Pui Lau são membros do Departamento de Microbiologia da Universidade de Hong Kong. Os autores têm mais de 100 publicações (das quais pelo menos 40 estão relacionadas ao estudo de coronavírus). Eles têm índices de Hirsch razoavelmente altos, mas até agora nenhuma publicação foi registrada sobre o tópico COVID-19.

Devido à prevalência do sobrenome Lee, várias pessoas podem ser representadas no perfil Y Li de uma vez: Yun Li (Yun Li, professor da Universidade de Michigan ou professor da Universidade de Toronto), Lei Yuan (Lei Yuan, funcionário da Universidade Wuhan) e outras. Por esse motivo, não faz sentido analisar a atividade das publicações desse perfil. Considerações semelhantes se aplicam aos perfis de W Li , J Chen e Y Yang .

Dr. Ziad A. Memish) é atualmente consultor sênior de doenças infecciosas e chefe do departamento de pesquisa do Hospital Prince Mohammed bin Abdel Aziz em Riyadh (Ministério da Saúde da Arábia Saudita). Ele também é professor da Faculdade de Medicina da Universidade Alfaisal (Riyadh, Arábia Saudita) e professor associado do Departamento de Saúde Global. Hubert (Escola de Saúde Pública Rollins, Universidade Emory, Geórgia, EUA).

O Ziad Memish é reconhecido pela comunidade de especialistas como um especialista na luta contra infecções por doenças. Membro do Conselho Executivo da Sociedade Internacional de Doenças Infecciosas. Ele tem muitos prêmios diferentes, uma grande lista de publicações científicas e relatórios em conferências internacionais, é o editor-chefe de duas revistas (Journal of Epidemiology and Global Health). A maioria de suas publicações sobre coronavírus está localizada no setor 6 da zona 3 (Figura 3.A), que inclui publicações sobre a doença respiratória no Oriente Médio. Seu tempo de publicação é para o período de disseminação da doença. Nesse momento, Ziad Memish atuou como vice-ministro da Saúde da Arábia Saudita.

Sobre o assunto COVID-19 no mapa de Ziad Memish, existem quatro publicações dedicadas ao diagnóstico e à contração da disseminação em massa do vírus.

Assim, como resultado da análise da atividade pessoal, pode-se estabelecer que o aumento nas publicações de 2020 se refere a autores chineses que, devido à prevalência de sobrenomes e iniciais durante a análise bibliométrica, podem ser confundidos com as mesmas pessoas. Pesquisadores com autoridade internacional demonstraram atividade moderada em relação à publicação de informações sobre o coronavírus e sua doença associada COVID-19.

Análise da atividade do editor


Muitos recursos de informação (incluindo Habr) para acesso mais conveniente às informações sobre o COVID-19 em seus sites organizaram seções especiais nas quais as informações relevantes são agregadas. Simplificar o acesso às informações verificadas é uma boa maneira de combater a disseminação de informações falsas, o que pode levar a consequências negativas. Editores científicos também usam essa abordagem. Ao mesmo tempo, é necessário observar responsabilidade adicional por garantir a confiabilidade e a qualidade das informações postadas por essas organizações. Ao publicar informações insuficientemente verificadas, os editores correm o risco de desviar a atenção ou enganar os cientistas da pesquisa, o que pode levar a uma diminuição na eficácia da luta contra os coronavírus.

Em conexão com o aumento do volume de trabalhos sobre a revisão de artigos científicos, parece interessante estudar a atividade dos editores em relação ao tópico em discussão. Para fazer isso, a Figura 8 mostra estatísticas sobre a colocação de artigos científicos na fonte correspondente e, para as fontes, estimativas comparativas do número total de publicações de coronavírus encontradas e o número de publicações sobre o tópico COVID-19 também são mostradas.


FIG. 8 - Estatísticas sobre o número de publicações coletadas para revistas e plataformas bibliométricas (o azul claro indica o número total de publicações coletadas sobre o tópico “Coronavírus”, azul escuro indica o número de publicações sobre o tópico COVID-19)

Deve-se notar que uma grande proporção de publicações sobre o tópico COVID -19 compõem as chamadas pré - impressõesartigos i.e. artigos publicados antes de sua publicação oficial em uma revista científica revisada por pares (esses artigos estão disponíveis em medrxiv.org e arxiv.org). Por um lado, a colocação de pré-impressões permite que os cientistas declarem sua superioridade na obtenção de resultados científicos mais cedo do que outros e, por outro, para corrigir imprecisões que podem ser identificadas antes da publicação oficial do artigo. Isso reduz a possibilidade de uso comercial dos resultados de sua propriedade intelectual, uma vez que os dados estarão disponíveis ao público. Um grande número de pré-impressões de artigos sobre o tema não surpreende, pois, devido à sua relevância, os pesquisadores buscam publicar os resultados de suas pesquisas o mais cedo possível, sem esperar pela conclusão dos procedimentos de revisão previstos pelos editores científicos oficiais.Outra característica interessante é a disponibilidade de fontes que não possuem publicações sobre o tópico COVID-19, apesar da disponibilidade de artigos sobre outros tópicos relacionados aos coronavírus. Esse recurso será discutido em mais detalhes abaixo.

Utilizamos o mapa construído para a análise de periódicos científicos da mesma maneira que usamos para analisar a atividade dos autores. A Figura 9 mostra os mapas temáticos dos periódicos revisados ​​e das bibliotecas eletrônicas.


FIG. 9 - Mapas temáticos de revistas científicas e bibliotecas eletrônicas que publicam informações sobre o tópico

ScienceDirect do Coronavirus (sciencedirect.com) . O sistema de acesso a revistas científicas, implementado por uma das maiores editoras mundiais Elsevier (que também gerencia o banco de dados de publicações científicas Scopus). O sistema fornece acesso (pago e gratuito) a publicações de mais de 2600 revistas científicas. As críticas a esta editora visam principalmente a comercialização excessiva da atividade científica.

ScienceDirect representa 14% das publicações que se enquadram no núcleo dos dados coletados. Todos os tópicos abordados nos coronavírus são abordados (Figura 9.A), e a dinâmica da publicação corresponde às estatísticas gerais. Os tópicos sobre o coronavírus de 2003 e a doença respiratória no Oriente Médio de 2012 são destacados proporcionalmente. O tópico de modelagem e mecanismos de disseminação da doença COVID-19 é apresentado em menor volume comparado ao tópico de estudos clínicos do vírus.

Journal of Virology (jvi.asm.org). O Journal of Virology é um periódico revisado por pares e é publicado desde 1967. Atualmente, os artigos são publicados eletronicamente a cada duas semanas. A revista cobre os resultados de estudos sobre a natureza dos vírus, relata novas descobertas e aponta novas direções na pesquisa. Os artigos de pesquisa originais abrangem vírus de animais, arquéias, bactérias, fungos, plantas e protozoários. Entre os principais problemas que estão sendo investigados: análise da estrutura dos vírus, replicação do genoma viral, evolução dos vírus, interação de vírus e células, etc.

O mapa temático (Figura 9.B) mostra que nesta revista praticamente todos os tópicos sobre coronavírus são abordados. exceto COVID-19. Apenas uma publicação foi coletada sobre esse tópico (Reconhecimento de Receptores pelo Novo Coronavírus de Wuhan: uma Análise Baseada em Estudos Estruturais de Década e Longa do Coronavírus SARS ). Nele, em vez do termo COVID-19, 2019-nCoV é usado, segundo o qual mais duas publicações relacionadas ao tópico COVID-19 foram descobertas manualmente no site do editor. Um número tão pequeno de publicações (em comparação com outros editores), apesar da ampla cobertura de outras infecções virais, provavelmente se deve à política editorial, aos altos requisitos e à análise cuidadosa dos materiais publicados (o site indica que o tempo médio de resposta do editor para aceitação é de 27 dias, o tempo entre uma decisão positiva e a publicação é de 11 dias).

Também é interessante comparar a cronologia da publicação nesta revista e no sistema ScienceDirect considerado. Essas fontes têm semelhanças tanto na cobertura quanto no número aproximado de publicações que se enquadram no núcleo dos dados coletados. Ao mesmo tempo, a dinâmica das publicações no ScienceDirect para surtos de infecções virais em 2003 e 2012 parece semelhante, enquanto no Journal of Virology, a atividade está diminuindo. Isso pode ser devido à diminuição do interesse em tópicos sobre coronavírus ou recursos de publicação e políticas editoriais direcionadas (por exemplo, requisitos adicionais para a novidade científica da tecnologia de pesquisa).

O Centro Nacional de Informação Biotecnológica (ncbi.nlm.nih.gov). O Centro Nacional de Informações sobre Biotecnologia dos EUA foi criado em 1988 para processar e armazenar dados de biologia molecular. O NCBI mantém um banco de dados de domínios proteicos, DNA (GenBank) e RNA, artigos científicos médicos e biológicos (PubMed) e taxonomia de espécies (TaxBrowser).

Essa fonte contém pouco mais de 4% das publicações coletadas no núcleo. Quase todas as publicações foram publicadas depois de 2003 (Figura 9.B), portanto essa fonte praticamente não é apresentada no topo do mapa temático. Também nesta fonte há baixa cobertura de tópicos relacionados a vírus de animais de estimação. Os artigos científicos COVID-19 estão localizados principalmente na parte central do cluster correspondente e são dedicados a estudos clínicos do vírus, bem como a previsão de sua propagação.

SpringerLink (link.springer.com) . Sistema de acesso a revistas científicas da Springer Publishing House, especializado em trabalhos nas ciências naturais. A distribuição de publicações sobre o tópico “Coronavírus” e ao longo dos anos no SpringerLink é comparável à Elsevier, mas em um volume menor (cerca de 3 vezes, Figura 9.G). Dentre os aspectos estatísticos das publicações, destaca-se um grande número de publicações datadas de 1995, que revelam principalmente os resultados de estudos de coronavírus em animais (inclusive domésticos). As principais orientações das publicações sobre COVID-19 são estudos clínicos e modelagem de consequências.

medRxiv (medrxiv.org). Um recurso on-line gratuito para postar artigos e monografias completos, mas não publicados (pré-impressões) na área da saúde. O maior número de publicações sobre o assunto do COVID-19 é atualmente publicado por essa mesma fonte (Figuras 8, 9.E). Esta fonte não foi observada em publicações sobre outros tópicos sobre o coronavírus.

Biblioteca Online Wiley (onlinelibrary.wiley.com) . Sistema de acesso a periódicos científicos Wiley semelhante ao Elsevier e Springer. Wiley compilou uma seleção de mais de 5.000 artigos de pesquisa abertos relacionados ao COVID-19. A maioria das publicações sobre COVID-19 refere-se aos resultados de estudos da estrutura do SARS-CoV-2.

Imprensa da Universidade de Oxford (academic.oup.com). A fonte publica artigos de mais de 300 periódicos nas áreas de humanidades, ciências sociais, jurisprudência, ciência e medicina, dois terços dos quais são publicados em colaboração com organizações científicas e profissionais.
As publicações da Oxford University Press sobre Coronavírus destinam-se principalmente ao estudo de coronavírus humanos específicos. Com relação ao COVID-19, foram coletadas 16 publicações, destinadas principalmente a estudar a origem e os mecanismos de disseminação do vírus SARS-CoV-2.

Natureza (nature.com). É uma das revistas científicas mais antigas e respeitadas no campo das ciências naturais, com mais de um milhão de leitores por mês. Para esta revista (Figura 9.I), pode-se observar um “aumento” nas publicações sobre coronavírus para 2016. Essas estatísticas diferem de outras fontes consideradas. Este ano, foram publicados principalmente os resultados de estudos sobre a estrutura dos coronavírus (por exemplo, SARS e MERS: informações recentes sobre coronavírus emergentes ). As publicações têm uma classificação de citação bastante alta devido à credibilidade da revista.

Todas as fontes consideradas possuem mecanismos de busca convenientes e podem ser usadas para identificação oportuna dos resultados de estudos relevantes sobre coronavírus.

Estudo de publicações sobre a origem do SARS-CoV-2


Também é interessante usar o mapa desenvolvido para estudar tópicos sobre coronavírus que causam controvérsia e discussão científica. Uma delas é a versão sobre a origem artificial do coronavírus associada à publicação Engine virus morcego gera debate sobre pesquisas arriscadas . Esta publicação não foi encontrada durante a coleta de dados devido à sua baixa classificação devido à falta de links de citação (o que é uma circunstância estranha porque foi publicada pela respeitável editora Nature). Esta publicação também não é mencionada no artigo de duas páginas. Nenhuma evidência credível que apóie as reivindicações da engenharia de laboratório do SARS-CoV-2, que alega evidências insuficientes da origem artificial do vírus SARS-CoV-2 (Figura 10).


FIG. 10 - Publicações selecionadas sobre um tópico relacionado à origem da SARS-CoV-2

A esse respeito, os resultados da pesquisa publicados no artigo Reconhecimento de Receptores mencionado anteriormente pelo Novel Coronavírus de Wuhan: uma análise baseada em estudos estruturais de longo prazo da SARS são de particular interesse. Coronavírus do Journal of Virology. No entanto, devido à falta de conhecimento especializado no campo da engenharia genética, análises adicionais não são possíveis.

achados


Resumindo a presente revisão, é necessário observar a importância do acesso oportuno aos resultados de pesquisas científicas para combater a desinformação. No entanto, o excesso de volume de informações publicadas, bem como a complexidade científica do tópico, reduz a eficácia de tal contração. Um grande número de resultados publicados aumenta a carga de leitores e revisores que verificam a exatidão dos resultados. Essa situação é característica não apenas para eventos raros como a pandemia de coronavírus, mas também para toda a indústria científica. O Analytics requer novas abordagens para o processamento de informações, uma das quais foi demonstrada neste artigo.

As informações obtidas nas publicações científicas coletadas que foram corrigidas até o núcleo podem ser úteis para especialistas; portanto, elas são apresentadas na tabela como um documento separado.arquivo xlsx .

PS Nos comentários, é interessante ouvir a opinião de especialistas sobre a política editorial do Journal of Virology, bem como a confiabilidade da versão artificial do SARS-CoV-2.

All Articles