Algoritmos de IA e automação da codificação clínica como exemplo

A codificação clínica é um processo administrativo no qual os dados obtidos durante o diagnóstico são traduzidos (hoje, manualmente usando livros e manuais de referência) nos símbolos de código correspondentes. As fontes de dados clínicos incluem:

  • Dados de admissão.
  • Dados na alta.
  • Estudos patológicos.
  • Estudos radiológicos.
  • Receitas

Um erro na codificação é uma coisa frequente e tem conseqüências desagradáveis ​​(do reprocessamento da equipe e redução do financiamento do hospital à perda de controle sobre a epidemia), mais sobre isso abaixo.

Graficamente, o processo de codificação pode ser representado na Fig. 1.



Fig. 1 - Processo de codificação clínica A

CID-10 é um padrão de codificação unificado usado em muitos países do mundo. A abreviatura CID-10 significa "10ª edição da Classificação Internacional de Doenças e Outros Problemas de Saúde", compilada pela equipe da Organização Mundial da Saúde. O documento contém representações de código de várias doenças, seus sintomas e sinais, desvios da norma, além de reclamações, circunstâncias sociais e causas externas de lesões e várias doenças.

Como regra, cada código consiste em 7 caracteres: 1-3 caracteres são usados ​​para indicar a categoria da doença, 4-6º caracteres determinam a localização e a gravidade, o 7º caractere é complementar. Em alguns países, a designação de códigos pode variar. Num futuro próximo, é esperada uma transição para o novo padrão da CID-11 com códigos de doenças mais volumosos. O documento conterá mais de 55.000 códigos com a adição de designações de alguns novos casos clínicos e doenças mentais. Compreender as novas representações e classificações de código é extremamente importante para países, territórios individuais e organizações de saúde para desenvolver ainda mais o setor e atrair financiamento adequado.

Duas aplicações importantes da codificação clínica:

  1. Faturamento (governo local e governo estadual, saúde e seguro).
  2. Relatórios (estudos epidemiológicos, política estadual, vigilância epidemiológica).


Os codificadores clínicos verificam cuidadosamente todos os registros médicos para obter cuidados médicos para determinar o seguinte:

  • O diagnóstico principal.
  • Tratamento secundário (se realizado).
  • Outras doenças identificadas.
  • Complicações que surgiram.

Todas as opções acima são exibidas nos códigos correspondentes de acordo com o padrão ICD-10.

Questões de codificação clínica


A execução manual do processo de codificação está associada a várias dificuldades e, em geral, causa muitos problemas para os funcionários das instituições:

  • , : , - , .
  • , 4 .
  • . 8- 24 , .
  • , 70-75%. 1 , (AHIMA). , .
  • A proporção de velocidade e precisão de codificação . Esses dois parâmetros estão inter-relacionados: quanto maior a velocidade, menor a qualidade e vice-versa.
  • Falta de pessoal . Apenas cerca de 52% dos codificadores clínicos trabalham continuamente. Muitas agências usam offshoring para reduzir o número de casos pendentes.




Tabela 1: II Competição Nacional de Codificação Clínica CID-10

As consequências dos erros clínicos de codificação


Erros na classificação e codificação clínica são muito comuns. Eles afetam muitos aspectos do trabalho das instituições médicas, incluindo o pagamento do custo dos cuidados médicos prestados. Considere um exemplo com apendicectomia (remoção do apêndice), a opção mais comum para cirurgia de emergência. A representação de código incompleta ou incorreta da transação afeta significativamente o financiamento.

Exemplo: um paciente foi internado com diagnóstico de apendicite aguda. No período pós-operatório, ocorreu infecção da ferida. O paciente recebeu antibióticos por via intravenosa.




Tabela 2. O efeito dos erros de codificação no caso de apendicite purulenta aguda no financiamento.

Um exemplo mostra que um erro de codificação clínica pode levar ao excesso de processamento e redução de financiamento. Outra consequência séria da codificação clínica incorreta é a perda de controle sobre o desenvolvimento de epidemias.

Quão prático é usar algoritmos de IA para codificação clínica?


Se a IA pode dirigir como um ser humano, ela pode lidar com a codificação clínica?

Nos últimos anos, foi alcançado um sucesso significativo na aplicação da IA ​​em vários campos de atividade. Uma pequena excursão ao assunto:

A IA é uma vasta área de conhecimento sobre computadores que podem imitar as capacidades humanas. Ele permite que as máquinas usem dados para treinamento, eliminando a necessidade de codificação embutida para executar tarefas específicas. A IA permite que os computadores aprendam usando sua própria experiência. Os computadores são capazes de processar grandes quantidades de dados e perceber conexões mais profundas, fornecendo, em última análise, um nível mais alto de precisão em comparação aos humanos. Tudo isso é a base para resultados mais precisos, que são a base para decisões mais informadas.


Apesar das muitas dificuldades que a IA enfrenta no setor de saúde, ela pode desempenhar um papel fundamental na codificação clínica, fornecendo algumas vantagens inegáveis:

  • Menores custos financeiros.
  • Melhor consistência.
  • Eliminação da falta de pessoal.
  • Implementação da codificação pré-clínica.
  • Acelerando o processo, que por sua vez levará a um financiamento mais rápido.
  • Melhorar a precisão e o escopo das auditorias.

O problema da complexidade dos dados médicos


Muitas instalações e organizações de saúde não usam uma abordagem conceitual para organizar e gerenciar a qualidade dos dados, especialmente a longo prazo. O valor dos registros médicos e dados baseados neles aumenta com o tempo. Mesmo a introdução de registros médicos eletrônicos (EMR) não simplificou o processamento de dados em tempo real de maneira adequada, porque a funcionalidade do software usado é muito limitada.

Aqui estão os principais problemas com o processamento de dados médicos:

  • Diferentes níveis de qualidade dos prontuários eletrônicos.
  • Falta de compatibilidade, bem como a complexidade dos sistemas clínicos.
  • A complexidade do processo de coleta, pesquisa e análise de dados.
  • A necessidade de processar dados incompletos ou ausentes.
  • Cobertura e amostragem de dados.
  • Requisitos regulatórios e processos burocráticos.

Agora vamos estudar

Caso do Hospital Maharaj Nakhon em Chiang Mai


Este é um hospital de treinamento da Universidade de Chiang Mai, localizado na região de Muang, em Chiang Mai, na província de Chiang Mai. Este é o primeiro hospital tailandês fora de Bangkok, inaugurado em 1941. Este hospital bastante grande possui 1.400 camas, 69 camas na unidade de terapia intensiva e 92 camas adicionais, além de 28 salas de cirurgia. Ao longo do ano, existem mais de 45.000 casos de internação, incluindo mais de 1.000 cirurgias cardíacas abertas e mais de 40 cirurgias de transplante renal. Registro mais de 1,3 milhão de pacientes nas policlínicas do hospital.

Complexidade dos dados


Utilizamos dados clínicos dos repositórios do Hospital Chiang Mai, registrados entre 2006 e 2019. A Tabela 3 contém algumas estatísticas que demonstram a complexidade das informações que estão sendo processadas.



Tabela 3. Estatísticas do conjunto de dados do hospital Maharaj Nakhon Chiang Mai.

Neste artigo, não entraremos em detalhes específicos e prestaremos atenção apenas aos pontos mais significativos:

  • Em 42,5% dos casos de assistência médica, um conjunto único de códigos foi usado (apenas alguns casos com registros idênticos)
  • Casos de internação são significativamente mais complexos
  • Casos bastante complicados de observação ambulatorial (sem histórico médico)
  • Conjuntos complexos de códigos (100 ou mais) são usados ​​em mais de 70% dos casos, conforme indicado na Fig. 2)




FIG. 2. A frequência dos 30 códigos mais comuns da CID-10 no conjunto de dados estacionários

Fig. 2 mostra o chamado problema da “cauda longa” nos 30 códigos mais comuns da CID-10. Como você pode ver, a grande maioria dos códigos é bastante rara. Esse recurso complica o aprendizado de máquina, pois a probabilidade de modelar casos menos frequentes é menor.

Maneiras de processar fontes de dados


Cada fonte de dados possui os seguintes recursos: formato, tipo, nível de dificuldade. Por causa disso, é difícil pré-processar os dados e há um problema na formação de sinais preditivos significativos. Além disso, ficará claro que os estágios do processamento e modelagem de dados estão associados a um complexo de tarefas igualmente complexas que precisam ser resolvidas.



Tabela 4 - características das fontes de dados e complexidade de seu processamento O

pré-processamento dos dados foi realizado em relação a várias fontes. Por exemplo, para o processamento, foram utilizados dados de texto não estruturados (relatórios radiológicos ou outros), dados laboratoriais semiestruturados (em vários formatos, incluindo texto, dados numéricos mistos), receitas estruturadas e dados tabulares sobre admissões de pacientes.

Tarefas de automação


Devido à complexidade do processamento de dados, como mostrado acima, a automação do processo de codificação clínica enfrenta vários problemas diferentes:
  • Um grande número de classificadores exclusivos (mais de 12.000).
  • Falta de referência ou padrão-ouro.
  • Falta de conjuntos de dados publicamente disponíveis.
  • Dados desequilibrados (muitos casos raros).
  • A dificuldade de encontrar maneiras de combinar dados de várias fontes diferentes.


Conveniência do uso de algoritmos de aprendizado profundo (IA)


O Deep Learning é uma das abordagens mais justificadas para automatizar os processos de codificação clínica.

Mais uma vez, uma pequena excursão: o aprendizado profundo é uma família de métodos de aprendizado de máquina baseados em redes neurais com alta capacidade de aprendizado representativa. Este é um conjunto de algoritmos que imitam o trabalho do cérebro humano, a saber: como ele passa solicitações por várias hierarquias de conceitos e questões relacionadas para encontrar uma solução para o problema. O aprendizado profundo já foi utilizado com sucesso em vários campos: processamento de imagem e visão computacional, processamento de linguagem natural (PNL), tradução automática, sistema de piloto automático, sistema de detecção de fraude e outros.

A adequação do uso de algoritmos de aprendizado de máquina deve-se ao seguinte:

  • .
  • .
  • .
  • ( ).



Esta seção discute algumas arquiteturas usadas para projetar modelos de codificação preditiva da CID-10. Primeiro, formulamos o problema da classificação por vários rótulos para prever os códigos da CID-10. Para prever as probabilidades de cada código da CID-10, usamos a arquitetura de uma rede neural de comunicação direta. A seguir, será estabelecida a correspondência dos códigos previstos da CID-10 com os valores mais prováveis.

A arquitetura de modelagem intuitiva é coletar todos os dados disponíveis de várias fontes e treinar uma única rede. Isso refletirá as interações entre os diferentes tipos de dados e sua relação com o diagnóstico final. Essa arquitetura de modelagem é chamada de modelo combinado, que será usado na seção de resultados.

FIG. 3 mostra a estrutura gráfica de um modelo combinado. Como várias fontes de dados são usadas ao mesmo tempo, essa arquitetura não pode ser considerada a melhor. Como as fontes de dados diferem em sua complexidade, isso leva à construção de uma rede excessivamente complexa com hiperparâmetros de ajuste fino através de muitas iterações, bem como a experimentação com um número diferente de camadas e funções de perda. Assim, a modalidade dos dados não será estudada suficientemente bem.



FIG. 3. A estrutura do modelo combinado

A segunda arquitetura contém várias redes que aprendem a interagir com fontes de dados individuais, como mostrado na Fig. 4. Em seguida, os dados de previsão obtidos de cada rede são agregados usando métodos de média ou valores médios ponderados. Isso leva à falta de domínio de representações representativas ou menores de dados de diferentes fontes no espaço de atributos no processo de aprendizagem. No entanto, isso afeta negativamente a adoção das decisões corretas, pois a seleção direta de uma fonte com base na fusão tardia do conhecimento após o recebimento de uma opinião de cada fonte de dados é menos informativa.



FIG. 4. A estrutura do modelo de média

Portanto, voltamos à arquitetura da modelagem de conjuntos, mostrada na Fig. 5. A estrutura do modelo deve ser tal que permita determinar com segurança as várias modalidades dos dados com seus diferentes níveis de complexidade, bem como examinar minuciosamente os relacionamentos estabelecidos entre eles. Nossa rede, construída sobre modelos treinados individualmente, é chamada de "conjunto" ou "especialista". Ela imita o trabalho dos codificadores clínicos, utiliza todos os tipos de dados clínicos, toma decisões sobre o diagnóstico final.

De fato, a rede receberá conhecimento especializado de redes já treinadas, o que é mais eficaz do que estudar fontes individuais. A rede de conjuntos se baseará na experiência de cada especialista (patologista, radiologista, farmacêutico e outros) em muitas iterações, obtendo o conhecimento necessário para fazer um diagnóstico. Além disso, ela tem a capacidade de formular novos diagnósticos, recebendo dados preditivos de redes individuais, e não apenas levando em consideração a previsão com o maior coeficiente de peso baseado em qualquer fonte.



FIG. 5. A estrutura do modelo de conjunto

Resultados preliminares


Esta seção apresenta as medidas usadas para quantificar a precisão dos modelos descritos acima, bem como os resultados experimentais.

Medidas de avaliação


Diferentemente das classificações binárias e multiclasses, avaliar a eficácia da classificação por vários critérios depende de quais desses critérios estão corretos. Para verificar como o modelo se comportará em várias situações, eles usam abordagens diferentes para verificar os resultados para identificar erros causados ​​por codificação insuficiente ou excessiva. Tendo em conta o que precede, são utilizadas as seguintes medidas de avaliação:

  • Precisão média - a precisão média ponderada de cada valor limite obtido pela soma dos valores na curva de retorno da precisão.
  • Erro de cobertura - um valor que caracteriza a duração de uma avaliação de classificação suficiente para cobrir todos os rótulos.
  • – y_score, , .
  • F1 – .
  • – , .
  • – , .



A Tabela 5 mostra uma melhoria gradual no desempenho geral do modelo para todos os principais indicadores de desempenho. Quantitativamente, isso se traduz em uma melhoria de 4% a 5% para o conjunto de dados de tratamento hospitalar e de 2% a 3% no processamento de dados ambulatoriais. Diferentes fontes fazem várias contribuições para a precisão do modelo. Por exemplo, os dados extraídos das prescrições são os mais informativos. Para cada fonte, um modelo de uma certa complexidade é usado e uma quantidade diferente de tempo e iterações são necessárias para um estudo exato. Redes profundas são capazes de encontrar o mínimo ideal em algumas modalidades de dados mais rapidamente que em outras. Portanto, para melhorar a precisão, eles usam o método de treinamento de cada modalidade separadamente para codificar ao máximo os níveis de variabilidade da complexidade dos dados.

Por outro lado, o modelo apresentado é capaz de atingir a precisão do nível de uma pessoa nos diagnósticos primários, especialmente ao trabalhar com dados de um hospital. Isso é importante para várias aplicações de codificação clínica, por exemplo, para cobrança, com base principalmente no diagnóstico correto.



Tabela 5. Precisão de codificação automatizada

A Tabela 6 apresenta as cinco principais doenças classificadas por grau de precisão. A precisão das três primeiras categorias de dados de atendimento hospitalar é superior a 90%. Em relação aos casos associados à detecção de neoplasias em pacientes (cerca de 30% dos dados), obteve-se uma precisão muito encorajadora de cerca de 80%. Apesar dos indicadores de desempenho mais baixos do modelo para dados ambulatoriais, a precisão ainda excede 60% (cerca de 65% em média), o que por si só é um grande passo à frente.



Tabela 6. Precisão do modelo para os 5 casos de diagnóstico de alto nível mais comuns

Autoconsciência do desempenho do modelo


A construção e avaliação da eficácia dos modelos de aprendizado de máquina são realizadas no processo de treinamento / avaliação. Para a avaliação usando dados selecionados aleatoriamente. No entanto, avaliar a precisão das previsões atuais em tempo real é muito difícil. Para resolver o problema, é introduzido um critério que avalia o grau de confiança do modelo em sua própria previsão. Por exemplo, será útil saber que a precisão do modelo é apropriada para casos simples de assistência médica e insuficiente para casos médicos complexos. Isso pode servir como um sinal para verificar novamente um caso específico por uma pessoa manualmente.

Propomos um modelo de avaliação de confiança em combinação com um modelo de previsão de código da CID-10. Na Fig. A Figura 6 mostra uma rede de avaliação de validação. Realizamos um processo de treinamento para detectar inconsistências entre os códigos previstos e reais, levando em consideração todos os dados de entrada. Portanto, o modelo é capaz de avaliar a confiabilidade da previsão, levando em consideração os dados iniciais, o grau de complexidade de um caso específico e a probabilidade de obter previsões "boas" e "ruins".



FIG. 6. A estrutura do modelo para avaliar o grau de confiabilidade

A Tabela 7 contém os resultados do teste de uma rede de classificações de confiança para vários dados do conjunto. Portanto, cada previsão contém uma avaliação de sua confiabilidade. Por exemplo, a precisão da previsão acima de 97% é observada em 3% dos casos, 85% - em 50% dos casos. A avaliação de confiabilidade permite automatizar o processo de atração de assistência de terceiros quando necessário. O modelo apresentado é caracterizado pela autoconsciência, é facilmente lançado e avaliado pelos usuários em tempo real.



Tabela 7. Confiabilidade de uma estimativa de vários conjuntos de dados

Principais recursos:

  • A modelagem de conjunto, combinada com uma rede especializada para selecionar a melhor previsão, é superior a outros métodos de modelagem.
  • , , , .
  • 4% .
  • ( ), 1%.
  • , ,
  • , .
  • 80% 50% ( , ).
  • , ( ).
  • , .


,


O resultado pode ser a base para a criação de várias aplicações que contribuem para o desenvolvimento do setor de saúde. No momento, existem muitos programas para a automação da codificação clínica: análise em tempo real, previsão de custos, logística e planejamento de equipe, entre outros. Oferecemos soluções de software altamente especializadas para prever a codificação clínica:

Sistema de Suporte à Decisão As
aplicações especializadas em automação do processo de codificação clínica incluem sistemas de suporte à decisão baseados em modelos preditivos que possuem os seguintes recursos:

  • Ferramentas de software para o trabalho de codificadores clínicos.
  • .
  • QA- - .
  • .
  • , .



Uma auditoria clínica fornece a verificação da correção da codificação e sua conformidade com os critérios estabelecidos. Os resultados da auditoria são usados ​​para analisar o trabalho das instituições de saúde, compilar relatórios e desenvolver estratégias para aumentar sua eficácia. O desenvolvimento de estratégias de auditoria precisas e de alta qualidade presta atenção particular, local e internacionalmente. No entanto, no momento em que esse processo é realizado principalmente manualmente, é por isso que um grande número de erros comuns está associado. A automação de codificação pode ser eficaz nessa área, fornecendo assistência em:

  • Realização de auditorias programadas e periódicas.
  • Melhorando a precisão e o desempenho.
  • Identificação de padrões e tendências suspeitos.
  • Uma compreensão mais precisa do processo de codificação e da competência dos codificadores.
  • , .



Este artigo lança luz sobre os recursos da codificação clínica no campo da assistência médica e mostra a eficácia da automação desse processo. Entre a variedade de arquiteturas apresentadas, o modelo de conjunto de aprendizado profundo é mais adequado para essa tarefa. É capaz de aplicar com sucesso dados de várias fontes, tem boas perspectivas de desenvolvimento adicional e maior precisão, adicionando novos conjuntos de dados para análise. Ele usa, processa e modela dados em várias categorias, incluindo dados tabulares não estruturados, semiestruturados e estruturados. Como a área da codificação clínica é muito sensível a erros, um sistema adicional é usado para avaliar automaticamente a precisão das previsões em tempo real.

Quantificamos os modelos usando o banco de dados do Hospital Maharaja Nakhon (Chiang Mai), demonstrando seu enorme potencial na prática real de codificação clínica. Os modelos passaram pelo processo de aprendizado sem conhecer os resultados finais, o que é outra vantagem. Portanto, eles são capazes de realizar previsões consistentes e contínuas dos códigos da CID-10 com base em novas fontes de dados clínicos até a alta do paciente. Esse recurso fornece a capacidade de informar sobre a imagem atual do diagnóstico em tempo real. Esses modelos são capazes de aprender rapidamente quando novos registros médicos chegam.

Perspectivas adicionais


Estamos apenas nos estágios iniciais do desenvolvimento de sistemas de automação de codificação clínica e estamos abrindo novos horizontes para a introdução desse serviço em um grande número de instituições de saúde. Somos capazes de prestar assistência na construção de sistemas de suporte à decisão e demonstrar seus benefícios, além de integrar soluções em processos e sistemas modernos.

All Articles