Algoritmos de IA y automatización de codificación clínica como ejemplo

La codificación clínica es un proceso administrativo en el que los datos obtenidos durante el diagnóstico se traducen (hoy, de forma manual utilizando libros de referencia y manuales) a los símbolos de código correspondientes. Las fuentes de datos clínicos incluyen:

  • Datos de admisión.
  • Datos al alta.
  • Estudios patológicos.
  • Estudios radiológicos.
  • Recetas

Un error en la codificación es algo frecuente y tiene consecuencias desagradables (desde el reprocesamiento del personal y la reducción de los fondos del hospital hasta la pérdida de control sobre la epidemia), más sobre esto a continuación.

Gráficamente, el proceso de codificación se puede representar en la Fig. 1.



Fig. 1 - Proceso de codificación clínica

ICD-10 es un estándar de codificación unificado utilizado en muchos países del mundo. La abreviatura ICD-10 significa "décima edición de la Clasificación Internacional de Enfermedades y Otros Problemas de Salud", compilada por el personal de la Organización Mundial de la Salud. El documento contiene representaciones en código de diversas enfermedades, sus síntomas y signos, desviaciones de la norma, así como quejas, circunstancias sociales y causas externas de lesiones y diversas enfermedades.

Como regla general, cada código consta de 7 caracteres: se utilizan 1-3 caracteres para indicar la categoría de la enfermedad, los caracteres 4-6 determinan la ubicación y la gravedad, el séptimo carácter es complementario. En algunos países, la designación de los códigos puede variar. En un futuro cercano, se espera una transición al nuevo estándar ICD-11 con códigos de enfermedades más voluminosos. El documento contendrá más de 55,000 códigos con la adición de designaciones de algunos nuevos casos clínicos y enfermedades mentales. Comprender las nuevas representaciones y clasificaciones del código es extremadamente importante para que los países, territorios individuales y organizaciones de salud desarrollen aún más la industria y atraigan fondos adecuados.

Dos aplicaciones importantes de la codificación clínica:

  1. Facturación (gobierno local y gobierno estatal, salud y seguros).
  2. Informes (estudios epidemiológicos, política estatal, vigilancia epidemiológica).


Los codificadores clínicos revisan cuidadosamente todos los registros médicos para atención médica para determinar lo siguiente:

  • El diagnóstico principal.
  • Tratamiento secundario (si se realiza).
  • Identificado otras enfermedades.
  • Complicaciones que surgen.

Todo lo anterior se muestra en los códigos correspondientes de acuerdo con el estándar ICD-10.

Problemas de codificación clínica


La ejecución manual del proceso de codificación está asociada con varias dificultades y, en general, causa muchos problemas a los empleados de las instituciones:

  • , : , - , .
  • , 4 .
  • . 8- 24 , .
  • , 70-75%. 1 , (AHIMA). , .
  • La relación de velocidad y precisión de codificación . Estos dos parámetros están interrelacionados: cuanto mayor es la velocidad, menor es la calidad y viceversa.
  • Falta de personal . Solo alrededor del 52% de los codificadores clínicos funcionan de manera continua. Muchas agencias utilizan la deslocalización para reducir la cantidad de casos pendientes.




Tabla 1: II Concurso Nacional de Codificación Clínica ICD-10

Las consecuencias de los errores de codificación clínica.


Los errores en la clasificación y la codificación clínica son muy comunes. Afectan muchos aspectos del trabajo de las instituciones médicas, incluido el pago del costo de la atención médica brindada. Considere un ejemplo con apendicectomía (extirpación del apéndice), la opción más común para cirugía de emergencia. La representación incompleta o incorrecta del código de la transacción afecta significativamente el financiamiento.

Ejemplo: un paciente ingresó con un diagnóstico de apendicitis aguda. En el postoperatorio, se desarrolló infección de la herida. Al paciente se le recetaron antibióticos por vía intravenosa.




Tabla 2. El efecto de los errores de codificación en el caso de apendicitis purulenta aguda en el financiamiento.

Un ejemplo muestra que un error de codificación clínica puede conducir a un procesamiento excesivo y a una reducción de la financiación. Otra consecuencia grave de la codificación clínica incorrecta es la pérdida de control sobre el desarrollo de epidemias.

¿Qué tan práctico es usar algoritmos de IA para la codificación clínica?


Si la IA puede conducir como un humano, ¿puede manejar la codificación clínica?

En los últimos años, se ha logrado un éxito significativo en la aplicación de IA en varios campos de actividad. Una pequeña excursión al tema:

La IA es un área extensa de conocimiento sobre las computadoras que pueden imitar las capacidades humanas. Permite que las máquinas usen datos para el entrenamiento, eliminando la necesidad de una codificación rígida para realizar tareas específicas. La IA permite que las computadoras aprendan usando su propia experiencia. Las computadoras son capaces de procesar grandes cantidades de datos y notan conexiones más profundas, en última instancia, proporcionan un mayor nivel de precisión en comparación con los humanos. Todo esto es la base para resultados más precisos, que son la base para decisiones más informadas.


A pesar de las muchas dificultades que enfrenta la IA en la industria de la salud, puede desempeñar un papel clave en la codificación clínica, proporcionando algunas ventajas innegables:

  • Menores costos financieros.
  • Mejor consistencia.
  • Eliminación de la escasez de personal.
  • Implementación de codificación preclínica.
  • Acelerar el proceso, que a su vez conducirá a una financiación más rápida.
  • Mejora de la precisión y el alcance de las auditorías.

El problema de la complejidad de los datos médicos.


Muchos establecimientos y organizaciones de salud no utilizan un enfoque conceptual para organizar y gestionar la calidad de los datos, especialmente a largo plazo. El valor de los registros médicos y los datos basados ​​en ellos crece con el tiempo. Incluso la introducción de registros médicos electrónicos (EMR) no ha simplificado el procesamiento de datos en tiempo real de manera adecuada, porque la funcionalidad del software utilizado es muy limitada.

Estos son los principales problemas con el procesamiento de datos médicos:

  • Diferentes niveles de calidad de registros médicos electrónicos.
  • Falta de compatibilidad, así como la complejidad de los sistemas clínicos.
  • La complejidad del proceso de recopilación, búsqueda y análisis de datos.
  • La necesidad de procesar datos incompletos o faltantes.
  • Cobertura y muestreo de datos.
  • Requisitos reglamentarios y procesos burocráticos.

Ahora estudiemos

Caso del Hospital Maharaj Nakhon en Chiang Mai


Este es un hospital de entrenamiento en la Universidad de Chiang Mai, ubicado en la región de Muang de Chiang Mai en la provincia de Chiang Mai. Este es el primer hospital tailandés fuera de Bangkok, lo abrió en 1941. Este hospital bastante grande tiene 1,400 camas, 69 camas en la unidad de cuidados intensivos y 92 camas adicionales, así como 28 quirófanos. Durante el año, hay más de 45,000 casos de pacientes hospitalizados, que incluyen más de 1,000 cirugías de corazón abierto y más de 40 cirugías de trasplante de riñón. Inscribo a más de 1.3 millones de pacientes en los hospitales de la clínica.

Complejidad de datos


Utilizamos datos clínicos de los repositorios del Hospital Chiang Mai, registrados entre 2006 y 2019. La Tabla 3 contiene algunas estadísticas que demuestran la complejidad de la información que se procesa.



Tabla 3. Estadísticas del conjunto de datos del hospital Maharaj Nakhon Chiang Mai.

En este artículo no entraremos en detalles específicos y prestaremos atención solo a los puntos más significativos:

  • En el 42.5% de los casos de atención médica, se utilizó un conjunto único de códigos (solo unos pocos casos con registros idénticos)
  • Los casos de pacientes hospitalizados son significativamente más complejos
  • Casos bastante complicados de observación ambulatoria (sin historial médico)
  • Conjuntos complejos de códigos (100 o más) se utilizan en más del 70% de los casos, como se indica en la Fig. 2)




Higo. 2. La frecuencia de los 30 códigos ICD-10 más comunes en el conjunto de datos estacionarios

Fig. 2 muestra el llamado problema de "cola larga" en los 30 códigos ICD-10 más comunes. Como puede ver, la gran mayoría de los códigos son bastante raros. Esta característica complica el aprendizaje automático, ya que la probabilidad de modelar casos menos frecuentes es menor.

Formas de procesar fuentes de datos


Cada fuente de datos tiene las siguientes características: formato, tipo, nivel de dificultad. Debido a esto, es difícil procesar previamente los datos, y existe un problema en la formación de señales predictivas significativas. Además, quedará claro que las etapas de procesamiento y modelado de datos están asociadas con un complejo de tareas igualmente complejas que deben resolverse.



Tabla 4 - características de las fuentes de datos y la complejidad de su procesamiento

El preprocesamiento de los datos se realizó para varias fuentes. Por ejemplo, para el procesamiento, se utilizaron datos de texto no estructurados (informes radiológicos u otros), datos de laboratorio semiestructurados (en varios formatos, incluyendo texto, datos numéricos mixtos), recetas estructuradas y datos tabulares sobre ingresos de pacientes.

Tareas de automatización


Debido a la complejidad del procesamiento de datos, como se muestra arriba, la automatización del proceso de codificación clínica enfrenta una serie de problemas diferentes:
  • Una gran cantidad de clasificadores únicos (más de 12,000).
  • Falta de referencia o estándar de oro.
  • Falta de conjuntos de datos disponibles públicamente.
  • Datos desequilibrados (muchos casos raros).
  • La dificultad de encontrar formas de combinar datos de varias fuentes diferentes.


Facilidad de uso de algoritmos de aprendizaje profundo (AI)


Deep Learning es uno de los enfoques más justificados para automatizar los procesos de codificación clínica.

Una vez más, una pequeña excursión: el aprendizaje profundo es una familia de métodos de aprendizaje automático basados ​​en redes neuronales con altas capacidades de aprendizaje representativas. Este es un conjunto de algoritmos que imitan el trabajo del cerebro humano, a saber: cómo pasa las solicitudes a través de diversas jerarquías de conceptos y problemas relacionados para encontrar una solución al problema. El aprendizaje profundo ya se ha utilizado con éxito en varios campos: procesamiento de imágenes y visión por computadora, procesamiento de lenguaje natural (PNL), traducción automática, sistema de piloto automático, sistema de detección de fraude y otros.

La conveniencia de usar algoritmos de aprendizaje automático se debe a lo siguiente:

  • .
  • .
  • .
  • ( ).



Esta sección analiza algunas arquitecturas utilizadas para diseñar modelos de codificación predictiva ICD-10. En primer lugar, formulamos el problema de clasificación mediante varias etiquetas para predecir los códigos ICD-10. Para predecir las probabilidades de cada código ICD-10, utilizamos la arquitectura de una red neuronal de comunicación directa. A continuación, se establecerá la correspondencia de los códigos ICD-10 predichos con los valores más probables.

La arquitectura de modelado intuitiva consiste en recopilar todos los datos disponibles de varias fuentes y entrenar una sola red. Esto reflejará las interacciones entre los diferentes tipos de datos y su relación con el diagnóstico final. Esta arquitectura de modelado se denomina modelo combinado, que se utilizará en la sección con los resultados.

Higo. 3 muestra la estructura gráfica de un modelo combinado. Dado que se utilizan varias fuentes de datos a la vez, esta arquitectura no puede considerarse la mejor. Como las fuentes de datos difieren en su complejidad, esto lleva a la construcción de una red demasiado compleja con hiperparámetros de ajuste fino a través de muchas iteraciones, así como a la experimentación con un número diferente de capas y funciones de pérdida. Por lo tanto, la modalidad de los datos no se estudiará suficientemente bien.



Higo. 3. La estructura del modelo combinado.

La segunda arquitectura contiene varias redes que aprenden a interactuar con fuentes de datos individuales, como se muestra en la Fig. 4. Luego, los datos de pronóstico obtenidos de cada red se agregan utilizando métodos de promedio o valores promedio ponderados. Esto conduce a la falta de dominio de representaciones representativas o más pequeñas de datos de diferentes fuentes en el espacio de atributos en el proceso de aprendizaje. Sin embargo, esto afecta negativamente la adopción de las decisiones correctas, ya que la selección directa de una fuente basada en la fusión tardía del conocimiento después de recibir una opinión de cada fuente de datos es menos informativa.



Higo. 4. La estructura del modelo de promedio.

Por lo tanto, pasamos a la arquitectura de modelado de conjunto, que se muestra en la Fig. 5. La estructura del modelo debe ser tal que le permita determinar de manera confiable las diversas modalidades de los datos con sus diferentes niveles de complejidad, así como examinar a fondo las relaciones establecidas entre ellos. Nuestra red, construida sobre modelos entrenados individualmente, se llama "conjunto" o "experto". Ella imita el trabajo de los codificadores clínicos, utiliza todo tipo de datos clínicos, toma decisiones con respecto al diagnóstico final.

De hecho, la red recibirá conocimiento experto de redes ya capacitadas, lo cual es más efectivo que estudiar fuentes individuales. La red del conjunto se basará en la experiencia de cada especialista (patólogo, radiólogo, farmacéutico y otros) en muchas iteraciones, obteniendo los conocimientos necesarios para hacer un diagnóstico. Además, tiene la capacidad de formular nuevos diagnósticos, recibir datos predictivos de redes individuales y no solo tener en cuenta la predicción con el coeficiente de peso más alto en función de cualquier fuente.



Higo. 5. La estructura del modelo de conjunto.

Resultados preliminares


Esta sección presenta las medidas utilizadas para cuantificar la precisión de los modelos descritos anteriormente, así como los resultados experimentales.

Medidas de evaluación


A diferencia de las clasificaciones binarias y multiclase, evaluar la efectividad de la clasificación por varios criterios depende de cuál de estos criterios sea correcto. Para verificar cómo se comportará el modelo en diversas situaciones, utilizan diferentes enfoques para verificar los resultados para identificar errores causados ​​por una codificación insuficiente o excesiva. En vista de lo anterior, se utilizan las siguientes medidas de evaluación:

  • Precisión media: la precisión promedio ponderada para cada valor umbral obtenido al sumar los valores en la curva de retorno de precisión.
  • Error de cobertura: un valor que caracteriza la duración de una evaluación de clasificación suficiente para cubrir todas las etiquetas.
  • – y_score, , .
  • F1 – .
  • – , .
  • – , .



La Tabla 5 muestra una mejora gradual en el desempeño general del modelo para todos los indicadores clave de desempeño. Cuantitativamente, esto se traduce en una mejora del 4–5% para el conjunto de datos de tratamiento hospitalario y una mejora del 2–3% en el procesamiento de datos ambulatorios. Diferentes fuentes hacen diversas contribuciones a la precisión del modelo. Por ejemplo, los datos tomados de las recetas son los más informativos. Para cada fuente, se utiliza un modelo de cierta complejidad, y se requiere una cantidad de tiempo e iteraciones diferentes para un estudio exacto. Las redes profundas pueden encontrar el mínimo óptimo en algunas modalidades de datos más rápido que otras. Por lo tanto, para mejorar la precisión, utilizan el método de entrenamiento de cada modalidad por separado para codificar los niveles de variabilidad de la complejidad de los datos al máximo.

Por otro lado, el modelo presentado es capaz de lograr la precisión del nivel de una persona en el diagnóstico primario, especialmente cuando se trabaja con datos de un hospital. Esto es importante para diversas aplicaciones de codificación clínica, por ejemplo, para facturación, basadas principalmente en el diagnóstico correcto.



Tabla 5. Precisión de codificación automatizada

La Tabla 6 presenta 5 enfermedades principales clasificadas por grado de precisión. La precisión de las tres primeras categorías de datos de atención hospitalaria es superior al 90%. Con respecto a los casos asociados con la detección de neoplasias en pacientes (aproximadamente el 30% de los datos), se obtuvo una precisión muy alentadora de aproximadamente el 80%. A pesar de los indicadores de rendimiento más bajos del modelo para datos ambulatorios, la precisión aún excedió el 60% (aproximadamente 65% en promedio), lo que en sí mismo es un gran paso adelante.



Tabla 6. Precisión del modelo para los 5 casos de diagnóstico de alto nivel más comunes

Modelo de autoconciencia del rendimiento


La construcción y evaluación de la efectividad de los modelos de aprendizaje automático se lleva a cabo en el proceso de su capacitación / evaluación. Para la evaluación utilizando datos seleccionados al azar. Sin embargo, evaluar la precisión de los pronósticos actuales en tiempo real es muy difícil. Para resolver el problema, se introduce un criterio que evalúa la confianza del modelo en su propio pronóstico. Por ejemplo, será útil saber que la precisión del modelo es apropiada para casos de atención médica simples e insuficiente para casos médicos complejos. Esto podría servir como señal para que una persona vuelva a verificar un caso en particular manualmente.

Proponemos un modelo de evaluación de confianza en combinación con un modelo de predicción de código ICD-10. En la Fig. La Figura 6 muestra una red de evaluación de validación. Llevamos a cabo un proceso de capacitación para detectar inconsistencias entre los códigos predichos y los reales, teniendo en cuenta todos los datos de entrada. Por lo tanto, el modelo puede evaluar la fiabilidad del pronóstico teniendo en cuenta los datos iniciales, el grado de complejidad de un caso particular y la probabilidad de obtener pronósticos "buenos" y "malos".



Higo. 6. La estructura del modelo para evaluar el grado de confiabilidad.

La Tabla 7 contiene los resultados de probar una red de clasificaciones de confianza para varios datos del conjunto. Entonces, cada pronóstico contiene una evaluación de su confiabilidad. Por ejemplo, la precisión del pronóstico superior al 97% se observa en el 3% de los casos, el 85%, en el 50% de los casos. La evaluación de confiabilidad le permite automatizar el proceso de atraer asistencia de terceros cuando sea necesario. El modelo presentado se caracteriza por la autoconciencia, los usuarios lo lanzan y evalúan fácilmente en tiempo real.



Tabla 7. Fiabilidad de una estimación de varios conjuntos de datos

Características clave:

  • El modelado de conjunto, combinado con una red experta para seleccionar el mejor pronóstico, es superior a otros métodos de modelado.
  • , , , .
  • 4% .
  • ( ), 1%.
  • , ,
  • , .
  • 80% 50% ( , ).
  • , ( ).
  • , .


,


El resultado puede ser la base para crear una serie de aplicaciones que contribuyan al desarrollo posterior del sector de la salud. En este momento, hay muchos programas para la automatización de la codificación clínica: análisis en tiempo real, pronóstico de costos, logística y planificación del personal, y otros. Ofrecemos soluciones de software altamente especializadas para predecir la codificación clínica:

sistema de soporte de decisiones Las
aplicaciones especializadas en la automatización del proceso de codificación clínica incluyen sistemas de soporte de decisión basados ​​en modelos predictivos que tienen las siguientes capacidades:

  • Herramientas de software para el trabajo de codificadores clínicos.
  • .
  • QA- - .
  • .
  • , .



Una auditoría clínica proporciona la verificación de la corrección de la codificación y su cumplimiento de los criterios establecidos. Los resultados de la auditoría se utilizan para analizar el trabajo de las instituciones de salud, compilar informes y desarrollar estrategias para aumentar su efectividad. El desarrollo de estrategias de auditoría precisas y de alta calidad presta especial atención tanto a nivel local como internacional. Sin embargo, en este momento este proceso se realiza principalmente de forma manual, por lo que se asocia una gran cantidad de errores comunes. La automatización de la codificación puede ser efectiva en esta área, proporcionando asistencia en:

  • Realización de auditorías programadas y periódicas.
  • Mejora de la precisión y el rendimiento.
  • Identificación de patrones y tendencias sospechosas.
  • Una comprensión más precisa del proceso de codificación y la competencia de los codificadores.
  • , .



Este artículo arroja luz sobre las características de la codificación clínica en el campo de la asistencia sanitaria y muestra la eficacia de la automatización de este proceso. Entre la gama de arquitecturas presentadas, el modelo de conjunto de aprendizaje profundo es el más adecuado para esta tarea. Puede aplicar con éxito datos de varias fuentes, tiene buenas perspectivas para un mayor desarrollo y una mayor precisión al agregar nuevos conjuntos de datos para el análisis. Utiliza, procesa y modela datos en varias categorías, incluidos datos tabulados no estructurados, semiestructurados y estructurados. Dado que el área de codificación clínica es muy sensible a los errores, se utiliza un sistema adicional para evaluar automáticamente la precisión de los pronósticos en tiempo real.

Cuantificamos los modelos utilizando la base de datos del Hospital Maharaja Nakhon (Chiang Mai), demostrando su enorme potencial en la práctica real de codificación clínica. Los modelos pasaron por el proceso de aprendizaje sin conocer los resultados finales, lo cual es otra ventaja. Por lo tanto, pueden realizar predicciones constantes y continuas de los códigos ICD-10 en base a nuevas fuentes de datos clínicos hasta el alta del paciente. Esta característica proporciona la capacidad de informar sobre la imagen de diagnóstico actual en tiempo real. Estos modelos son capaces de aprender sobre la marcha a medida que llegan nuevos registros médicos.

Perspectivas adicionales


Solo estamos en las etapas iniciales del desarrollo de los sistemas de automatización de codificación clínica y estamos abriendo nuevos horizontes para presentar este servicio a un gran número de instituciones de atención médica. Podemos brindar asistencia en la construcción de sistemas de soporte de decisiones y demostrar sus beneficios, así como integrar soluciones en procesos y sistemas modernos.

All Articles