Algorithmes d'IA et automatisation du codage clinique à titre d'exemple

Le codage clinique est un processus administratif dans lequel les données obtenues lors du diagnostic sont traduites (aujourd'hui, manuellement à l'aide d'ouvrages et de manuels de référence) dans les symboles de code correspondants. Les sources de données cliniques comprennent:

  • Données sur l'admission.
  • Données à la sortie.
  • Études pathologiques.
  • Etudes radiologiques.
  • Recettes

Une erreur de codage est une chose fréquente et a des conséquences désagréables (du retraitement du personnel et de la réduction du financement des hôpitaux à la perte de contrôle de l'épidémie), plus à ce sujet ci-dessous.

Graphiquement, le processus de codage peut être représenté sur la Fig. 1.



Fig. 1 - Processus de codage clinique La

CIM-10 est une norme de codage unifiée utilisée dans de nombreux pays du monde. L'abréviation CIM-10 signifie «10e édition de la Classification internationale des maladies et autres problèmes de santé», compilée par le personnel de l'Organisation mondiale de la santé. Le document contient des représentations codées de diverses maladies, leurs symptômes et signes, des écarts par rapport à la norme, ainsi que des plaintes, des circonstances sociales et des causes externes de blessures et de diverses maladies.

En règle générale, chaque code se compose de 7 caractères: 1-3 caractères sont utilisés pour indiquer la catégorie de la maladie, 4-6e caractères déterminent l'emplacement et la gravité, le 7e caractère est complémentaire. Dans certains pays, la désignation des codes peut varier. Dans un avenir proche, une transition vers la nouvelle norme CIM-11 avec des codes de maladies plus volumineux est attendue. Le document contiendra plus de 55 000 codes avec l'ajout de désignations de certains nouveaux cas cliniques et maladies mentales. Comprendre les nouvelles représentations et classifications du code est extrêmement important pour les pays, les territoires individuels et les organisations de santé afin de développer davantage l'industrie et d'attirer un financement adéquat.

Deux applications importantes du codage clinique:

  1. Facturation (gouvernement local et gouvernement de l'État, santé et assurance).
  2. Rapports (études épidémiologiques, politique de l'État, surveillance épidémiologique).


Les encodeurs cliniques vérifient soigneusement tous les dossiers médicaux pour les soins médicaux afin de déterminer les éléments suivants:

  • Le diagnostic principal.
  • Traitement secondaire (si effectué).
  • Identifié d'autres maladies.
  • Complications survenues.

Tout ce qui précède est affiché dans les codes correspondants conformément à la norme ICD-10.

Problèmes de codage clinique


L'exécution manuelle du processus de codage est associée à diverses difficultés, et cause généralement beaucoup de problèmes aux employés des institutions:

  • , : , - , .
  • , 4 .
  • . 8- 24 , .
  • , 70-75%. 1 , (AHIMA). , .
  • Le rapport entre la vitesse et la précision du codage . Ces deux paramètres sont interdépendants: plus la vitesse est élevée, plus la qualité est faible et vice versa.
  • Manque de personnel . Environ 52% seulement des codeurs cliniques fonctionnent de façon continue. De nombreuses agences utilisent la délocalisation pour réduire le nombre de cas en suspens.




Tableau 1: II Concours national de codage clinique ICD-10

Les conséquences des erreurs de codage cliniques


Les erreurs de classification et de codage clinique sont très courantes. Ils affectent de nombreux aspects du travail des institutions médicales, y compris le paiement du coût des soins médicaux fournis. Prenons un exemple avec l'appendicectomie (retrait d'appendice), l'option la plus courante pour la chirurgie d'urgence. Une représentation de code incomplète ou incorrecte de la transaction affecte considérablement le financement.

Exemple: un patient a été admis avec un diagnostic d'appendicite aiguë. Dans la période postopératoire, une infection de la plaie s'est développée. Le patient a reçu des antibiotiques par voie intraveineuse.




Tableau 2. Effet des erreurs de codage en cas d'appendicite purulente aiguë sur le financement.

Un exemple montre qu'une erreur de codage clinique peut entraîner un traitement excessif et une réduction du financement. Une autre conséquence grave d'un codage clinique incorrect est la perte de contrôle sur le développement des épidémies.

Est-il pratique d'utiliser des algorithmes d'IA pour le codage clinique?


Si l'IA peut conduire comme un humain, peut-elle gérer le codage clinique?

Au cours des dernières années, des succès importants ont été enregistrés dans l'application de l'IA dans divers domaines d'activité. Une petite excursion sur le sujet:

L'IA est un vaste domaine de connaissances sur les ordinateurs qui peut imiter les capacités humaines. Il permet aux machines d'utiliser les données pour la formation, éliminant ainsi le besoin de codage en dur pour effectuer des tâches spécifiques. L'IA permet aux ordinateurs d'apprendre en utilisant leur propre expérience. Les ordinateurs sont capables de traiter de grandes quantités de données et de remarquer des connexions plus profondes, offrant finalement un niveau de précision plus élevé que les humains. Tout cela est la base de résultats plus précis, qui sont la base de décisions plus éclairées.


Malgré les nombreuses difficultés auxquelles l'IA est confrontée dans l'industrie des soins de santé, elle peut jouer un rôle clé dans le codage clinique, offrant des avantages indéniables:

  • Coûts financiers réduits.
  • Meilleure cohérence.
  • Élimination des pénuries de personnel.
  • Mise en place d'un codage préclinique.
  • Accélérer le processus, qui à son tour conduira à un financement plus rapide.
  • Amélioration de la précision et de la portée des audits.

Le problème de la complexité des données médicales


De nombreux établissements et organisations de santé n'utilisent pas d'approche conceptuelle pour organiser et gérer la qualité des données, en particulier à long terme. La valeur des dossiers médicaux et des données qui en découlent augmente avec le temps. Même l'introduction des dossiers médicaux électroniques (DME) n'a pas simplifié le traitement des données en temps réel de manière adéquate, car la fonctionnalité du logiciel utilisé est très limitée.

Voici les principaux problèmes liés au traitement des données médicales:

  • Différents niveaux de qualité des dossiers médicaux électroniques.
  • Manque de compatibilité, ainsi que la complexité des systèmes cliniques.
  • La complexité du processus de collecte, de recherche et d'analyse des données.
  • La nécessité de traiter des données incomplètes ou manquantes.
  • Couverture et échantillonnage des données.
  • Exigences réglementaires et processus bureaucratiques.

Etudions maintenant

Cas de l'hôpital Maharaj Nakhon de Chiang Mai


Il s'agit d'un hôpital de formation à l'Université de Chiang Mai, situé dans la région de Muang à Chiang Mai dans la province de Chiang Mai. C'est le premier hôpital thaïlandais à l'extérieur de Bangkok, il a ouvert ses portes en 1941. Cet hôpital assez grand compte 1 400 lits, 69 lits en unité de soins intensifs et 92 lits supplémentaires, ainsi que 28 salles d'opération. Au cours de l'année, il y a plus de 45 000 patients hospitalisés, dont plus de 1 000 chirurgies à cœur ouvert et plus de 40 chirurgies de transplantation rénale. J'inscris plus de 1,3 million de patients dans les polycliniques de l'hôpital.

Complexité des données


Nous utilisons les données cliniques des référentiels de l'hôpital de Chiang Mai, enregistrées entre 2006 et 2019. Le tableau 3 contient quelques statistiques qui démontrent la complexité des informations traitées.



Tableau 3. Statistiques de l'ensemble de données de l'hôpital Maharaj Nakhon Chiang Mai.

Dans cet article, nous n'entrerons pas dans les détails et ne nous attarderons qu'aux points les plus significatifs:

  • Dans 42,5% des cas de soins médicaux, un ensemble unique de codes a été utilisé (seulement quelques cas avec des enregistrements identiques)
  • Les cas d'hospitalisation sont beaucoup plus complexes
  • Cas assez compliqués d'observation ambulatoire (pas d'antécédents médicaux)
  • Des ensembles complexes de codes (100 ou plus) sont utilisés dans plus de 70% des cas, comme indiqué sur la Fig. 2.




Figure. 2. La fréquence des 30 codes ICD-10 les plus courants dans l'ensemble des données stationnaires

Fig. 2 montre le problème dit de «longue queue» dans les 30 codes ICD-10 les plus courants. Comme vous pouvez le voir, la grande majorité des codes sont assez rares. Cette fonctionnalité complique l'apprentissage automatique, car la probabilité de modélisation de cas moins fréquents est plus faible.

Méthodes de traitement des sources de données


Chaque source de données présente les caractéristiques suivantes: format, type, niveau de difficulté. Pour cette raison, il est difficile de prétraiter les données et il y a un problème dans la formation de signaux prédictifs importants. De plus, il deviendra clair que les étapes du traitement et de la modélisation des données sont associées à un ensemble complexe de tâches tout aussi complexes qui doivent être résolues.



Tableau 4 - caractéristiques des sources de données et complexité de leur traitement Un

prétraitement des données a été effectué en relation avec différentes sources. Par exemple, pour le traitement, des données textuelles non structurées (rapports radiologiques ou autres) ont été utilisées, des données de laboratoire semi-structurées (sous divers formats, y compris du texte, des données numériques mixtes), des recettes structurées et des données tabulaires sur les admissions de patients.

Tâches d'automatisation


En raison de la complexité du traitement des données, comme indiqué ci-dessus, l'automatisation du processus de codage clinique est confrontée à un certain nombre de problèmes différents:
  • Un grand nombre de classificateurs uniques (plus de 12 000).
  • Absence de référence ou d'étalon or.
  • Manque d'ensembles de données accessibles au public.
  • Données déséquilibrées (nombreux cas rares).
  • La difficulté de trouver des moyens de combiner des données provenant de plusieurs sources différentes.


Possibilité d'utiliser des algorithmes d'apprentissage en profondeur (IA)


Le Deep Learning est l'une des approches les plus justifiées pour automatiser les processus de codage clinique.

Encore une petite excursion: l'apprentissage profond est une famille de méthodes d'apprentissage automatique basées sur des réseaux de neurones avec des capacités d'apprentissage représentatives élevées. Il s'agit d'un ensemble d'algorithmes qui imitent le travail du cerveau humain, à savoir: comment il transmet les demandes à travers diverses hiérarchies de concepts et de problèmes connexes pour trouver une solution au problème. Le deep learning a déjà été utilisé avec succès dans divers domaines: traitement d'image et vision par ordinateur, traitement du langage naturel (NLP), traduction automatique, système de pilote automatique, système de détection de fraude et autres.

La pertinence d'utiliser des algorithmes d'apprentissage automatique est due aux éléments suivants:

  • .
  • .
  • .
  • ( ).



Cette section traite de certaines architectures utilisées pour concevoir des modèles de codage prédictif ICD-10. Tout d'abord, nous formulons le problème de la classification par plusieurs étiquettes pour prédire les codes de la CIM-10. Pour prédire les probabilités de chaque code ICD-10, nous utilisons l'architecture d'un réseau neuronal de communication directe. Ensuite, la correspondance des codes ICD-10 prévus avec les valeurs les plus probables sera établie.

L'architecture de modélisation intuitive consiste à collecter toutes les données disponibles à partir de diverses sources et à former un réseau unique. Cela reflétera les interactions entre les différents types de données et leur relation avec le diagnostic final. Cette architecture de modélisation est appelée le modèle combiné, qui sera utilisé dans la section avec les résultats.

Figure. 3 montre la structure graphique d'un modèle combiné. Étant donné que plusieurs sources de données sont utilisées à la fois, cette architecture ne peut pas être considérée comme la meilleure. Étant donné que les sources de données diffèrent dans leur complexité, cela conduit à la construction d'un réseau trop complexe avec des hyperparamètres de réglage fin à travers de nombreuses itérations, ainsi qu'à l'expérimentation avec un nombre différent de couches et de fonctions de perte. Ainsi, la modalité des données ne sera pas suffisamment étudiée.



Figure. 3. La structure du modèle combiné

La deuxième architecture contient plusieurs réseaux qui apprennent à interagir avec des sources de données individuelles, comme le montre la Fig. 4. Ensuite, les données de prévision obtenues de chaque réseau sont agrégées à l'aide de méthodes de moyenne ou de valeurs moyennes pondérées. Cela conduit à l'absence de dominance des représentations représentatives ou plus petites des données provenant de différentes sources dans l'espace des attributs dans le processus d'apprentissage. Cependant, cela affecte négativement l'adoption des bonnes décisions, car la sélection directe d'une source basée sur la fusion tardive des connaissances après avoir reçu un avis de chaque source de données est moins informative.



Figure. 4. La structure du modèle de moyenne

Par conséquent, nous nous tournons vers l'architecture de la modélisation d'ensemble, illustrée à la Fig. 5. La structure du modèle doit être telle qu'elle vous permette de déterminer de manière fiable les différentes modalités des données avec leurs différents niveaux de complexité, ainsi que d'examiner en profondeur les relations établies entre elles. Notre réseau, construit sur des modèles formés individuellement, est appelé «ensemble» ou «expert». Elle imite le travail des codeurs cliniques, utilise tous les types de données cliniques, prend des décisions concernant le diagnostic final.

En fait, le réseau recevra des connaissances d'experts de réseaux déjà formés, ce qui est plus efficace que l'étude de sources individuelles. Le réseau d'ensemble s'appuiera sur l'expérience de chaque spécialiste (pathologiste, radiologue, pharmacien et autres) sur de nombreuses itérations, acquérant les connaissances nécessaires pour poser un diagnostic. En outre, elle a la capacité de formuler de nouveaux diagnostics, de recevoir des données prédictives de réseaux individuels et de ne pas simplement prendre en compte la prédiction avec le coefficient de poids le plus élevé basé sur une seule source.



Figure. 5. La structure du modèle d'ensemble

Résultats préliminaires


Cette section présente les mesures utilisées pour quantifier la précision des modèles décrits ci-dessus, ainsi que les résultats expérimentaux.

Mesures d'évaluation


Contrairement aux classifications binaires et multiclasses, l'évaluation de l'efficacité de la classification selon plusieurs critères dépend de ceux qui sont corrects. Pour vérifier le comportement du modèle dans diverses situations, ils utilisent différentes approches pour vérifier les résultats afin d'identifier les erreurs causées par un codage insuffisant ou excessif. Compte tenu de ce qui précède, les mesures d'évaluation suivantes sont utilisées:

  • Précision moyenne - Précision moyenne pondérée pour chaque valeur de seuil obtenue en additionnant les valeurs sur la courbe de retour de précision.
  • Erreur de couverture - une valeur caractérisant la durée d'une évaluation de classement suffisante pour couvrir toutes les étiquettes.
  • – y_score, , .
  • F1 – .
  • – , .
  • – , .



Le tableau 5 montre une amélioration progressive de la performance globale du modèle pour tous les indicateurs de performance clés. Quantitativement, cela se traduit par une amélioration de 4 à 5% de l'ensemble de données sur le traitement des patients hospitalisés et une amélioration de 2 à 3% du traitement des données des patients externes. Différentes sources apportent diverses contributions à la précision du modèle. Par exemple, les données tirées des ordonnances sont les plus informatives. Pour chaque source, un modèle d'une certaine complexité est utilisé, et un temps et des itérations différents sont nécessaires pour une étude précise. Les réseaux profonds sont capables de trouver le minimum optimal dans certaines modalités de données plus rapidement que d'autres. Par conséquent, pour améliorer la précision, ils utilisent la méthode d'apprentissage de chaque modalité séparément pour coder au maximum les niveaux de variabilité de la complexité des données.

D'un autre côté, le modèle présenté est capable d'atteindre la précision du niveau d'une personne dans les diagnostics primaires, en particulier lorsque vous travaillez avec des données provenant d'un hôpital. Ceci est important pour diverses applications du codage clinique, par exemple pour la facturation, basées principalement sur le diagnostic correct.



Tableau 5. Précision de codage automatisée

Le tableau 6 présente 5 maladies majeures triées par degré de précision. La précision des trois premières catégories de données sur les soins hospitaliers dépasse 90%. Concernant les cas associés à la détection de néoplasmes chez les patients (environ 30% des données), une précision très encourageante d'environ 80% a été obtenue. Malgré les indicateurs de performance inférieurs du modèle pour les données ambulatoires, la précision dépasse toujours 60% (environ 65% en moyenne), ce qui en soi est un grand pas en avant.



Tableau 6. Précision du modèle pour les 5 cas de diagnostic de haut niveau les plus courants

Conscience de soi de la performance du modèle


La construction et l'évaluation de l'efficacité des modèles d'apprentissage automatique s'effectuent au cours de leur formation / évaluation. Pour l'évaluation en utilisant des données sélectionnées au hasard. Cependant, évaluer la précision des prévisions actuelles en temps réel est très difficile. Pour résoudre le problème, un critère est introduit qui évalue la confiance du modèle dans ses propres prévisions. Par exemple, il sera utile de savoir que la précision du modèle est appropriée pour les cas de soins médicaux simples et insuffisante pour les cas médicaux complexes. Cela pourrait servir de signal pour revérifier manuellement un cas particulier par une personne.

Nous proposons un modèle d'évaluation de la confiance en combinaison avec un modèle de prédiction de code ICD-10. En figue. La figure 6 montre un réseau d'évaluation de validation. Nous menons un processus de formation pour détecter les incohérences entre les codes prévus et réels, en tenant compte de toutes les données d'entrée. Ainsi, le modèle est capable d'évaluer la fiabilité des prévisions en tenant compte des données initiales, du degré de complexité d'un cas particulier et de la probabilité d'obtenir de «bonnes» et «mauvaises» prévisions.



Figure. 6. La structure du modèle pour évaluer le degré de fiabilité

Le tableau 7 contient les résultats du test d'un réseau de notes de confiance pour diverses données de l'ensemble. Ainsi, chaque prévision contient une évaluation de sa fiabilité. Par exemple, la précision des prévisions supérieure à 97% est observée dans 3% des cas, 85% - dans 50% des cas. L'évaluation de la fiabilité vous permet d'automatiser le processus d'attribution d'une assistance tierce lorsqu'elle est requise. Le modèle présenté se caractérise par la conscience de soi, est facilement lancé et évalué par les utilisateurs en temps réel.



Tableau 7. Fiabilité d'une estimation de divers ensembles de données

Principales caractéristiques:

  • La modélisation d'ensemble, combinée à un réseau d'experts pour sélectionner les meilleures prévisions, est supérieure aux autres méthodes de modélisation.
  • , , , .
  • 4% .
  • ( ), 1%.
  • , ,
  • , .
  • 80% 50% ( , ).
  • , ( ).
  • , .


,


Le résultat peut servir de base à la création d'un certain nombre d'applications qui contribuent au développement ultérieur du secteur de la santé. À l'heure actuelle, il existe de nombreux programmes pour l'automatisation du codage clinique: analyse en temps réel, prévision des coûts, logistique et planification du personnel, etc. Nous proposons des solutions logicielles hautement spécialisées pour la prédiction du codage clinique:

Système d'aide à la décision Les
applications spécialisées dans l'automatisation du processus de codage clinique comprennent des systèmes d'aide à la décision basés sur des modèles prédictifs qui ont les capacités suivantes:

  • Outils logiciels pour le travail des encodeurs cliniques.
  • .
  • QA- - .
  • .
  • , .



Un audit clinique permet de vérifier l'exactitude du codage et sa conformité aux critères établis. Les résultats de l'audit sont utilisés pour analyser le travail des établissements de santé, compiler des rapports et développer des stratégies pour accroître son efficacité. Le développement de stratégies d'audit précises et de haute qualité accorde une attention particulière aux niveaux local et international. Cependant, pour le moment, ce processus est effectué principalement manuellement, c'est pourquoi un grand nombre d'erreurs courantes sont associées. L'automatisation du codage peut être efficace dans ce domaine, en fournissant une assistance dans:

  • Réalisation d'audits programmés et périodiques.
  • Amélioration de la précision et des performances.
  • Identification des tendances et tendances suspectes.
  • Une compréhension plus précise du processus de codage et de la compétence des codeurs.
  • , .



Cet article met en lumière les caractéristiques du codage clinique dans le domaine de la santé et montre l'efficacité de l'automatisation de ce processus. Parmi la gamme d'architectures présentées, le modèle d'ensemble d'apprentissage en profondeur est le mieux adapté à cette tâche. Il est capable d'appliquer avec succès des données provenant de diverses sources, a de bonnes perspectives de développement et une précision accrue en ajoutant de nouveaux ensembles de données pour l'analyse. Il utilise, traite et modélise des données dans différentes catégories, y compris des données tabulaires non structurées, semi-structurées et structurées. Le domaine du codage clinique étant très sensible aux erreurs, un système supplémentaire est utilisé pour évaluer automatiquement la précision des prévisions en temps réel.

Nous avons quantifié les modèles à l'aide de la base de données de l'hôpital Maharaja Nakhon (Chiang Mai), démontrant leur énorme potentiel dans la pratique réelle de codage clinique. Les modèles ont suivi le processus d'apprentissage sans connaître les résultats finaux, ce qui est un autre avantage. Par conséquent, ils sont capables d'effectuer une prédiction cohérente et continue des codes de la CIM-10 sur la base de nouvelles sources de données cliniques jusqu'à la sortie du patient. Cette fonction offre la possibilité d'informer sur l'image de diagnostic actuelle en temps réel. Ces modèles sont capables d'apprendre à la volée à mesure que de nouveaux dossiers médicaux arrivent.

Perspectives supplémentaires


Nous n'en sommes qu'aux étapes initiales du développement des systèmes d'automatisation du codage clinique et ouvrons de nouveaux horizons pour introduire ce service dans un grand nombre d'établissements de santé. Nous sommes en mesure de fournir une assistance dans la construction de systèmes d'aide à la décision et de démontrer leurs avantages, ainsi que d'intégrer des solutions dans des processus et des systèmes modernes.

All Articles