Traduction du livre d'Andrew Un, Passion for Machine Learning, chapitres 34 et 35

chapitres précédents


34. Comment déterminer le niveau de qualité accessible à l'homme


Supposons que vous travaillez sur une application d'imagerie mĂ©dicale qui devrait effectuer des diagnostics radiographiques automatiques. L'erreur d'une personne ordinaire sans formation mĂ©dicale, Ă  l'exception d'une formation de base, est d'environ 15%. L'erreur d'un mĂ©decin dĂ©butant est d'environ 10%. Un mĂ©decin expĂ©rimentĂ© se trompe dans 5% des cas. L'erreur d'une petite Ă©quipe de mĂ©decins Ă©tudiant et discutant chaque image ne dĂ©passe pas 2%. Lequel de ces chiffres devrait ĂȘtre considĂ©rĂ© comme le "niveau de qualitĂ© humaine"?


Dans ce cas, je prendrais 2% pour le niveau de qualité disponible pour une personne et établir la valeur d'erreur optimale correspondante. Il est également logique de définir 2% comme niveau d'erreur souhaité pour notre systÚme, car cette valeur d'erreur répond aux trois critÚres décrits dans le chapitre précédent pour les systÚmes qui vous permettent de comparer la qualité de l'algorithme avec la qualité de la tùche effectuée par une personne:


  • FacilitĂ© de balisage des donnĂ©es : vous pouvez utiliser une Ă©quipe de mĂ©decins pour baliser les donnĂ©es avec une prĂ©cision de 98% (erreur de 2%)
  • Analyse des erreurs Ă  l'aide de l'intuition humaine : lorsque vous discutez des radiographies avec une Ă©quipe de mĂ©decins, vous pouvez vous fier Ă  leur intuition lorsque vous recherchez des moyens d'amĂ©liorer la qualitĂ©
  • Utilisation du niveau d’achĂšvement des tĂąches d’une personne pour Ă©tablir le niveau d’erreur optimal et pour dĂ©terminer le «niveau d’erreur souhaité» rĂ©alisable du systĂšme : il est conseillĂ© d’utiliser 2% comme estimation du niveau d’erreur optimal. Le niveau d'erreur optimal peut mĂȘme ĂȘtre infĂ©rieur Ă  2%, mais il ne peut certainement pas ĂȘtre supĂ©rieur en raison du fait qu'un tel niveau d'erreur correspond Ă  la qualitĂ© des diagnostics disponibles pour les spĂ©cialistes et qu'il est inutile de dĂ©finir 5% ou 10% d'erreur pour le systĂšme automatique comme niveau cible, car nous savons avec certitude que nous atteindrons un niveau de qualitĂ© dĂ©libĂ©rĂ©ment plus Ă©levĂ©.

, , . , .


40%, , ( 10%) ( 5%) . 10%, , 2% , .


35. ,


. , 10% . , 8% . - , 33 ?


, , , . , , , .


, :


  1. , ,
  2. , ,
  3. « » .

, , , , , . , , , .


Il existe de nombreuses applications d'apprentissage automatique importantes dans lesquelles les algorithmes sont supĂ©rieurs aux humains. Par exemple, les voitures peuvent mieux prĂ©voir les classements des films, le temps de trajet en voiture et le remboursement des prĂȘts. Dans les cas oĂč il est difficile pour les gens de trouver des exemples dans lesquels l'algorithme est clairement erronĂ©, seul un nombre limitĂ© de mĂ©thodes peuvent ĂȘtre appliquĂ©es pour amĂ©liorer la qualitĂ©. Par consĂ©quent, lorsque l'on travaille sur un systĂšme qui a dĂ©jĂ  dĂ©passĂ© les humains, les progrĂšs progressent gĂ©nĂ©ralement plus lentement que lorsque les algorithmes doivent encore atteindre le niveau humain.


continuation

Source: https://habr.com/ru/post/undefined/


All Articles