Podcast: ce qui attend les scientifiques débutants dans le domaine de la défense

Comme promis , nous fournissons une transcription complète de la première version de notre podcast ( vous pouvez l'écouter dans Apple Podcasts ). Andrei Filchenkov , Ph.D. (sciences physiques et mathématiques), professeur agrégé de la Faculté des technologies de l' information et de la programmation et la tête du groupe d'apprentissage automatique à l'international de l' informatique ordinateur laboratoire, a parlé avec nous .


Photo de Samuel Bourke (Unsplash.com)

Dmitry:L'année dernière, vous avezreçuleprixIlya Segalovich, et vous avez dit que vous êtes engagé dans différents domaines, sans aucun vecteur commun à part l'apprentissage automatique. Veuillez commenter cette approche. Cette liberté est-elle décisive pour vous?

Andrey Filchenkov:Quand je suis venu travailler à l’université ITMO, dans notre laboratoire des technologies informatiques, qui était déjà devenu un centre scientifique, il n’y avait rien de directement lié à l’apprentissage automatique. Et nous avons commencé à expérimenter. C'était l'année 2014.

Dmitry:Avez-vous formulé la tâche pour vous-même?

Andrew:Ils se sont mis, décidés. L'apprentissage automatique est conçu de telle sorte que les idées circulent d'un domaine à l'autre et que les modèles passent d'une tâche à l'autre. Il est assez difficile de se limiter à quelque chose. Et donc ce n'est pas seulement nous qui travaillons. Presque toujours, les chercheurs dans le domaine de l'apprentissage automatique ne se trouvent pas strictement dans un créneau, il y a toujours beaucoup de recherches autour.

Une autre chose est qu'au départ nous n'avions pas de vecteur autour duquel nous pouvions construire notre travail. Mais maintenant, nous explorons des sujets spécifiques et limitons généralement le nombre de niches dans lesquelles nous travaillons. Il s'agit tout d'abord de l'apprentissage automatique, tout ce qui concerne le traitement et la génération d'images, y compris la vidéo, l'analyse des réseaux sociaux.

L'année dernière, deux sujets relativement nouveaux sont apparus: l'apprentissage automatique pour l'analyse de code et l'apprentissage automatique pour le routage. Nous routons depuis 2016, mais nous nous sommes plongés dans ce sujet. Nous avons essayé d'assumer une variété de tâches, mais cette approche affecte les résultats. Maintenant, nous essayons de nous concentrer davantage sur la qualité que sur la diversité.

Dmitry: Et donc, vous formulez déjà des problèmes ponctuels pour ceux qui travaillent en laboratoire et agissez comme mentor théorique pour un grand nombre de spécialistes?

Andrew: Oui.

Dmitry: Il peut sembler au profane que cette activité est liée à des choses, des formules et des articles scientifiques très basiques. Mais les gars du laboratoire, comme vous pouvez le voir, travailler avec l'analyse des réseaux sociaux, les moteurs de recommandation, analyse Twitter de Trump. Veuillez nous parler de tels projets qui sont compréhensibles au niveau pratique?

Andrey: Notre activité peut être divisée en deux catégories. Le premier est les algorithmes qui s'appliquent à beaucoup de choses. Par exemple, les algorithmes de sélection des fonctionnalités. Ils sont nécessaires pour de nombreuses tâches - pour l'analyse des séquences d'ADN, le traitement des données médicales, etc. La deuxième catégorie concerne les tâches du domaine dans lequel nous essayons déjà d'utiliser différents algorithmes. Il y a plus de tâches dans cette catégorie, elles sont compréhensibles et diverses, et pas toujours complètement scientifiques.

Sur la photo: Andrey Filchenkov
En plus du laboratoire, nous avons un environnement commun dans lequel tournent startups et entreprises. Ils viennent avec des commandes industrielles, les tâches se posent assez pratiques. Récemment, nous avons travaillé avec la chaîne TVC. Ils ont un grand nombre de documents et d'articles différents. Et ils sont très intéressés à surveiller comment tel ou tel phénomène est présenté dans la presse et comment il change au fil du temps - combien ilon Mask conventionnel est dans la presse, dans quel contexte il est rencontré. Nous avons écrit un moteur de recherche pour eux afin d'effectuer rapidement des requêtes assez complexes sur une base de données assez volumineuse.

Dmitry: C'était plus efficace pour eux de vous contacter et d'introduire un développement personnalisé, que d'aller sur le marché pour un produit «en boîte» fini?

Andrew: Oui. Ils ont une tâche spécifique. Il n'y a pas de telles solutions sur le marché.

Nous faisons également des choses assez intéressantes avec Vk, où travaille l'un de nos étudiants diplômés. La publicité est l'une des principales sources de revenus du site, comme la plupart de ces entreprises. Et vous devez savoir à qui montrer cette publicité, pour que tout soit efficace. La tâche ressemble à ça. Il y a un grand nombre d'annonceurs. Nous devons nous assurer qu'ils ont des émissions et que les gens deviennent pertinents.

Il existe un certain nombre d'études liées à la médecine. Par exemple, une analyse de la peau à partir d'une photographie pour identifier les marqueurs médicaux importants. Il y a deux sujets. L'une est liée à l'identification d'une taupe ou à un signal indiquant que quelque chose de grave peut être. La seconde est une compréhension de ce qui provoque telle ou telle tache, éruption cutanée (cela peut être le symptôme d'un grand nombre de maladies cutanées et sexuellement transmissibles).

Dmitry:Et ici, vous pouvez augmenter la disponibilité des diagnostics de base?

Andrew: Oui. Mais même si les symptômes sont visibles parce qu'ils sont sur la peau, leur classification n'est pas si simple. Nous automatisons cette tâche afin que vous puissiez mettre l'application sur votre téléphone, prendre une photo et comprendre, mais il y a quelque chose de suspect. Nous ne prenons pas de décisions ici, mais si la demande indique à la personne qu'il semble qu'il a quelque chose de mal, il vaut mieux aller chez le médecin et obtenir une consultation.



Transfert de diverses solutions et développement de la sphère de la région de Moscou


Timecode ( version audio ) - 09:07



Dmitry: Avez-vous eu des situations où vous avez pris des décisions qui ont été testées dans un domaine d'activité et les avez appliquées dans un autre domaine, comme expérience ou lorsque vous avez eu des difficultés avec une tâche?

Andrew:Habituellement, nous essayons d'utiliser l'apprentissage automatique. En gros, nous avons une boîte noire dans laquelle nous supprimons des tâches et obtenons des solutions de base. Bien sûr, ils sont généralement pires que ce que vous pouvez faire avec vos mains après cela, mais c'est une référence sur laquelle vous pouvez vous concentrer. Si nous parlons de solutions spécifiques, par exemple, liées au traitement d'image, le transfert fonctionne ici. La chose de base est VGG pré-formé et sa formation continue sur les données. La formation de solutions de base basées sur des réseaux d'accès formés et aménagés est une étape standard. Et il s'avère souvent qu'il vaut mieux ne rien faire dans la configuration actuelle.

Dmitry: Dans ce cas, s'avère-t-il que vous changez certaines choses architecturales du point de vue du fer, ou s'agit-il simplement de solutions logicielles, d'algorithmes?

Andrew:Habituellement, nous ne parlons que d'algorithmes. Il y avait peu de problèmes pour lesquels nous devions nous adapter au fer. Le plus brillant est ce que nous avons fait avec Huawei pour reconnaître les personnages sur les photos. Il y avait des restrictions assez strictes liées au fait que ce modèle devait être implémenté par téléphone. Là où il n'y a pas beaucoup de mémoire, il y a des restrictions sur les opérations qui peuvent être utilisées, car il est impossible d'appliquer sous forme pure ce que nous avons fait sur TensorFlow. Et ici, nous avons dû esquiver, car il y avait de bonnes décisions, mais sans possibilité de transfert, et nous avons dû faire de gros efforts. Mais le plus souvent, nous prenons une décision qui fonctionne rapidement quelque part sur le serveur, mais sans restrictions sur tout le reste.

Dmitry:Je pose la question, car la question se pose souvent de savoir de quoi dépendra l'efficacité d'un tel système. Dites-nous quels problèmes rencontrez-vous actuellement en termes d'évolution des algorithmes et des approches théoriques dans ce domaine? Y a-t-il une limite que cette sphère a atteinte, ou se développe-t-elle rapidement maintenant?

Andrew:La question est assez compliquée, mais intéressante. Pendant longtemps, tout était vraiment limité au fer. Il y avait des algorithmes assez complexes, mais ils ne fonctionnaient pas toujours bien. Maintenant, beaucoup est connecté aux réseaux de neurones, car la puissance de calcul est apparue qui leur permet de conduire. Bien qu'à partir d'un certain point la puissance de calcul soit devenue moins importante, nous voulons toujours dire que nous aurons certains coûts. Si nous parlons d'algorithmes classiques, il n'y a pas de problèmes particuliers avec les capacités. La question est de savoir comment trouver rapidement et efficacement les meilleures solutions.

Au départ, comme les capacités étaient limitées, il était important que la personne qui résout le problème comprenne comment les algorithmes fonctionnent, leurs besoins en ressources, l'applicabilité pour cette tâche. Il y a eu une période où cela n'est pas devenu tout à fait le cas, car les capacités sont devenues assez abordables.

Dmitry: Autrement dit, il y a eu un bond assez important dans la croissance de la puissance et des capacités de calcul. Nous levâmes légèrement une main d'un pouls. Vous le retournez maintenant.

Andrei: Oui, ces dernières années, il y a eu une augmentation de l'apprentissage automatique. Et il existe une version selon laquelle toute l'expertise actuellement acquise dans le domaine de l'apprentissage automatique peut être remplacée par une multiplication par cent de la puissance de calcul. L'apprentissage automatique automatique tente en fait de trouver une solution à votre problème. Et c'est une question de capacités, puisque c'est une recherche, pas une recherche exhaustive, mais toujours très complexe, longue, à grande échelle, nécessitant une énorme quantité de ressources informatiques. En conséquence, nous nous appuyons à nouveau sur le fait que l'expertise est remplacée par les ressources et leur disponibilité.


Photo de Franki Chamaki (Unsplash.com)

Je ne crois pas que nous nous retrouverons jamais dans une situation où un expert ne sera pas nécessaire, car il y a encore de nombreuses tâches qui ne peuvent pas être prises et automatisées comme celle-ci (définition d'une tâche, compréhension des processus métier) jusqu'à ce que nous trouvions des systèmes puissants intelligence artificielle. Au minimum, ce ne sera pas très bientôt. Par conséquent, la tâche sera préservée, mais les exigences de redémarrage de la puissance de calcul deviennent l'un des facteurs clés.

Dmitry: Mais en même temps, vous devez encore prendre des mesures pour «rattraper» la croissance de la puissance de calcul en termes d'efficacité des algorithmes eux-mêmes. Des entreprises qui peuvent avoir des capacités énormes, mais toujours, il me semble, chaque tâche a un certain délai, dans lequel elle doit être résolue et reste pertinente.

Andrew: Oui. Il y a une qualité souhaitée, il y a un temps pour lequel il faut l'atteindre. Nous sommes limités des deux côtés. S'il y a suffisamment de temps, la qualité est presque toujours réalisable. Bien que, bien sûr, chaque tâche ait des limites fondamentales quant à la qualité qui peut être obtenue. En gros, nous ne pourrons pas mieux prédire le personnage par l'emplacement des lunes qu'une pièce de monnaie. Mais si la restriction requise n'atteint pas le plafond, nous pouvons atteindre la qualité souhaitée pendant un certain temps. Parfois, nous pouvons dire que dans le temps imparti, nous avons trouvé une assez bonne solution, nous ne pouvons pas obtenir le meilleur pour le moment. Il y a toujours ces deux «coordonnées».



L'étude de nouveaux résultats, leur compréhension et leur adaptation


Timecode ( version audio ) - 16:41



Dmitry: Du point de vue du développement professionnel de ceux qui travaillent dans votre laboratoire, comment pouvez-vous évaluer la répartition des connaissances de base et de la formation théorique par rapport à ce que vous devez étudier directement dans le processus: analyser les articles scientifiques, les percées, les changements dans ce domaine? Combien de ces changements interviennent dans le cadre d'une semaine ou d'un mois? Est-il difficile de les mettre en œuvre dans vos activités, dans les projets sur lesquels vous travaillez actuellement?

Andrew:C'est une très bonne question. Tout dépend de la région. Par exemple, un étudiant diplômé qui automatise la tâche de clustering me protège maintenant. En général, il n'y a pas un très grand flux de nouveaux résultats. D'un autre côté, il fait AutoML pour le clustering. Ici, il n'est pas si facile de suivre le flux de nouveaux résultats. De plus, il est difficile de se limiter à un seul domaine.

Comme je l'ai dit au tout début, dans le domaine de l'apprentissage automatique, tout est fortement connecté. Les idées qui ont surgi à l'origine dans le domaine du traitement d'images se déroulent en quelques étapes ailleurs. Le traitement de texte est le candidat le plus proche. L'un des facteurs de réussite les plus importants est simplement d'être conscient de ce qui se passe non seulement dans votre créneau, mais aussi dans le domaine de l'apprentissage automatique en général.

Photo de Nick Hillier (Unsplash.com)
C'est difficile à faire car beaucoup de résultats sont générés. Des dizaines de milliers de participants aux grandes conférences, un grand nombre d'œuvres, jusqu'à des centaines d'œuvres par semaine dans les archives. Une telle quantité est même difficile à feuilleter. Mais les jalons sont importants à surveiller.

Pour ce faire, vous n'avez pas besoin de numériser les archives ou de lire les collections de conférence d'un bout à l'autre, mais il est très important de vous abonner au public lié à l'apprentissage automatique et de suivre ce qui est écrit.

Au départ, il y avait de nombreux résultats différents dans le traitement de la langue. Dès que Word2vec est apparu, tout le monde a commencé à passer aux plongements. Il y en a beaucoup. Il y en avait plusieurs de base, mais pour différentes tâches particulières, elles avaient la leur, et il était nécessaire de surveiller comment elles les amélioraient. Ensuite, Google a déployé BERT, et cela a donné une très forte augmentation. À un moment donné, il s'est avéré que si vous compreniez comment fonctionne BERT et si vous êtes impliqué dans le traitement de l'anglais, vous n'avez vraiment besoin de rien.

Vous ne pouviez pas vous inquiéter du succès des nouvelles versions de fastText et des intégrations basées sur celui-ci. BERT a maintenant beaucoup de changements. Il est toujours basique, comme Word2vec à un moment donné. Mais il y a déjà beaucoup de modifications qui sortent avec une fréquence de plusieurs jobs par mois voire même pas moins de travail par semaine.

Et cette dynamique change tout le temps. Il y a un endroit où tout s'effondre, et ici vous pouvez rattraper quelque chose, puis il recommence à fleurir en différentes couleurs, et vous devez suivre cela. Le problème est que cela se produit plus souvent, c'est-à-dire que la vitesse à laquelle de nouveaux résultats apparaissent ne fait qu'augmenter. Comment garder une trace de cela est l'un de ces problèmes de vie fondamentaux que je rencontre.

Dmitry: De telles explosions d'activité apparaissent-elles davantage autour de grandes entreprises qui créent leurs propres cadres, ou la communauté scientifique lance-t-elle quelque chose?

Andrew:Tout le monde est impliqué à des degrés divers. Je dois admettre que les entreprises ont plus de résultats que les universités. Cela dépend de la région. Un scénario typique est celui où les grands scientifiques travaillent non seulement dans les universités, mais aussi dans les entreprises. Le plus souvent, ils embauchent ceux qui continuent de mener des activités de recherche. Par conséquent, l'entreprise accumule un énorme potentiel intellectuel. Les universités peuvent rarement fournir une puissance de calcul et des ensembles de données similaires, de sorte que les dés d'entreprise sur les articles (affiliation) se trouvent de plus en plus souvent.

Dmitry: Même sur les articles, malgré le fait que l'entreprise ait la possibilité de clore la plupart de ses développements et recherches auprès du public? Cela a du sens. Mais l'université n'a pas une telle opportunité, de par sa nature, elle est obligée de publier quelque chose.

Andrew:En effet, il peut y avoir un biais. Les universités publient en tout cas, car c'est la spécificité de leur travail. Le flux d'articles provenant des universités est plus important, car il existe de nombreuses universités, les gens sont publiés et les entreprises ne s'en félicitent pas partout. Mais des résultats révolutionnaires - les entreprises en ont plus.

Ils capitalisent donc leur renommée et leurs compétences, attirent de nouveaux scientifiques, expliquant que la recherche peut être faite avec eux, et très cool. Par exemple, ils ont fait un nouveau modèle, cela peut être très théorique. Mais le plus souvent, c'est d'une grande importance pratique, dans l'entreprise en premier lieu. Ils peuvent être présentés en open source, mais, par exemple, comme Google, il s'agira déjà de certaines versions antérieures, qu'ils considèrent elles-mêmes comme obsolètes.



Développement ouvert, préparation des publications et exigences pour celles-ci


Timecode ( version audio ) - 23:48



Dmitry: Quelle est l'importance du développement open source dans votre entreprise? Comment l'affectent-ils? Dans l'exemple de l'automatisation de clustering, vous avez dit que vous prenez le développement open source et l'appliquez sur une base fondamentale que vous pouvez étudier, travailler à fond, c'est-à-dire aller dans la direction opposée et ne pas vous attacher à des changements rapides dans une sphère étroite.

Andrew:Le code affiché est très important. Presque toujours, la question standard se pose - fait ce qui est prévu fonctionne. Toujours - questions de comparaison avec les résultats. Lorsqu'une personne crée quelque chose, elle doit prouver qu'elle est meilleure qu'avant. Malheureusement, il arrive assez souvent que les gens se comparent à ce qui les précède, selon les chiffres publiés dans l'article. Ce n'est pas très correct. Il n'y a aucune garantie qu'une personne reproduit une expérience de la même manière que les autres. Par conséquent, il est important de prendre différentes décisions et de les exécuter vous-même, de vérifier leur fonctionnement et de vous assurer que vous avez fait mieux dans une configuration expérimentale similaire.

Vous ne pouvez comparer correctement que si vous avez le code.


Photo Headway (Unsplash.com)

Deuxièmement, si une personne ne développe rien de nouveau du point de vue de la concurrence, mais souhaite appliquer la méthode, ce serait bien de l'avoir sur GitHub, et cela pourrait être utilisé. Mais même lorsque quelque chose est présenté, la documentation n'est pas toujours disponible. Publiez rarement des travaux avec une bonne documentation. Il arrive qu'ils ne téléchargent pas du tout le code, et vous devez tout implémenter comme décrit dans l'article. C'est un problème. Cette situation crée des difficultés de reproductibilité des résultats d'apprentissage automatique. Et c'est presque le principal problème dans notre sphère.

Il est facile de publier des résultats de recyclage, mais il est difficile de vérifier s'il n'y a pas de code. Nous avons comparé notre propre AutoML aux solutions existantes. Heureusement, il existe des bibliothèques publiées qui sont activement utilisées. Il existe des solutions plus récentes, mais leur code n'est pas présenté. Il était clair qu'ils étaient pires - ce qu'ils ont présenté était un cas particulier de notre décision.

Dmitry: Est-il possible d'envisager des approches qui élimineront ce problème, au moins dans le cadre de votre travail et garantiront la possibilité de reproduire les résultats?

Andrew:Vous pouvez créer un lien vers des référentiels ouverts et fournir de la documentation. J'essaie de tout faire dans tous les articles. Malheureusement, ce n'est pas toujours le cas. Cela se produit avec presque tout le monde: une personne a écrit un code, cela fonctionne, mais les gens sont gênés de le partager avec d'autres, car ils ont honte de certains de ses éléments. Mais j'essaie de répandre l'idée que lors de la rédaction d'un article, vous devez le compléter avec un lien vers GitHub. Le référentiel avec le code doit être préparé à l'avance.

Dmitry: Ici, vous devez passer du temps sur sa documentation.

Andrew: Au moins de façon minimale. Cela est nécessaire pour que ce qui est écrit dans l'article aide à comprendre ce qui se passe, même si le code n'est pas du tout documenté. Bien que ce soit difficile. Plus le projet est grand, moins l'article aide.



Travail des spécialistes de laboratoire et fréquence de sortie


Timecode ( version audio ) - 28:37



Dmitry: Si vous évaluez le temps de préparation d'un article scientifique et d'un projet pratique, dans quel délai une personne peut-elle réaliser quelque chose dans votre domaine d'activité? Classiquement, tous les six mois ou un an, il publie un article, et un grand projet prend, disons, deux ans.

Andrei: Il y a un problème important avec le fait que cela dépend fortement de l'hypothèse elle-même. Il est vraiment difficile de répondre à cette question. Je peux peindre le projet pour qu'il se réalise à la fois en deux mois et en deux ans. Dans ce cas, des résultats similaires seront obtenus.

Cela ne signifie pas que vous pouvez prendre ces deux mois et faire chaque jour douze fois moins. Ici comme avec neuf mères. Nous sommes liés à la puissance de calcul, mais beaucoup de choses peuvent être parallélisées. Beaucoup de choses peuvent être accomplies selon le sujet du projet.

De même avec la préparation d'articles. Il y a des choses où un modèle apprend une heure, il y a des choses où un modèle apprend un jour. Dans AutoML, les expériences peuvent durer une semaine. Il arrive que les expériences ne soient pas soumises à des tâches raisonnables, car elles ne sont pas comptées. Par conséquent, il existe de nombreuses tâches où tout est pris en compte sur certains CIFAR. Au moins certains ensembles de données raisonnables, plus comme la pratique, personne n'essaie de les toucher, car l'article sera publié dans deux ans, le modèle sera, mais déjà obsolète.

Le deuxième critère qui affecte la situation est ce que vous savez déjà sur le sujet. Si vous comprenez quels modèles existent, une expérience est mise en place, vous testez une hypothèse spécifique, alors tout va bien. Mais généralement, la tâche peut changer au cours du processus. Pas trop.

Photo Science en HD (Unsplash.com)
Mais maintenant ça a un peu changé dans une certaine direction, et il faut prouver la nouveauté de ce que vous proposiez. Il faut regarder ce qui a été fait plus tôt, pour comparer.

Il s'avère que votre décision est nouvelle, mais pas la plus cool. Vous essayez de l'améliorer, le résultat change. Il faut prouver que le résultat est nouveau. Et aussi, un homme a foutu quelque part l'entraînement de renforcement, et maintenant nous devons regarder dans cette direction.

Ce processus peut être très étiré. Il y a des articles à long terme, ils sont écrits depuis longtemps, car les choses changent un peu. Un autre point est la plate-forme où la publication de l'article est prévue. Dans les bons endroits, il faut justifier pourquoi votre résultat est bon. Il arrive que cette explication soit la plus longue. Autrement dit, le modèle fonctionne, et comprendre pourquoi il fonctionne est une tâche distincte, encore plus compliquée que de proposer ce modèle.

Enfin, la rédaction de l'article lui-même. Malheureusement, tous les endroits dignes de publication pour contribuer à la science sont anglophones. Cela impose ses limites. Écrire des articles en anglais n'est pas si facile. Si un employé de laboratoire écrit son premier article, il le fera très longtemps. S'il s'agit de son vingtième article, vite. De plus, si je ne botte pas activement une personne, il écrira quelques mois, si je veux, de toute façon quelques semaines. Bien sûr, tout dépend de la complexité du sujet qu'il envisage.



Le choix de la zone de développement et les prérequis


Timecode ( version audio ) - 33:04



Dmitry: Comment le choix initial de la direction affecte-t-il le développement? Par exemple, une personne commence tout juste à faire tout cela à un niveau sérieux et, par exemple, prend une zone trop large pour elle-même. Et ici, les béquilles commencent à grimper avec des changements périodiques et des gains de résultats dans les industries connexes, et une personne s'y retrouve coincée comme dans un marais. Comment se concentrer sur les étapes initiales?

Andrew: De telles histoires surviennent si une personne imagine une variété de techniques qu'elle peut utiliser. S'il ne fait que commencer, il n'y aura probablement pas de tels problèmes.

Dmitry: Parce que la base d'origine, dont nous avons parlé, dessine avec les résultats existants, et qu'une personne n'apporte rien de nouveau?

Andrew:Oui, tu peux dire ça. Une bonne lecture est importante ici. Plus vous lisez d'articles, plus il est facile de les écrire. La langue des articles est une langue distincte. Ceci est l'anglais scientifique. De plus, l'anglais scientifique dans l'apprentissage automatique est différent de l'anglais scientifique dans la biologie. Si une personne lit beaucoup d'articles, il devient plus facile pour elle de formuler des pensées et de structurer l'article.

Dmitry: Parlez-nous des fonctionnalités que vous vous attendez à voir chez les nouveaux arrivants - ceux qui se préparent à vous rejoindre.

Andrew:Tout d'abord, c'est la capacité de programmer. Le champ est appliqué, sans lui nulle part. Si nous menions des recherches dans un domaine complètement fondamental, nous ne pouvions pas y penser - une formation mathématique serait suffisante. Mais tout ce que nous faisons, c'est supposer qu'il sera implémenté en Python, par exemple. La compétence en programmation est cruciale.


Photo de Hitesh Choudhary (Unsplash.com)

Le second concerne les compétences de base dans le domaine de l'apprentissage automatique. Il est important que la personne dans son ensemble comprenne ce qu'est l'apprentissage automatique, comment il est organisé, même si elle est engagée dans sa tâche étroite. Par exemple, il a commencé la formation avec des renforts, mais ici, vous devez toujours comprendre comment le machine learning est structuré en général, ce qu'est le recyclage. Il est également important de savoir quels modèles et quelles idées existent afin d'essayer de les appliquer à la maison. Un facteur plus important est la motivation, le désir de plonger et l'intérêt interne. Si une personne a une bonne compréhension du domaine, la présence de ses propres idées, elle sera mieux en mesure d'écrire des articles et de se positionner dans notre domaine.

Dmitry:Que réussissez-vous à faire en plus de gérer le laboratoire et de participer au travail des services? D'une manière ou d'une autre, vous devez vous plonger dans, comprendre, suggérer des solutions, corriger les erreurs. Avez-vous des projets tiers personnels? Peut-être que votre journée semble spéciale? Ou tous les efforts vont-ils uniquement aux activités de profil, et est-ce votre hobby?

Andrei: Mon quotidien ne ressemble pas à un autre. Par exemple, en novembre, j'étais moins susceptible d'être à Saint-Pétersbourg que non à Saint-Pétersbourg. Il est impossible de dire que j'ai une activité régulière et régulière à un moment ou à un autre. J'essaie d'écrire ce que je veux faire dans un mois. Par exemple, pour lire tant d'articles, parlez à vos étudiants diplômés, répartissez les tâches selon où je suis, ce que je fais, quels facteurs l'influencent.

Depuis mon enfance, je voulais faire de la science, j'aime la consacrer tout le temps. Certes, la gestion du laboratoire n'est pas tout à fait une science. L'activité organisationnelle et l'activité scientifique sont deux choses différentes. Habituellement, les scientifiques ne sont pas particulièrement intéressés par l'organisation et la bureaucratie. Si une personne parvient à bien gérer, alors elle n'a pas le temps de s'immerger profondément dans la tâche. Malheureusement, je ne peux pas combiner efficacement: soit je commence à me plonger dans le leadership et je tombe hors contexte, soit je commence à faire des recherches et le processus organisationnel démarre. Alors maintenant, j'essaie de reconsidérer l'approche. Notre laboratoire a un directeur, Ivan Smetannikov, nous avons du personnel administratif, mais il n'y a toujours pas assez de personnel.

Le leadership est un processus complexe et stressant, il prend beaucoup de temps. C'est un mal nécessaire pour s'engager dans des activités scientifiques et résoudre plus d'un problème spécifique. Je pourrais être chercheur senior et gérer une ou plusieurs tâches, mais de cette façon, vous pouvez traiter un grand nombre de sujets, et c'est toujours plus intéressant - plonger, décharger, trouver des solutions. C’est plus intéressant pour moi de trouver une solution que de la mettre en œuvre et de la vérifier. D'autres le font, mais ce n'est pas une délégation de routine.

Dans une étude, vous ne pouvez presque jamais dire: "Faites ça!" Ils disent plutôt: "Essayez de faire cela et pensez-y." Vous pouvez donner à une personne une direction, donner des indices, elle n'a absolument aucun travail de routine. Si vous dites: «Essayez de résoudre ce problème», alors quelqu'un réussira, mais pas. Il n'est pas toujours clair par où commencer et où chercher. Quelque part, je viens de diriger, quelque part où je me suis fixé une tâche, quelque part où j'ai presque déployé une solution.

Dmitry: Et sélectionnez-vous ceux qui seront impliqués dans divers domaines?

Andrei: Nous discutons avec tout le monde de ce qu'il veut faire et de l'objet de ses recherches.

Dmitry: Une telle approche personnelle?

Andrew:Bien sûr. De nombreuses études en apprentissage automatique sont des choses tout à fait individuelles. Il est clair que les gens collaborent en groupes et font quelque chose ensemble, mais forcer une personne à faire quelque chose est une approche inefficace. Il arrive qu'il n'ait aucune préférence et qu'il puisse être invité à faire quelque chose. Il peut s'impliquer. Mais si une personne n'est pas attirée, elle n'a pas de motivation intrinsèque, elle ne lira pas, elle ne se développera pas. Il sera un bon interprète, mais cela ne suffit pas pour faire de bonnes recherches. Besoin d'intérêt personnel. Par conséquent, il est nécessaire de sélectionner une étude pour une personne.

Dmitry: Quelles sources ou littérature recommandez-vous à ceux qui souhaitent passer de la programmation au sens large au thème de l'apprentissage automatique?

Andrew: La principale recommandation - courssur Coursera par Andrew Eun (Andrew Ng). Il y a des cours plus approfondis à la Higher School of Economics. Il est important qu'il y ait de la pratique. L'apprentissage automatique concerne la façon dont les algorithmes fonctionnent réellement avec les données. C'est loin d'être mathématique, car les données affectent ce que vous devez en faire. Vous pouvez le ressentir lors de l'apprentissage, il existe de nombreux pièges et spécificités dans le code. Je peux recommander les livres: Deep Learning de Sergei Nikolenko, le plus classique Hesti, Tibshirani, Friedman ou le complètement classique Bishop . Bien sûr, c'est un peu dépassé, mais vous pouvez vous faire une bonne idée.



Podcast cuisine et mène dmitrykabanov.

Lecture supplémentaire:




Startups de l'ITMO University (nos supports en anglais sur Habré):




All Articles