Podcast: lo que les espera a los científicos principiantes en el campo de la defensa

Según lo prometido , proporcionamos una transcripción completa de la primera versión de nuestro podcast ( puede escucharlo en Apple Podcasts ). Andrei Filchenkov , Ph.D. (Física y Matemáticas), profesor asociado de la Facultad de Tecnologías de la Información y Programación y el jefe del grupo de aprendizaje automático en el laboratorio internacional de informática informática , habló con nosotros .


Foto de Samuel Bourke (Unsplash.com)

Dmitry:El año pasadorecibióel Premio Ilya Segalovich y dijo que estaba involucrado en diferentes áreas, sin ningún vector común además del aprendizaje automático. Por favor comente sobre este enfoque. ¿Esa libertad es decisiva para ti?

Andrey Filchenkov:Cuando llegué a trabajar en la Universidad ITMO, en nuestro laboratorio de Tecnologías Informáticas, que ya se había convertido en un centro científico, no había nada directamente relacionado con el aprendizaje automático. Y comenzamos a experimentar. Era el año 2014.

Dmitry:¿Has formulado la tarea por ti mismo?

Andrés:Se pusieron, decidieron. El aprendizaje automático está diseñado de tal manera que las ideas fluyen de un área a otra, y los modelos fluyen de una tarea a otra. Es bastante difícil estar limitado a algo. Y no solo somos nosotros los que trabajamos. Casi siempre, los investigadores en el campo del aprendizaje automático no se sientan estrictamente en un nicho, siempre hay mucha investigación alrededor.

Otra cosa es que inicialmente no teníamos un vector alrededor del cual construiríamos nuestro trabajo. Pero ahora profundizamos en temas específicos y generalmente limitamos la cantidad de nichos en los que trabajamos. En primer lugar, se trata del aprendizaje automático, todo lo relacionado con el procesamiento y la generación de imágenes, incluido el video y el análisis de redes sociales.

El año pasado aparecieron dos temas relativamente nuevos: el aprendizaje automático para el análisis de código y el aprendizaje automático para el enrutamiento. Hemos estado enrutando desde 2016, pero profundizamos en este tema. Intentamos asumir una variedad de tareas, pero este enfoque afecta los resultados. Ahora estamos tratando de centrarnos más en la calidad que en la diversidad.

Dmitry: ¿ Y por lo tanto, ya está formulando problemas puntuales para quienes trabajan en el laboratorio y actuando como mentor teórico para una gran cantidad de especialistas?

Andrew: si.

Dmitry: Al lego le puede parecer que esta actividad está relacionada con cosas muy básicas, fórmulas y artículos científicos. Pero los chicos del laboratorio, como puedes ver, trabajar con el análisis de redes sociales, motores de recomendación, análisis de Twitter de Trump. ¿Cuéntenos sobre proyectos que sean comprensibles a nivel práctico?

Andrey: Nuestra actividad se puede dividir en dos categorías. El primero son los algoritmos que son aplicables a muchas cosas. Por ejemplo, algoritmos de selección de características. Son necesarios para muchas tareas: para analizar secuencias de ADN, procesar datos médicos, etc. La segunda categoría son las tareas del área temática en la que ya estamos tratando de usar diferentes algoritmos. Hay más tareas en esta categoría, son comprensibles y diversas, y no siempre son completamente científicas.

En la foto: Andrey Filchenkov
Además del laboratorio, tenemos un entorno común en el que giran las nuevas empresas y las empresas. Vienen con pedidos industriales, las tareas surgen bastante prácticas. Recientemente, trabajamos con el canal TVC. Tienen una gran cantidad de documentos y artículos diferentes. Y están muy interesados ​​en monitorear cómo se presenta este o aquel fenómeno en la prensa y cómo cambia con el tiempo: cuántos Ilon Mask convencionales hay en la prensa, en qué contexto se encuentra. Escribimos un motor de búsqueda para ellos para realizar rápidamente consultas bastante complejas en una base de datos bastante grande.

Dmitry: ¿ Fue más efectivo para ellos contactarlo e introducir un desarrollo personalizado que ir al mercado para obtener un producto terminado en caja?

Andrew: si. Tienen una tarea específica. No existen tales soluciones en el mercado.

También hacemos cosas bastante interesantes con Vk, donde trabaja uno de nuestros estudiantes de posgrado. La publicidad es una de las principales fuentes de ingresos para el sitio, como la mayoría de estas empresas. Y debe comprender a quién mostrar este anuncio, para que todo sea efectivo. La tarea se ve así. Hay una gran cantidad de anunciantes. Necesitamos asegurarnos de que tengan shows y que las personas sean relevantes.

Existen varios estudios relacionados con la medicina. Por ejemplo, un análisis de la piel de una fotografía para identificar marcadores médicos importantes. Hay dos temas Uno está relacionado con identificar si un lunar es un lunar o es una señal de que algo serio puede ser. El segundo es comprender qué causa estas o esas manchas, erupciones cutáneas (estos pueden ser síntomas de una gran cantidad de enfermedades de la piel y de transmisión sexual).

Dmitry:¿Y aquí puede aumentar la disponibilidad de diagnósticos básicos?

Andrew: si. Pero incluso si los síntomas son visibles porque están en la piel, su clasificación no es tan simple. Automatizamos esta tarea para que pueda poner la aplicación en su teléfono, tomar una foto y comprender, pero hay algo sospechoso. Aquí no tomamos decisiones, pero si la solicitud le dice a la persona que parece que tiene algo mal, es mejor ir al médico y obtener una consulta.



Transferencia de diversas soluciones y desarrollo del ámbito de la región de Moscú.


Código de tiempo ( versión de audio ) - 09:07



Dmitry: ¿Ha tenido situaciones en las que tomó decisiones que se probaron en un área de actividad y las aplicó en otra área, como un experimento o cuando tenía dificultades con una tarea?

Andrés:Por lo general, intentamos usar el aprendizaje automático. En términos generales, tenemos una caja negra en la que soltamos tareas y obtenemos soluciones básicas. Por supuesto, suelen ser peores que lo que puede hacer con las manos después de eso, pero esta es una línea de base en la que puede concentrarse. Si hablamos de soluciones específicas, por ejemplo, relacionadas con el procesamiento de imágenes, la transferencia funciona aquí. Lo básico es VGG pre-entrenado y su entrenamiento adicional en datos. La formación de soluciones básicas basadas en redes de acceso formadas y establecidas es un paso estándar. Y a menudo resulta que es mejor no hacer nada en la configuración actual.

Dmitry: En este caso, ¿resulta que está cambiando algunas cosas arquitectónicas desde el punto de vista del hierro, o se trata solo de soluciones de software, algoritmos?

Andrés:Por lo general, solo hablamos de algoritmos. Hubo pocos problemas para los cuales tendríamos que adaptarnos al hierro. Lo más brillante es lo que hicimos con Huawei para reconocer personajes en las fotos. Había restricciones bastante estrictas relacionadas con el hecho de que este modelo tenía que implementarse en el teléfono. Donde no hay mucha memoria, hay restricciones en las operaciones que se pueden usar, ya que es imposible aplicar en forma pura lo que hicimos en TensorFlow. Y aquí tuvimos que esquivar, porque hubo buenas decisiones, pero sin posibilidad de transferencia, y tuvimos que esforzarnos mucho. Pero con mayor frecuencia tomamos una decisión que rápidamente funciona en algún lugar del servidor, pero sin restricciones en todo lo demás.

Dmitry:Pregunto porque a menudo surge la pregunta de en qué puede depender la eficiencia de dicho sistema. Cuéntanos qué problemas estás enfrentando actualmente en términos de la evolución de algoritmos y enfoques teóricos en esta área. ¿Hay algún límite que haya alcanzado esta esfera o se está desarrollando rápidamente ahora?

Andrés:La pregunta es bastante complicada, pero interesante. Durante mucho tiempo, todo estuvo realmente limitado al hierro. Había algoritmos bastante complejos, pero no siempre funcionaban bien. Ahora mucho está conectado con redes neuronales, porque ha aparecido una potencia informática que les permite conducir. Aunque desde algún punto el poder de la computación se ha vuelto menos importante, siempre queremos decir que tendremos ciertos costos. Si hablamos de algoritmos clásicos, entonces no hay problemas particulares con las capacidades. La pregunta es cómo encontrar rápida y eficientemente las mejores soluciones.

Inicialmente, dado que las capacidades eran limitadas, era importante que la persona que resolviera el problema entendiera cómo funcionan los algoritmos, sus requisitos de recursos y la aplicabilidad para esta tarea. Hubo un período en que esto no fue así, ya que las capacidades se volvieron bastante asequibles.

Dmitry: Es decir, ha habido un salto significativo en el crecimiento de la potencia y las capacidades informáticas. Lentamente levantamos una mano de un pulso. Ahora lo estás devolviendo.

Andrei: Sí, en los últimos años ha habido un aumento en el aprendizaje automático. Y hay una versión en la que toda la experiencia que ahora se encuentra en el aprendizaje automático se puede reemplazar por un aumento de cien veces en la potencia informática. El aprendizaje automático está intentando encontrar una solución para su problema. Y esto es una cuestión de capacidades, ya que se trata de una búsqueda, no una búsqueda exhaustiva, pero sigue siendo muy compleja, larga, a gran escala, que requiere una gran cantidad de recursos informáticos. Como resultado, nuevamente descansamos en el hecho de que la experiencia está siendo reemplazada por los recursos y su disponibilidad.


Foto de Franki Chamaki (Unsplash.com)

No creo que alguna vez nos encontremos en una situación en la que no se necesite un experto, porque todavía hay muchas tareas que no se pueden realizar y automatizar de esta manera (establecer una tarea, comprender los procesos comerciales) hasta que encontremos sistemas potentes inteligencia artificial. Como mínimo, no será muy pronto. Por lo tanto, la tarea se preservará, pero los requisitos para que la potencia informática se inicie nuevamente se convierten en uno de los factores clave.

Dmitry: Pero al mismo tiempo, aún debe tomar algunas medidas para "ponerse al día" con el crecimiento de la potencia informática en términos de la eficiencia de los algoritmos mismos. Empresas que pueden tener grandes capacidades, pero aún así, me parece, cada tarea tiene un cierto período de tiempo, en el que debe resolverse y sigue siendo relevante.

Andrew: si. Hay una calidad deseada, hay un tiempo para el cual es necesario lograrlo. Estamos limitados en ambos lados. Si hay suficiente tiempo, la calidad casi siempre se puede lograr. Aunque, por supuesto, cada tarea tiene limitaciones fundamentales sobre la calidad que se puede obtener. En términos generales, no podremos predecir el personaje por la ubicación de las lunas mejor que una moneda. Pero si la restricción requerida no alcanza el techo, entonces podemos lograr la calidad deseada por algún tiempo. A veces podemos decir que en el tiempo asignado encontramos una solución bastante buena, no podemos obtener lo mejor para este momento. Siempre hay estas dos "coordenadas".



El estudio de nuevos resultados, su comprensión y adaptación.


Código de tiempo ( versión de audio ) - 16:41



Dmitry: Desde el punto de vista del desarrollo profesional de quienes trabajan en su laboratorio, ¿cómo puede evaluar la distribución de los conocimientos básicos y la formación teórica en comparación con lo que tiene que estudiar directamente en el proceso: analizar artículos científicos, avances, cambios en esta área? ¿Cuántos de estos cambios vienen como parte de una semana o mes? ¿Qué tan difícil es implementarlos en sus actividades, en los proyectos en los que está trabajando aquí ahora?

Andrés:Esta es una muy buena pregunta. Todo depende de la zona. Por ejemplo, un estudiante graduado que está automatizando la tarea de agrupamiento ahora me está protegiendo. En general, no hay una gran cantidad de nuevos resultados. Por otro lado, hace AutoML para la agrupación. Aquí no es tan fácil hacer un seguimiento del flujo de nuevos resultados. Además, es difícil limitarse a un área.

Como dije al principio, en el campo del aprendizaje automático, todo está fuertemente conectado. Las ideas que surgieron originalmente en el campo del procesamiento de imágenes fluyen en un par de pasos en otros lugares. El procesamiento de textos es el candidato más cercano. Uno de los factores de éxito más importantes es simplemente estar al tanto de lo que sucede no solo en su nicho, sino también en el campo del aprendizaje automático en general.

Foto de Nick Hillier (Unsplash.com)
Esto es difícil de hacer porque se generan muchos resultados. Decenas de miles de participantes en las principales conferencias, una gran cantidad de trabajos, hasta cientos de trabajos por semana en los archivos. Tal cantidad es difícil de pasar. Pero es importante observar los hitos.

Para hacer esto, no necesita escanear el archivo o leer colecciones de conferencias de principio a fin, pero suscribirse a los públicos relacionados con el aprendizaje automático y realizar un seguimiento de lo que está escrito allí es muy importante.

Inicialmente, hubo muchos resultados diferentes en el procesamiento del lenguaje. Tan pronto como apareció Word2vec, todos comenzaron a moverse hacia las incrustaciones. Hay muchos de ellos. Había varias básicas, pero para diferentes tareas particulares tenían las suyas propias, y era necesario controlar cómo las mejoraban. Luego Google lanzó BERT, y dio un gran aumento. En algún momento, resultó que si entendía cómo funciona BERT y si está involucrado en el procesamiento del inglés, realmente no necesita nada.

No puede preocuparse por los éxitos de las nuevas versiones de fastText y las incrustaciones basadas en él. BERT ahora tiene muchos cambios. Todavía es básico, como Word2vec a la vez. Pero ya hay muchas modificaciones que salen con una frecuencia de varios trabajos por mes o incluso no menos trabajo por semana.

Y esta dinámica está cambiando todo el tiempo. Hay un lugar donde todo colapsa, y aquí puedes ponerte al día con algo, luego comienza a florecer en diferentes colores nuevamente, y debes seguir esto. El problema es que esto sucede con más frecuencia, es decir, la velocidad a la que aparecen los nuevos resultados solo está aumentando. Cómo hacer un seguimiento de esto es uno de esos problemas fundamentales de la vida que encuentro.

Dmitry: ¿Estas explosiones de actividad aparecen más en torno a las grandes empresas que crean sus propios marcos, o la comunidad científica arroja algo?

Andrés:Todos están involucrados en diversos grados. Tengo que admitir que las empresas tienen más resultados que las universidades. Depende del area. Un escenario típico es cuando los grandes científicos trabajan no solo en universidades, sino también en empresas. La mayoría de las veces contratan a quienes continúan realizando actividades de investigación. Por lo tanto, la empresa acumula un enorme potencial intelectual. Las universidades rara vez pueden proporcionar potencia de cómputo y conjuntos de datos similares, por lo que los dados de la empresa sobre los artículos (afiliación) se encuentran cada vez más a menudo.

Dmitry: ¿ Incluso en artículos, a pesar de que la compañía tiene la capacidad de cerrar la mayoría de sus desarrollos e investigaciones del público? Eso tiene sentido. Pero la universidad no tiene esa oportunidad, por su naturaleza está obligada a publicar algo.

Andrés:De hecho, puede haber sesgo. Las universidades publican en cualquier caso, porque esta es la especificidad de su trabajo. El flujo de artículos de las universidades es mayor, porque hay muchas universidades, se publican personas y las empresas no aceptan esto en todas partes. Pero resultados innovadores: las empresas tienen más de ellos.

Así que capitalizan su fama y sus competencias, atraen a nuevos científicos, explicando que se puede hacer una investigación con ellos, y son geniales. Por ejemplo, hicieron un nuevo modelo, puede ser muy teórico. Pero la mayoría de las veces, es de gran importancia práctica, en primer lugar, en la empresa. Se pueden presentar en código abierto, pero, por ejemplo, como Google, ya serán algunas versiones anteriores, que ellos mismos consideran obsoletas.



Desarrollo abierto, preparación de publicaciones y requisitos para ellas.


Código de tiempo ( versión de audio ) - 23:48



Dmitry: ¿Qué importancia tiene el desarrollo de código abierto en su negocio? ¿Cómo la afectan? En el ejemplo de la automatización de agrupamiento, usted dijo que toma el desarrollo de código abierto y lo aplica sobre una base fundamental que puede estudiar, trabajar a fondo, es decir, ir en la dirección opuesta y no apegarse a cambios rápidos en una esfera estrecha.

Andrés:El código publicado es muy importante. Casi siempre surge la pregunta estándar: ¿qué funciona? Aún así, preguntas de comparación con los resultados. Cuando una persona crea algo, necesita demostrar que es mejor de lo que era antes. Desafortunadamente, con frecuencia surge una situación cuando las personas se comparan con lo que les precedió, según las cifras publicadas en el artículo. Esto no es muy correcto. No hay garantía de que una persona esté reproduciendo un experimento como lo hicieron otros. Por lo tanto, es importante tomar diferentes decisiones y ejecutarlas usted mismo, verificar cómo funcionan y asegurarse de que le fue mejor en una configuración experimental similar.

Solo puede comparar correctamente si tiene el código.


Foto Headway (Unsplash.com)

En segundo lugar, si una persona no desarrolla nada nuevo desde el punto de vista de la competencia, pero quiere aplicar el método, sería bueno tenerlo en GitHub, y podría usarse. Pero incluso cuando se presenta algo, la documentación no siempre está disponible. Raramente publico trabajo con buena documentación. Sucede que no cargan el código en absoluto, y debe implementar todo como se describe en el artículo. Esto es un problema. Esta situación crea dificultades con la reproducibilidad de los resultados del aprendizaje automático. Y este es casi el principal problema en nuestra esfera.

Es fácil publicar resultados de reentrenamiento, pero es difícil verificar si no hay código. Comparamos nuestro propio AutoML con las soluciones existentes. Afortunadamente, hay bibliotecas publicadas que se utilizan activamente. Hay más soluciones novedosas, pero su código no está establecido. Estaba claro que eran peores; lo que presentaron fue un caso especial de nuestra decisión.

Dmitry: ¿Es posible imaginar algunos enfoques que eliminen este problema, al menos en el marco de su trabajo y garanticen la posibilidad de reproducir los resultados?

Andrés:Puede vincular para abrir repositorios y proporcionar documentación. Intento hacerlo todo en todos los artículos. Por desgracia, este no es siempre el caso. Esto sucede con casi todos: una persona escribió un código, funciona, pero la gente se avergüenza de compartirlo con otros, porque se avergüenzan de algunos de sus elementos. Pero trato de difundir la idea de que al escribir un artículo, debe complementarlo con un enlace a GitHub. El repositorio con el código debe estar preparado de antemano.

Dmitry: Aquí necesitas pasar tiempo en su documentación.

Andrew: Al menos mínimamente. Esto es necesario para que lo que está escrito en el artículo ayude a comprender lo que está sucediendo, incluso si el código no está documentado en absoluto. Aunque es dificil. Cuanto más grande es el proyecto, menos ayuda el artículo.



Trabajo de especialistas de laboratorio y frecuencia de producción.


Código de tiempo ( versión de audio ) - 28:37



Dmitry: Si evalúa el tiempo de preparación de un artículo científico y un proyecto práctico, ¿en qué plazo puede una persona darse cuenta de algo en su campo de actividad? Convencionalmente, cada seis meses o un año publica un artículo, y algunos proyectos grandes tardan, digamos, dos años.

Andrei: Hay un problema significativo con el hecho de que depende en gran medida de la hipótesis misma. Es realmente difícil responder esta pregunta. Puedo pintar el proyecto para que se lleve a cabo tanto en dos meses como en dos años. En este caso, se lograrán resultados similares.

Esto no significa que pueda tomar estos dos meses y hacer todos los días doce veces menos. Aquí como con nueve madres. Estamos atados a la potencia informática, pero muchas cosas pueden ser paralelas. Se pueden completar muchas cosas dependiendo de qué trata el proyecto.

Del mismo modo con la preparación de artículos. Hay cosas en las que una modelo aprende una hora, hay cosas en las que una modelo aprende un día. En AutoML, los experimentos pueden ir desde una semana. Sucede que los experimentos no se realizan en tareas razonables, porque no se cuentan. Por lo tanto, hay muchas tareas donde todo se considera en algunos CIFAR. Al menos algunos conjuntos de datos razonables, más como la práctica, nadie está tratando de tocar, porque el artículo se lanzará en dos años, el modelo lo estará, pero ya está desactualizado.

El segundo criterio que afecta el estado de cosas es lo que ya sabe sobre el área temática. Si comprende qué modelos existen, se configura un experimento, prueba una hipótesis específica y todo está bien. Pero generalmente la tarea puede cambiar en el proceso. No demasiado.

Photo Science in HD (Unsplash.com)
Pero ahora ha cambiado un poco en alguna dirección, y es necesario demostrar la novedad de lo que propusiste. Es necesario mirar lo que se ha hecho antes, para comparar.

Resulta que tu decisión es nueva, pero no la mejor. Estás tratando de mejorarlo, el resultado está cambiando. Es necesario demostrar que el resultado es nuevo. Y también, un hombre atornilló en algún lugar el entrenamiento de refuerzo, y ahora debemos mirar en esta dirección.

Este proceso puede ser muy extenso. Hay artículos a largo plazo, están escritos durante mucho tiempo, porque las cosas cambian un poco. Otro punto es la plataforma donde se planea la publicación del artículo. En buenos lugares requieren justificación de por qué su resultado es bueno. Sucede que esta explicación es la que lleva más tiempo. Es decir, el modelo funciona, y comprender por qué funciona es una tarea separada, incluso más complicada que crear este modelo.

Finalmente, la redacción del artículo en sí. Desafortunadamente, todos los lugares dignos de publicación para contribuir a la ciencia son de habla inglesa. Esto impone sus limitaciones. Escribir artículos en inglés no es tan fácil. Si un empleado de laboratorio escribe su primer artículo, lo hará durante mucho tiempo. Si este es su vigésimo artículo, rápidamente. Además, si no pateo activamente a una persona, él escribirá un par de meses, si lo hago, de todas formas unas pocas semanas. Por supuesto, todo depende de cuán complejo sea el tema que está considerando.



La elección del área para el desarrollo y los requisitos previos.


Código de tiempo ( versión de audio ) - 33:04



Dmitry: ¿Cómo afecta la elección inicial de dirección al desarrollo? Por ejemplo, una persona está comenzando a hacer todo esto a un nivel serio y, por ejemplo, ocupa un área demasiado amplia para sí misma. Y aquí las muletas comienzan a subir con cambios periódicos y ganancias en los resultados de las industrias relacionadas, y una persona se queda atrapada en ella como en un pantano. ¿Cómo enfocarse en las etapas iniciales?

Andrew: Tales historias surgen si una persona imagina una variedad de técnicas que puede usar. Si recién está comenzando, lo más probable es que no haya tales problemas.

Dmitry: ¿ Porque la base original, de la que hablamos, se basa en los resultados existentes y una persona no aporta nada nuevo?

Andrés:Sí, se podría decir eso. Leer bien es importante aquí. Cuantos más artículos leas, más fácil será escribirlos. El idioma de los artículos es un idioma separado. Este es el inglés científico. Además, el inglés científico en el aprendizaje automático es diferente del inglés científico en biología. Si una persona lee muchos artículos, le resulta más fácil formular pensamientos y estructurar el artículo.

Dmitry: cuéntenos sobre las características que espera ver en los recién llegados, aquellos que se están preparando para unirse a usted.

Andrés:En primer lugar, esta es la capacidad de programar. El campo se aplica sin él en ninguna parte. Si realizáramos una investigación en un campo completamente fundamental, no podríamos pensarlo: la capacitación matemática sería suficiente. Pero todo lo que hacemos es suponer que se implementará en Python, por ejemplo. La habilidad de programación es crucial.


Foto de Hitesh Choudhary (Unsplash.com)

El segundo son las competencias básicas en el campo del aprendizaje automático. Es importante que la persona en su conjunto comprenda qué es el aprendizaje automático, cómo está organizado, incluso si se dedica a su tarea limitada. Por ejemplo, comenzó a entrenar con refuerzos, pero aquí todavía necesita comprender cómo se estructura el aprendizaje automático en general, qué es el reciclaje. También es importante saber qué modelos e ideas existen para intentar aplicarlos en casa. Un factor más importante es la motivación, el deseo de bucear y el interés interno. Si una persona tiene una mente bien leída, una comprensión del campo, la presencia de sus propias ideas, estará en mejores condiciones para escribir artículos y posicionarse en nuestro campo.

Dmitry:¿Qué logras hacer además de administrar el laboratorio y participar en el trabajo de las salas? De una forma u otra, debe profundizar, comprender, sugerir soluciones, corregir errores. ¿Tienes algún proyecto personal de terceros? ¿Quizás tu día se ve de alguna manera especial? ¿O todos los esfuerzos van solo a actividades de perfil, y es tu pasatiempo?

Andrei: Mi cada día no es como otro. Por ejemplo, en noviembre era menos probable que estuviera en San Petersburgo que en San Petersburgo. Es imposible decir que tengo alguna actividad regular constante en un momento u otro. Estoy tratando de escribir lo que quiero hacer en un mes. Por ejemplo, para leer tantos artículos, hable con sus estudiantes de posgrado, distribuya las tareas dependiendo de dónde estoy, qué hago y qué factores influyen.

Desde pequeño, quería hacer ciencia, me gusta dedicarla todo el tiempo. Es cierto que la gestión del laboratorio no es una ciencia. La actividad organizacional y la actividad científica son dos cosas diferentes. Por lo general, los científicos no están particularmente interesados ​​en la organización y la burocracia. Si una persona logra manejarse bien, entonces no tiene tiempo para una inmersión profunda en la tarea. Desafortunadamente, no puedo combinarlo de manera efectiva: o empiezo a profundizar en el liderazgo y caigo fuera de contexto, o comienzo la investigación, y el proceso organizacional se está desviando. Así que ahora estoy tratando de reconsiderar el enfoque. Nuestro laboratorio tiene un gerente, Ivan Smetannikov, tenemos personal administrativo, pero todavía no hay suficiente personal.

El liderazgo es un proceso complejo y estresante, lleva mucho tiempo. Este es un mal necesario para participar en actividades científicas y resolver más de un problema específico. Podría ser un investigador senior y ocuparme de una o varias tareas, pero de esta manera puedes lidiar con una gran cantidad de temas, y siempre es más interesante: bucear, descargar y encontrar soluciones. Es más interesante para mí encontrar una solución que implementarla y verificarla. Otras personas hacen esto, pero esto no es una delegación de rutina.

En un estudio, casi nunca se puede decir: "¡Haz esto!" Más bien, dicen: "Intenta hacer esto y piensa en esto". Puede establecer una dirección para una persona, dar pistas, no tiene absolutamente ningún trabajo de rutina. Si dice: "Intente resolver este problema", alguien tendrá éxito, pero alguien no. No siempre está claro por dónde empezar y dónde mirar. En algún lugar simplemente dirijo, en algún lugar establezco una tarea, en algún lugar casi lanzo una solución.

Dmitry: ¿ Y seleccionas a los que estarán involucrados en varias áreas?

Andrei: Discutimos con todos lo que quiere hacer y de qué se tratará su investigación.

Dmitry: ¿ Un enfoque tan personal?

Andrés:Por supuesto. Muchos estudios en aprendizaje automático son cosas bastante individuales. Está claro que las personas colaboran en grupos y hacen algo juntas, pero obligar a una persona a hacer algo es un enfoque ineficaz. Sucede que no tiene preferencias y puede ser invitado a hacer algo. Él puede involucrarse. Pero si una persona no se siente atraída, no tiene una motivación intrínseca, no leerá, no se desarrollará. Será un buen intérprete, pero esto no es suficiente para hacer una buena investigación. Necesito interés personal. Por lo tanto, es necesario seleccionar un estudio para una persona.

Dmitry: ¿Qué fuentes o literatura recomienda para aquellos que desean pasar de la programación en sentido amplio al tema del aprendizaje automático?

Andrew: la principal recomendación - cursosen Coursera por Andrew Eun (Andrew Ng). Hay cursos más profundos en la Escuela Superior de Economía. Es importante que haya práctica. El aprendizaje automático se trata de cómo funcionan realmente los algoritmos con los datos. Esto está lejos de ser matemático, porque los datos afectan lo que necesita hacer con ellos. Puede sentir esto al aprender, hay muchas trampas y detalles en el código. Puedo recomendar libros: " Aprendizaje profundo " de Sergei Nikolenko, el más clásico Hesti, Tibshirani, Friedman o el obispo completamente clásico . Por supuesto, está un poco desactualizado, pero puedes hacer una buena idea.



Podcast cocina y lidera dmitrykabanov.

Lectura adicional:




Startups de ITMO University (nuestros materiales en inglés sobre Habré):




All Articles