Podcast: o que espera cientistas iniciantes no campo da defesa

Conforme prometido , fornecemos uma transcrição completa do primeiro lançamento do nosso podcast ( você pode ouvi-lo no Apple Podcasts ). Andrei Filchenkov , Ph.D. (Física e Matemática), professor associado da Faculdade de Tecnologias da Informação e Programação e chefe do grupo de aprendizado de máquina do laboratório internacional de ciência da computação , conversou conosco .


Foto de Samuel Bourke (Unsplash.com)

Dmitry:No ano passado, vocêrecebeuo Prêmio Ilya Segalovich e disse que está envolvido em diferentes áreas, sem nenhum vetor comum além do aprendizado de máquina. Por favor, comente sobre essa abordagem. Essa liberdade é decisiva para você?

Andrei Filchenkov:Quando cheguei ao trabalho na Universidade ITMO, em nosso Laboratório de Tecnologias de Computação, que já havia se tornado um centro científico, não havia nada diretamente relacionado ao aprendizado de máquina. E começamos a experimentar. Foi o ano de 2014.

Dmitry:Você formulou a tarefa para si mesmo?

Andrew:Eles montaram, decidiram. O aprendizado de máquina é projetado de tal maneira que as idéias fluem de uma área para outra e os modelos fluem de uma tarefa para outra. É muito difícil limitar-se a algo. E assim, não somos apenas nós que trabalhamos. Quase sempre, os pesquisadores da área de aprendizado de máquina não se sentam estritamente em um nicho; há sempre muita pesquisa por aí.

Outra coisa é que inicialmente não tínhamos um vetor em torno do qual construiríamos nosso trabalho. Mas agora nos aprofundamos em tópicos específicos e geralmente limitamos o número de nichos em que trabalhamos. Antes de tudo, trata-se de aprendizado automático de máquinas, tudo relacionado ao processamento e geração de imagens, incluindo vídeo, análise de redes sociais.

Dois tópicos relativamente novos apareceram no ano passado: aprendizado de máquina para análise de código e aprendizado de máquina para roteamento. Temos roteado desde 2016, mas nos aprofundamos neste tópico. Tentamos realizar uma variedade de tarefas, mas essa abordagem afeta os resultados. Agora, estamos tentando focar mais na qualidade do que na diversidade.

Dmitry: E, portanto, você já está formulando problemas pontuais para quem trabalha no laboratório e atuando como um mentor teórico para um grande número de especialistas?

Andrew: Sim.

Dmitry: Pode parecer ao leigo que essa atividade esteja relacionada a coisas, fórmulas e artigos científicos muito básicos. Mas os caras do laboratório, como você pode ver, trabalhe com a análise de redes sociais, mecanismos de recomendação, analise o Twitter de Trump. Por favor, conte-nos sobre projetos que sejam compreensíveis em nível prático?

Andrey: Nossa atividade pode ser dividida em duas categorias. O primeiro são algoritmos aplicáveis ​​a muitas coisas. Por exemplo, algoritmos de seleção de recursos. Eles são necessários para muitas tarefas - para analisar sequências de DNA, processar dados médicos e assim por diante. A segunda categoria são as tarefas da área de assunto em que já estamos tentando usar algoritmos diferentes. Existem mais tarefas nesta categoria, elas são compreensíveis e diversas, e nem sempre completamente científicas.

Na foto: Andrey Filchenkov
Além do laboratório, temos um ambiente comum em que startups e empresas giram. Eles vêm com pedidos industriais, tarefas surgem bastante práticas. Recentemente, trabalhamos com o canal TVC. Eles têm um grande número de documentos e artigos diferentes. E eles estão muito interessados ​​em monitorar como esse ou aquele fenômeno é apresentado na imprensa e como muda com o tempo - quantos Ilon Mask convencionais existem na imprensa, em que contexto ele é encontrado. Escrevemos um mecanismo de pesquisa para eles, a fim de executar rapidamente consultas bastante complexas em um banco de dados bastante grande.

Dmitry: Foi mais eficaz entrar em contato com você e apresentar um desenvolvimento personalizado do que ir ao mercado para um produto acabado em “caixa”?

Andrew: Sim. Eles têm uma tarefa específica. Não existem tais soluções no mercado.

Também fazemos coisas bastante interessantes com Vk, onde um de nossos alunos de pós-graduação trabalha. A publicidade é uma das principais fontes de receita do site, como a maioria dessas empresas. E você precisa entender para quem mostrar esse anúncio, para que tudo seja eficaz. A tarefa é assim. Há um grande número de anunciantes. Precisamos garantir que eles tenham shows, e as pessoas se tornem relevantes.

Existem vários estudos relacionados à medicina. Por exemplo, uma análise da pele de uma fotografia para identificar marcadores médicos importantes. Existem dois tópicos. Um deles está relacionado à identificação de se uma toupeira é uma toupeira ou é um sinal de que algo sério pode ser. A segunda é a compreensão do que causa essas ou aquelas manchas, erupções cutâneas (podem ser sintomas de um grande número de doenças da pele e de transmissão sexual).

Dmitry:E aqui você pode aumentar a disponibilidade de diagnósticos básicos?

Andrew: Sim. Mas mesmo que os sintomas sejam visíveis porque estão na pele, sua classificação não é tão simples. Automatizamos essa tarefa para que você possa colocar o aplicativo no telefone, tirar uma foto e entender, mas há algo suspeito. Não tomamos decisões aqui, mas se o aplicativo informar à pessoa que parece que ele tem algo errado, é melhor ir ao médico e obter uma consulta.



Transferência de várias soluções e o desenvolvimento da esfera da região de Moscou


Código de tempo ( versão em áudio ) - 09:07



Dmitry: Você já teve situações em que tomou decisões que foram testadas em uma área de atividade e as aplicou em outra área, como um experimento ou quando estava tendo dificuldades com uma tarefa?

Andrew:Normalmente, tentamos usar o aprendizado automático de máquinas. Grosso modo, temos uma caixa preta na qual eliminamos tarefas e obtemos soluções básicas. Eles, é claro, geralmente são piores do que você pode fazer com as mãos depois disso, mas essa é uma linha de base na qual você pode se concentrar. Se falamos de soluções específicas, por exemplo, relacionadas ao processamento de imagens, a transferência funciona aqui. O básico é o VGG pré-treinado e seu treinamento adicional em dados. A formação de soluções básicas baseadas em redes de acesso treinadas e dispostas é uma etapa padrão. E muitas vezes acontece que é melhor não fazer nada na configuração atual.

Dmitry: Nesse caso, acontece que você está alterando algumas coisas arquitetônicas do ponto de vista do ferro, ou trata-se apenas de soluções de software, algoritmos?

Andrew:Normalmente, falamos apenas de algoritmos. Havia poucos problemas para os quais teríamos que nos adaptar ao ferro. O mais brilhante é o que fizemos com a Huawei para reconhecer caracteres em fotos. Havia restrições bastante rígidas relacionadas ao fato de que esse modelo precisava ser implementado no telefone. Onde não há muita memória, existem restrições nas operações que podem ser usadas, pois é impossível aplicar de forma pura o que fizemos no TensorFlow. E aqui tivemos que nos esquivar, porque houve boas decisões, mas sem a possibilidade de transferência, e tivemos que nos esforçar bastante. Porém, mais frequentemente tomamos uma decisão que rapidamente funciona em algum lugar do servidor, mas sem restrições para todo o resto.

Dmitry:Eu pergunto, porque muitas vezes surge a questão de que depende a eficiência de um sistema assim. Conte-nos quais problemas você está enfrentando atualmente em termos de evolução de algoritmos e abordagens teóricas para essa área? Existe algum limite que essa esfera alcançou ou está se desenvolvendo rapidamente agora?

Andrew:A questão é bastante complicada, mas interessante. Durante muito tempo, tudo ficou realmente limitado ao ferro. Havia algoritmos bastante complexos, mas eles nem sempre funcionavam bem. Agora, muita coisa está conectada às redes neurais, porque apareceu o poder da computação que lhes permite dirigir. Embora, a partir de algum ponto, o poder da computação tenha se tornado menos importante, sempre queremos dizer que teremos certos custos. Se falamos de algoritmos clássicos, não há problemas específicos com capacidades. A questão é como encontrar rápida e eficientemente as melhores soluções.

Inicialmente, como as capacidades eram limitadas, era importante que a pessoa que resolvesse o problema entendesse como os algoritmos funcionam, seus requisitos de recursos e aplicabilidade para esta tarefa. Houve um período em que isso não aconteceu, pois as capacidades se tornaram bastante acessíveis.

Dmitry: Ou seja, houve um salto significativo no crescimento do poder e das capacidades da computação. Levantamos um pouco a mão de um pulso. Agora você está retornando.

Andrew: Sim, nos últimos dois anos, houve um aumento no aprendizado automático de máquinas. E existe uma versão em que todo o conhecimento que existe agora em aprendizado de máquina pode ser substituído por um aumento de cem vezes no poder da computação. O aprendizado automático de máquinas está realmente tentando encontrar uma solução para o seu problema. E isso é uma questão de capacidade, já que é uma pesquisa, não uma pesquisa exaustiva, mas ainda muito complexa, longa e em larga escala, exigindo uma enorme quantidade de recursos de computação. Como resultado, repousamos novamente no fato de que o conhecimento está sendo substituído por recursos e sua disponibilidade.


Foto de Franki Chamaki (Unsplash.com)

Acredito que nunca nos encontraremos em uma situação em que um especialista não seja necessário, porque ainda existem muitas tarefas que não podem ser executadas e automatizadas como essa (definir uma tarefa, entender os processos de negócios) até chegarmos a sistemas poderosos inteligência artificial. No mínimo, não será muito em breve. Portanto, a tarefa será preservada, mas os requisitos para que o poder de computação seja iniciado novamente se tornem um dos fatores principais.

Dmitry: Mas, ao mesmo tempo, você ainda precisa executar algumas ações para "acompanhar" o crescimento do poder da computação em termos da eficiência dos próprios algoritmos. Empresas que podem ter enormes capacidades, mas ainda assim, parece-me, cada tarefa tem um certo prazo, no qual deve ser resolvido e permanecer relevante.

Andrew: Sim. Existe uma qualidade desejada, há um tempo pelo qual é necessário alcançá-la. Somos limitados de ambos os lados. Se houver tempo suficiente, a qualidade é quase sempre possível. Embora, é claro, cada tarefa tenha limitações fundamentais sobre qual qualidade pode ser obtida. Grosso modo, não seremos capazes de prever o personagem pela localização das luas melhor do que uma moeda. Mas se a restrição necessária não atingir o teto, podemos alcançar a qualidade desejada por algum tempo. Às vezes, podemos dizer que, no tempo previsto, encontramos uma solução bastante boa, não conseguimos o melhor para esse momento. Sempre existem essas duas "coordenadas".



O estudo de novos resultados, sua compreensão e adaptação


Código de tempo ( versão em áudio ) - 16:41



Dmitry: Do ponto de vista do desenvolvimento profissional daqueles que trabalham em seu laboratório, como você pode avaliar a distribuição do conhecimento básico e do treinamento teórico em comparação com o que você precisa estudar diretamente no processo: analisar artigos científicos, avanços, mudanças nesta área? Quantas dessas mudanças ocorrem como parte de uma semana ou mês? Quão difícil é implementá-los em suas atividades, nos projetos em que você está trabalhando aqui agora?

Andrew:Esta é uma pergunta muito boa. Tudo depende da área. Por exemplo, um estudante de graduação que está automatizando a tarefa de agrupar agora está me protegendo. Em geral, não há um fluxo muito grande de novos resultados. Por outro lado, ele faz o AutoML para cluster. Aqui não é tão fácil acompanhar o fluxo de novos resultados. Além disso, é difícil limitar-se a uma área.

Como eu disse no início, no campo do aprendizado de máquina, tudo está fortemente conectado. As idéias que surgiram originalmente no campo do processamento de imagens fluem em algumas etapas em outros lugares. O processamento de texto é o candidato mais próximo. Um dos fatores de sucesso mais importantes é simplesmente estar ciente do que está acontecendo não apenas no seu nicho, mas também no campo do aprendizado de máquina em geral.

Foto de Nick Hillier (Unsplash.com)
Isso é difícil de fazer porque muitos resultados são gerados. Dezenas de milhares de participantes em grandes conferências, um grande número de trabalhos, até centenas de trabalhos por semana nos arquivos. Essa quantia é difícil de se conseguir. Mas os marcos são importantes a serem observados.

Para fazer isso, você não precisa digitalizar o arquivo ou ler as coleções de conferências de capa a capa, mas é muito importante assinar o público relacionado ao aprendizado de máquina e acompanhar o que está escrito lá.

Inicialmente, houve muitos resultados diferentes no processamento de idiomas. Assim que o Word2vec apareceu, todos começaram a se mudar para casamentos. Existem muitos deles. Havia várias tarefas básicas, mas para tarefas específicas diferentes elas tinham suas próprias, e era necessário monitorar como elas as melhoravam. Em seguida, o Google lançou o BERT e deu um grande aumento. Em algum momento, verificou-se que, se você entendeu como o BERT funciona, e se está envolvido no processamento do inglês, realmente não precisa de nada.

Você não pode se preocupar com os sucessos das novas versões do fastText e com os embeddings baseados nele. O BERT agora tem muitas mudanças. Ainda é básico, como o Word2vec de uma vez. Mas já existem muitas modificações saindo com uma frequência de vários empregos por mês ou até menos por semana.

E essa dinâmica está mudando o tempo todo. Há um lugar onde tudo desmorona, e aqui você pode acompanhar algo, depois ele começa a florescer em cores diferentes novamente, e você precisa seguir isso. O problema é que isso está acontecendo com mais frequência, ou seja, a velocidade com que novos resultados aparecem está apenas aumentando. Como acompanhar isso é um daqueles problemas fundamentais da vida que encontro.

Dmitry: Essas explosões de atividade aparecem mais em torno de grandes empresas que criam suas próprias estruturas ou a comunidade científica lança alguma coisa?

Andrew:Todos estão envolvidos em diferentes graus. Eu tenho que admitir que as empresas têm mais resultados que as universidades. Depende da área. Um cenário típico é quando grandes cientistas trabalham não apenas nas universidades, mas também nas empresas. Na maioria das vezes, eles contratam aqueles que continuam realizando atividades de pesquisa. Portanto, a empresa acumula um enorme potencial intelectual. As universidades raramente podem fornecer poder de computação e conjuntos de dados semelhantes; portanto, os dados da empresa sobre artigos (afiliação) são encontrados com mais e mais frequência.

Dmitry: Mesmo em artigos, apesar do fato de a empresa ter a capacidade de fechar a maioria de seus desenvolvimentos e pesquisas do público? Isso faz algum sentido. Mas a universidade não tem essa oportunidade; por sua natureza, é obrigada a publicar algo.

Andrew:De fato, pode haver um viés. As universidades publicam em qualquer caso, porque essa é a especificidade de seu trabalho. O fluxo de artigos das universidades é maior, porque existem muitas universidades, pessoas são publicadas e as empresas não aceitam isso em todos os lugares. Mas resultados inovadores - as empresas têm mais deles.

Então eles capitalizam sua fama e competências, atraem novos cientistas, explicando que a pesquisa pode ser feita com eles e muito legal. Por exemplo, eles fizeram um novo modelo, pode ser muito teórico. Mas, na maioria das vezes, é de grande importância prática na empresa, em primeiro lugar. Eles podem ser dispostos em código aberto, mas, por exemplo, como o Google, já haverá algumas versões anteriores, que eles mesmos consideram desatualizados.



Desenvolvimento aberto, preparação de publicações e requisitos para eles


Código de tempo ( versão em áudio ) - 23:48



Dmitry: Qual a importância do desenvolvimento de código aberto nos seus negócios? Como eles a afetam? No exemplo da automação de cluster, você disse que adota o desenvolvimento de código-fonte aberto e o aplica de alguma forma fundamental para poder estudar, trabalhar minuciosamente, ou seja, seguir o outro caminho e não se apegar a mudanças rápidas em uma esfera estreita.

Andrew:O código publicado é muito importante. Quase sempre surge a pergunta padrão - o que é apresentado funciona. Ainda - questões de comparação com os resultados. Quando uma pessoa cria algo, ele precisa provar que é melhor do que era antes. Infelizmente, muitas vezes surge uma situação quando as pessoas se comparam com o que veio antes delas, de acordo com os números publicados no artigo. Isso não está muito correto. Não há garantia de que uma pessoa esteja reproduzindo um experimento da mesma maneira que outros. Portanto, é importante tomar decisões diferentes e executá-las, verificar como elas funcionam e garantir que você tenha se saído melhor em uma configuração experimental semelhante.

Você só pode comparar corretamente se você tiver o código. Headway da


foto (Unsplash.com)

Em segundo lugar, se uma pessoa não desenvolve nada de novo do ponto de vista da concorrência, mas deseja aplicar o método, seria bom tê-lo no GitHub e poderia ser usado. Mas mesmo quando algo é apresentado, a documentação nem sempre está disponível. Publique raramente trabalhos com boa documentação. Acontece que eles não carregam o código e você precisa implementar tudo conforme descrito no artigo. Isso é problema. Essa situação cria dificuldades com a reprodutibilidade dos resultados do aprendizado de máquina. E este é quase o principal problema em nossa esfera.

É fácil publicar resultados de reciclagem, mas é difícil verificar se não há código. Comparamos nosso próprio AutoML com as soluções existentes. Felizmente, existem bibliotecas publicadas que são ativamente usadas. Existem mais soluções novas, mas seu código não é definido. Ficou claro que eles eram piores - o que eles expuseram foi um caso especial de nossa decisão.

Dmitry: É possível prever algumas abordagens que eliminem esse problema, pelo menos no âmbito do seu trabalho e garantam a possibilidade de reproduzir os resultados?

Andrew:Você pode criar um link para abrir repositórios e fornecer documentação. Eu tento fazer tudo isso em todos os artigos. Infelizmente, esse nem sempre é o caso. Isso acontece com quase todos: uma pessoa escreveu um código, funciona, mas as pessoas têm vergonha de compartilhá-lo com outras pessoas, porque têm vergonha de alguns de seus elementos. Mas tento espalhar a ideia de que, ao escrever um artigo, você precisa complementá-lo com um link para o GitHub. O repositório com o código deve ser preparado com antecedência.

Dmitry: Aqui você precisa gastar tempo com sua documentação.

Andrew: Pelo menos minimamente. Isso é necessário para que o que está escrito no artigo ajude a entender o que está acontecendo, mesmo que o código não esteja documentado. Embora seja difícil. Quanto maior o projeto, menos o artigo ajuda.



Trabalho de especialistas de laboratório e frequência de saída


Código de tempo ( versão em áudio ) - 28:37



Dmitry: Se você avaliar o tempo de preparação de um artigo científico e de um projeto prático, em que período uma pessoa pode perceber algo em seu campo de atividade? Convencionalmente, a cada seis meses ou um ano, ele publica um artigo, e algum grande projeto leva, digamos, dois anos.

Andrei: Há um problema significativo com o fato de depender fortemente da própria hipótese. É realmente difícil responder a essa pergunta. Posso pintar o projeto para que seja realizado em dois meses e em dois anos. Nesse caso, resultados semelhantes serão alcançados.

Isso não significa que você pode levar esses dois meses e fazer todos os dias doze vezes menos. Aqui como com nove mães. Estamos ligados ao poder da computação, mas muitas coisas podem ser paralelas. Muitas coisas podem ser concluídas dependendo do objetivo do projeto.

Da mesma forma com a preparação de artigos. Há coisas em que um modelo aprende uma hora, há coisas em que um modelo aprende por dia. No AutoML, as experiências podem durar uma semana. Acontece que os experimentos não são colocados em tarefas razoáveis, porque não são contados. Portanto, existem muitas tarefas em que tudo é considerado em algum CIFAR. Pelo menos alguns conjuntos de dados razoáveis, mais parecidos com a prática, ninguém está tentando tocar, porque o artigo será lançado em dois anos, o modelo estará, mas já desatualizado.

O segundo critério que afeta o estado das coisas é o que você já sabe sobre a área de assunto. Se você entende quais modelos existem, é criado um experimento, você testa uma hipótese específica e está tudo bem. Mas geralmente a tarefa pode mudar no processo. Não muito.

Photo Science in HD (Unsplash.com)
Mas agora mudou um pouco em alguma direção, e é necessário provar a novidade do que você propôs. É necessário olhar para o que foi feito anteriormente, para comparar.

Acontece que sua decisão é nova, mas não a mais legal. Você está tentando melhorá-lo, o resultado está mudando. É necessário provar que o resultado é novo. E também, um homem ferrou em algum lugar do treinamento de reforço, e agora devemos olhar nessa direção.

Este processo pode ser muito esticado. Existem artigos de longo prazo, eles são escritos há muito tempo, porque as coisas mudam um pouco. Outro ponto é a plataforma em que a publicação do artigo está planejada. Em bons lugares, eles exigem justificativas para o resultado ser bom. Acontece que essa explicação é mais demorada. Ou seja, o modelo funciona e entender por que funciona é uma tarefa separada, ainda mais complicada do que criar esse modelo.

Finalmente, a redação do artigo em si. Infelizmente, todos os lugares dignos de publicação para contribuir com a ciência são de língua inglesa. Isso impõe suas limitações. Escrever artigos em inglês não é tão fácil. Se um funcionário do laboratório escrever seu primeiro artigo, ele o fará por um período muito longo. Se este é o seu vigésimo artigo, rapidamente. Além disso, se eu não chutar ativamente uma pessoa, ela escreverá alguns meses, se eu o fizer, de qualquer maneira algumas semanas. Claro, tudo depende de quão complexo é o assunto que ele está considerando.



A escolha da área para desenvolvimento e pré-requisitos


Código de tempo ( versão em áudio ) - 33:04



Dmitry: Como a escolha inicial da direção afeta o desenvolvimento? Por exemplo, uma pessoa está apenas começando a fazer tudo isso em um nível sério e, por exemplo, ocupa uma área muito ampla para si mesma. E aqui as muletas começam a subir com mudanças periódicas e ganhos nos resultados de indústrias relacionadas, e uma pessoa fica presa nela como em um pântano. Como se concentrar nos estágios iniciais?

Andrew: Essas histórias surgem se uma pessoa imagina uma variedade de técnicas que pode usar. Se ele está apenas começando, provavelmente não haverá esses problemas.

Dmitry: Porque a base original, sobre a qual falamos, se baseia nos resultados existentes, e uma pessoa não traz nada de novo?

Andrew:Sim, você poderia dizer isso. Bem lido é importante aqui. Quanto mais artigos você lê, mais fácil é escrevê-los. O idioma dos artigos é um idioma separado. Isto é inglês científico. Além disso, o inglês científico em aprendizado de máquina é diferente do inglês científico em biologia. Se uma pessoa lê muitos artigos, fica mais fácil formular pensamentos e estruturar o artigo.

Dmitry: Conte-nos sobre os recursos que você espera ver nos recém-chegados - aqueles que estão se preparando para se juntar a você.

Andrew:Primeiro de tudo, essa é a capacidade de programar. O campo é aplicado, sem ele em qualquer lugar. Se realizássemos pesquisas em um campo completamente fundamental, não poderíamos pensar nisso - o treinamento matemático seria suficiente. Mas tudo o que fazemos é assumir que ele será implementado no Python, por exemplo. A habilidade de programação é crucial.


Foto de Hitesh Choudhary (Unsplash.com)

A segunda são as principais competências no campo de aprendizado de máquina. É importante que a pessoa como um todo entenda o que é o aprendizado de máquina, como ele é organizado, mesmo que esteja envolvido em sua tarefa restrita. Por exemplo, ele começou a treinar com reforços, mas aqui você ainda precisa entender como o aprendizado de máquina é estruturado em geral, o que é reciclagem. Também é importante saber quais modelos e idéias existem para tentar aplicá-los em casa. Um fator mais importante é a motivação, o desejo de mergulhar e o interesse interno. Se uma pessoa tem uma mente bem lida, uma compreensão do campo, a presença de suas próprias idéias, ele será mais capaz de escrever artigos e se posicionar em nosso campo.

Dmitry:O que você consegue fazer além de gerenciar o laboratório e participar do trabalho das enfermarias? De uma forma ou de outra, você precisa se aprofundar, entender, sugerir soluções, corrigir erros. Você tem algum projeto pessoal de terceiros? Talvez o seu dia pareça de alguma forma especial? Ou todos os esforços vão apenas para o perfil das atividades, e esse é o seu hobby?

Andrei: Meu dia a dia não é como outro. Por exemplo, em novembro, era menos provável que eu estivesse em São Petersburgo do que em São Petersburgo. É impossível dizer que tenho uma atividade regular consistente de uma vez ou outra. Estou tentando escrever o que quero fazer em um mês. Por exemplo, para ler tantos artigos, converse com seus alunos de pós-graduação, distribua tarefas dependendo de onde eu estou, o que faço e que fatores a influenciam.

Desde a infância, eu queria fazer ciência, gosto de dedicar o tempo todo. É verdade que a administração do laboratório não é exatamente uma ciência. Atividade organizacional e atividade científica são duas coisas diferentes. Geralmente, os cientistas não estão particularmente interessados ​​em organização e burocracia. Se uma pessoa consegue gerenciar bem, não tem tempo para uma imersão profunda na tarefa. Infelizmente, não posso combiná-lo de forma eficaz: ou começo a me aprofundar na liderança e fico fora de contexto, ou inicio a pesquisa e o processo organizacional está se encaminhando. Então agora estou tentando reconsiderar a abordagem. Nosso laboratório tem um gerente, Ivan Smetannikov, temos pessoal administrativo, mas ainda não há pessoal suficiente.

Liderança é um processo complexo e estressante, leva muito tempo. Este é um mal necessário para se engajar em atividades científicas e resolver mais de um problema específico. Eu poderia ser um pesquisador sênior e lidar com uma ou várias tarefas, mas dessa maneira você pode lidar com um grande número de tópicos, e é sempre mais interessante - mergulhar, descarregar, encontrar soluções. É mais interessante para mim encontrar uma solução do que implementá-la e verificá-la. Outras pessoas fazem isso, mas isso não é uma delegação de rotina.

Em um estudo, você quase nunca pode dizer: "Faça isso!" Em vez disso, eles dizem: "Tente fazer isso e pense sobre isso". Você pode definir uma pessoa para uma direção, dar pistas, ela não tem absolutamente nenhum trabalho de rotina. Se você disser: “Tente resolver este problema”, alguém terá sucesso, mas alguém não. Nem sempre é claro por onde começar e por onde procurar. Em algum lugar que eu apenas dirijo, em algum lugar que defino uma tarefa, em algum lugar que quase implanto uma solução.

Dmitry: E você seleciona aqueles que estarão envolvidos em várias áreas?

Andrei: Discutimos com todos o que ele quer fazer e sobre o que serão suas pesquisas.

Dmitry: Uma abordagem tão pessoal?

Andrew:Claro. Muitos estudos em aprendizado de máquina são coisas bastante individuais. É claro que as pessoas colaboram em grupos e fazem algo juntos, mas forçar uma pessoa a fazer algo é uma abordagem ineficaz. Acontece que ele não tem preferências e pode ser convidado a fazer alguma coisa. Ele pode se envolver. Mas se uma pessoa não é atraída, ela não tem motivação intrínseca, não lê, não se desenvolve. Ele será um bom ator, mas isso não é suficiente para fazer uma boa pesquisa. Precisa de interesse pessoal. Portanto, é necessário selecionar um estudo para uma pessoa.

Dmitry: Quais fontes ou literatura você recomenda para quem quer passar da programação em seu sentido amplo para o tópico de aprendizado de máquina?

Andrew: A principal recomendação - cursosno Coursera por Andrew Eun (Andrew Ng). Existem cursos mais profundos na Escola Superior de Economia. É importante que haja prática. O aprendizado de máquina é sobre como os algoritmos realmente funcionam com os dados. Isso está longe de ser matemático, porque os dados afetam o que você precisa fazer com eles. Você pode sentir isso ao aprender, há muitas armadilhas e detalhes no código. Posso recomendar os livros: Deep Learning de Sergei Nikolenko, o mais clássico Hesti, Tibshirani, Friedman ou o bispo completamente clássico . Claro, está um pouco desatualizado, mas você pode fazer uma boa ideia.



Podcast cozinha e lidera dmitrykabanov.

Leitura adicional:




Startups da ITMO University (nossos materiais em inglês em Habré):




All Articles