Una selección de artículos sobre aprendizaje automático: estudios de casos, guías e investigaciones para enero de 2020

El trabajo de investigación en el campo del aprendizaje automático está abandonando gradualmente los laboratorios universitarios y desde la disciplina científica se aplica. Sin embargo, aún es difícil encontrar artículos relevantes escritos en lenguaje sencillo y sin mil millones de notas al pie.

Esta publicación contiene una lista de materiales en inglés para enero, que están escritos sin un académico excesivo. En ellos encontrará ejemplos de código y enlaces a repositorios no vacíos . Las tecnologías mencionadas son de dominio público y no requieren hierro pesado para las pruebas.

Los artículos se dividen en cuatro tipos: anuncios de herramientas de código abierto, casos de uso del aprendizaje automático en el desarrollo comercial, investigación de ML y pautas prácticas para usar PyTorch y TensorFlow.



Anuncios de tecnología de código abierto para aprendizaje automático


LaserTagger

El artículo discute brevemente la funcionalidad y la arquitectura de LaserTagger ; Una herramienta que le permite generar texto de varias maneras: combinar y dividir oraciones, así como volver a contarlas en otras palabras. A diferencia de los modelos seq2seq, reutiliza palabras, lo que garantiza una alta velocidad de generación de texto.

Reformer

Para procesar datos en serie (texto, música o video) se requiere un gran recurso de memoria, ya que estos datos dependen del contexto circundante. A diferencia de Transformer, un modelo arquitectónico popular para redes neuronales, Reformerconsume mucha menos memoria para mantener el contexto, solo 16 GB. Esto es suficiente para trabajar con grandes conjuntos de datos de texto: Reformer, por ejemplo, pudo procesar el texto "Crimen y castigo". También puede usar la herramienta para "terminar" los fragmentos de imagen que faltan.

Wav2letter @ en cualquier lugar

La mayoría de los marcos de reconocimiento de voz en tiempo real utilizan redes neuronales recurrentes, mientras que Wav2letter @ en cualquier lugarutiliza modelo acústico convolucional. El marco está escrito en C ++ y se integra fácilmente en otros lenguajes de programación. Los creadores lograron aumentar el rendimiento tres veces y proporcionar eficiencia computacional en procesadores poco potentes. El artículo proporciona puntos de referencia y enlaces a modelos que ayudarán a repetir los resultados del aprendizaje.

Polygames Un

marco que enseña inteligencia artificial para jugar juegos de estrategia, incluso juegos completamente desconocidos. A diferencia de otras tecnologías similares, este modelo no aprende de numerosos ejemplos de administración exitosa de juegos, por lo tanto, no requiere conjuntos de datos. Herramienta

HiPlot

para visualizar datos de investigación. Le permite evaluar la efectividad de los hiperparámetros, como la velocidad de aprendizaje, la regularización y la arquitectura. El artículo proporciona fragmentos de código de Python y ejemplos de sus visualizaciones. HiPlot es compatible con Jupiter Notebook.

Guías de aprendizaje automático



TensorFlow.js La

biblioteca de código abierto le permite ejecutar modelos de aprendizaje automático sin salir del ecosistema JS. Funciona en todos los navegadores actuales, el lado del servidor en Node.js y las plataformas móviles en React Native.

Crear un componente TFX personalizado

Cualquiera puede usar la plataforma TFX para crear canales de aprendizaje automático listos para usar. La plataforma ofrece una tonelada de componentes estándar, pero hay momentos en que no son adecuados. Este artículo habla sobre cómo crear una canalización totalmente personalizada para trabajar con TensorFlow.

Acelera NVIDIA Dali con PyTorch

El artículo analiza algunas formas de optimizar el uso de DALI y crear un proceso que usa solo la CPU (sin una GPU) y acelera el proceso de aprendizaje automático en PyTorch 4 veces.

Control de versiones de datos y modelos para una rápida experimentación en el aprendizaje automático Este

artículo describe cómo crear y usar conjuntos de datos versionados para un proceso de aprendizaje automático reproducible. Como ejemplo, usando Git, Docker y Quilt, se crea una red neuronal profunda para el reconocimiento de objetos usando Detectron2, un sistema basado en PyTorch que usa algoritmos para el reconocimiento de objetos.

Entrenamiento de transferencia activa en PyTorch

La capacitación de transferencia es un proceso cuando un modelo de aprendizaje automático creado para una tarea específica se adapta a otra tarea. Por lo general, es suficiente volver a entrenar las últimas capas en un modelo existente. La ventaja es que esto requiere un etiquetado mínimo de los datos por parte de los humanos. Este artículo proporciona orientación sobre la aplicación del aprendizaje de transferencia al aprendizaje activo, cuyo objetivo es identificar patrones de datos que las personas deben etiquetar.

Casos de desarrollo comercial


Crear una biblioteca de música inteligente con TensorFlow Los

desarrolladores de la plataforma de transmisión de música líder en China comparten su experiencia utilizando el marco. Cuentan en detalle qué instrumentos se usaron, cómo entrenaron al modelo para determinar el género y el estilo de la música para las recomendaciones posteriores. Separe la voz de la música, por ejemplo, para emitir la letra de una canción utilizando el reconocimiento de texto. Dado que parte del contenido de la plataforma fue grabado por usuarios sin equipo especial de grabación de sonido, los autores aprendieron a eliminar la interferencia y el ruido de fondo.

Entrenamiento de perros con aprendizaje automático

Los perros obedientes que conocen al equipo tienen más probabilidades de encontrar nuevos dueños y abandonar el refugio. Sin embargo, no todos los refugios tienen la capacidad de entrenar perros. El objetivo del proyecto es entrenar el automóvil para que comprenda si el perro ha completado el comando "Siéntate", si el perro ladra o se queja, etc.

Capacitación de una aspiradora Un

fabricante chino de aspiradoras inteligentes ha entrenado dispositivos para reconocer los calcetines y los cables esparcidos por el piso. Case habla sobre las dificultades de crear un conjunto de datos único a partir de fotografías y usar varios algoritmos de aprendizaje automático.

Cree una cámara inteligente con TensorFlow Lite en la Raspberry Pi

La cámara puede detectar una sonrisa en la cara de una persona y tomar una foto automáticamente. Ella puede ser controlada por comandos de voz. Para el desarrollo, elegimos la Raspberry Pi 3B +, con un gigabyte de RAM y un sistema operativo de 32 bits. TensorFlow Light se ha establecido como un marco para dispositivos móviles e IoT. El artículo muestra los algoritmos del sistema de reconocimiento de sonrisas y comandos de voz.

Investigación


Red neuronal para resolver ecuaciones matemáticas

Facebook ha desarrollado la primera red neuronal que utiliza lógica simbólica para resolver ecuaciones integrales y diferenciales del primer y segundo tipo. Solía ​​ser que el aprendizaje automático no era adecuado para tal tarea, ya que las matemáticas requieren una precisión absoluta, no aproximada. Los autores del estudio utilizaron la traducción automática neuronal. Las ecuaciones fueron percibidas por la máquina como oraciones de texto y las soluciones como su traducción. Para esto fue necesario compilar la sintaxis y preparar un conjunto de datos de entrenamiento de más de 100 millones de ecuaciones de pares y sus soluciones. Por lo tanto, el estudio muestra que las redes neuronales se pueden usar no solo para distinguir entre patrones.

AI Habitat: navegación ultra precisa AI en el espacio de

Facebook ha desarrollado un algoritmo de aprendizaje de refuerzo DD-PPO a gran escala que hace frente efectivamente a la navegación en el espacio de locales residenciales y de oficinas utilizando datos de la cámara RGB-D, GPS y brújula. Los robots entrenados con DD-PPO logran su objetivo con una precisión del 99.9%. El artículo contiene videos impresionantes.

¿Puedes confiar en las incertidumbres de tu modelo? Código

publicado y resultados de investigación, que se centra en el problema del cambio covariante, cuando los datos para entrenar el modelo no coinciden con la muestra de prueba. Los autores realizaron un extenso análisis comparativo de los modelos más avanzados, proporcionándoles conjuntos de datos de texto, imágenes, publicidad en línea y genómica. El objetivo era determinar la precisión de los métodos populares. En los puntos de referencia, el método de conjunto demostró ser el más confiable.

¡Gracias por la atención!

Antes de la versión de prueba, cualquier recomendación es bienvenida.

Source: https://habr.com/ru/post/undefined/


All Articles