👩🏻‍🎓 🍰 👨‍💼 Una selección de artículos sobre aprendizaje automático: casos, guías y estudios para febrero de 2020 🎅🏽 👨‍👧‍👦 🐖

Después de la publicación de enero, conozca el segundo número del resumen. Aquí encontrará una lista de materiales en inglés para febrero, que están escritos sin un académico excesivo. Las publicaciones contienen ejemplos de código y enlaces a repositorios no vacíos. Las tecnologías mencionadas son de dominio público y muchas de ellas no requieren hierro de alta resistencia para las pruebas.

Los artículos se dividen en cuatro tipos:
Los anuncios de herramientas de código abierto y conjuntos de datos
de guías prácticas para PyTorch y TensorFlow
Estudios de caso de la máquina de aprendizaje
de investigación ML

Anuncios de herramientas de código abierto.

ClearGrasp

El algoritmo está diseñado para resolver el problema del reconocimiento de objetos transparentes que reflejan y refractan la luz de manera desigual. Cualquier cámara RGB-D estándar es adecuada para trabajar.

PyTorch3D

Facebook ha anunciado una biblioteca altamente modular y optimizada para PyTorch , que simplifica el entrenamiento profundo de modelos en imágenes tridimensionales.

Hydra El

nuevo marco del ecosistema PyTorch, que está diseñado para resolver problemas asociados con la complejidad de los proyectos. Proporciona capacidades de gestión de proyectos a través de la línea de comandos y los archivos de configuración.

TensorFlow.js para React Native

La herramienta no usa webview para renderizar y no depende de la API de las plataformas web que se utilizan en el navegador. Por lo tanto, es una nueva plataforma de integración con un back-end que es adecuado para este entorno.

Operador de compresión matricial

El operador le permite usar cualquier función de compresión matricial definida como factorización y crear una API de flujo de tensor para aplicar dinámicamente esta compresión durante el entrenamiento de cualquier variable de flujo de tensor.

Torchmeta metaaprendizaje

Biblioteca proporciona una única interfaz para diferentes conjuntos de datos para simplificar la creación de nuevos algoritmos.

AutoFlip

A menudo, desea cambiar la orientación de la pantalla de horizontal (16: 9 o 4: 3) a vertical. Finalmente, apareció el marco, que ayuda a recortar marcos dinámicamente con una pérdida mínima. La herramienta determina los límites del marco y los objetos en movimiento, dejando solo los más importantes en la pantalla. Herramienta de

biblioteca de optimización

restringida para TensorFlow , que le permite reducir el grado de resultados deshonestos al resolver problemas del mundo real, cuando se tienen en cuenta muchos parámetros adicionales (por ejemplo, al emitir préstamos bancarios). La herramienta convierte algorítmicamente las restricciones de muestreo de datos en un juego de suma cero para dos jugadores.

Mapas de Poincare con la herramienta de

geometría hiperbólicarevela las relaciones jerárquicas de las similitudes en parejas de varias celdas. Esto permite el uso del aprendizaje automático para mapear y analizar el desarrollo de células de organismos.

PyTorch Lightning + Torchbearer

Los creadores de la abstracción de alto nivel Torchbearer se han unido con la creciente popularidad de PyTorch Lightning y ahora están trabajando en su equipo. La abstracción automatiza el desarrollo, hace que el código sea estandarizado, mantenido y escalable. Por lo tanto, para que los investigadores puedan centrarse más en la ciencia, en lugar de trabajar con una base de código.

Abrir imágenes v6

Se lanzó la sexta versión del conjunto de datos Open Images, en la que se amplió significativamente el tipo de marcado y comentario sobre las imágenes. Las capturas para fotografías son tan detalladas que también afectarán el desarrollo posterior de la investigación interdisciplinaria, donde la visión por computadora se combina con el procesamiento del lenguaje natural.

CCMatrix: un conjunto de datos para entrenar modelos de traducción El

conjunto de datos consta de 4.500 millones de oraciones de texto de bits en 576 pares de idiomas y ayudará a crear modelos NMT más avanzados.

Guías

Método de componente principal distribuido usando TFX

Cómo TensorFlow Transform le permite aplicar el método de componente principal en una forma escalable usando los recursos de clústeres computacionales y cómo habilitar el procesamiento de transformaciones en una tubería TFX.

Acelerar las redes neuronales usando TensorNetwork en Keras.

Material sobre cómo usar la biblioteca TensorNetwork para procesar redes tensoras en el contexto del aprendizaje automático.

TensorFlow Lattice: aprendizaje automático flexible, controlado e interpretado Una

visión general introductoria de las capacidades de la biblioteca para enseñar modelos de celosía limitados e interpretados.

Casos

Máscaras AR con TensorFlow.js

Comprado El inicio de Loreal ModiFace comparte su experiencia de usar el aprendizaje automático en el contexto de las máscaras AR. El ejemplo de una marca de belleza muestra cómo se puede aplicar el aprendizaje automático en el comercio electrónico.

Reconocimiento de matrículas en tiempo real Un

caso paso a paso demuestra que el aprendizaje automático ahora está disponible para todos. El autor explica cómo armar un dispositivo de presupuesto en casa, crear un modelo, entrenarlo, colocarlo en AWS y también desarrollar una parte del cliente.

Determinación de la contaminación del aire usando un teléfono.

Un caso para crear una aplicación que determina el nivel de contaminación del aire de una foto de la cámara del teléfono. El problema que debía resolverse era obtener datos de diferentes usuarios para una mayor capacitación del modelo, pero al mismo tiempo garantizar la seguridad de los datos del usuario.

Agregando un efecto de volumen a las imágenes bidimensionales,

Facebook comparte su experiencia en el desarrollo de un
programa de red neuronal convolucional que crea un efecto de imagen tridimensional para imágenes bidimensionales. Al crear, era necesario resolver muchos problemas, tanto en la capacitación del modelo como en la optimización del sistema para admitir teléfonos móviles.

Cómo no ir a la quiebra con el rápido crecimiento de los usuarios

Cómo los creadores de Dungeon AI escalaron para admitir 1 millón de usuarios, y con Cortex hicieron un microservicio basado en un modelo de aprendizaje automático.

Investigación

Uso de “Datos radioactivos”

El método de “Datos radioactivos” le permite determinar que un modelo de aprendizaje automático ha sido entrenado utilizando un conjunto de datos específico. Esto puede ayudar a los investigadores e ingenieros a rastrear qué conjunto de datos se usó para entrenar el modelo para que puedan comprender mejor cómo los diferentes conjuntos de datos afectan el rendimiento de diferentes redes neuronales.

TyDi QA: un conjunto de datos de preguntas y respuestas en diferentes idiomas

Google ha publicado un estudio y conjuntos de datos que consisten en 200,000 pares de preguntas y respuestas de 11 idiomas que representan una amplia gama de fenómenos lingüísticos. Se pidió a los participantes del estudio que hicieran una pregunta relacionada sobre la base del texto, cuya respuesta no figura en el texto, después de lo cual se propuso encontrar la respuesta a la pregunta en el artículo de Wikipedia. Y estos datos compilaron un conjunto de datos.

Creación artificial de conjuntos de datos para ensayos clínicos.

Debido a varias limitaciones, es muy difícil crear conjuntos de datos con fotografías de lesiones cutáneas. Ahora hay una herramienta que genera los datos necesarios para una mayor capacitación. DermGAN toma como entrada la imagen real y el mapa semántico pregenerado correspondiente con las características principales de la imagen real (tipo de piel, condición de la piel, ubicación de la neoplasia), a partir de la cual genera un nuevo ejemplo sintético con las características solicitadas.

MRI acelerado

El objetivo del proyecto es acelerar la exploración por resonancia magnética de los pacientes en 10 veces con IA. Las instantáneas se generan utilizando DNN a partir de datos sin procesar, y los artefactos a menudo aparecen en el proceso. El estudio explica cómo el aprendizaje automático malicioso ha ayudado a reducir sus números.

Optimización de la infraestructura para recomendaciones basadas en DNN El

estudio analiza varias infraestructuras que se utilizan para emitir recomendaciones personalizadas para productos, videos, etc. utilizando DNN. También se proporcionan herramientas para verificar qué tan bien funcionan las recomendaciones de escala de producción basadas en DNN. Por ejemplo, se lleva a cabo un punto de referencia de los servidores Intel utilizados en los centros de datos (Broadwell, Haswell, Skylake).

Txt2π

Una revisión del nuevo enfoque de aprendizaje por refuerzo. Está diseñado para ayudar a resolver una tarea difícil en la que el agente necesita tomar varios pasos en función de la meta y el conocimiento del entorno, que puede cambiar. El modelo debe aprender a jugar un juego en el que debes derrotar a los monstruos según ciertas reglas (Read to Fight Monsters).

Entrenamiento de CNN en imágenes de resolución ultra alta El

paralelismo existente de datos y modelos permite entrenar redes neuronales con miles de millones de parámetros, pero el entrenamiento en datos consistentes en imágenes de alta resolución, como imágenes de TC, sigue siendo un problema. En este artículo, consideramos la aplicabilidad de las redes neuronales convolucionales en imágenes de resolución ultra alta (hay un código de proyecto).

Street View Mapa Orientación Formación

Google recopila aplicaciones de investigadores que están listos para ayudar a crear un conjunto de datos para el entrenamiento posterior de las redes neuronales de orientación espacial.

T5: una nueva herramienta para el aprendizaje de transferencia

Como resultado de una encuesta a gran escala, los investigadores identificaron las mejores técnicas de aprendizaje de transferencia y aplicaron estas ideas para crear el modelo T5 pre- entrenado , así como el conjunto de datos en el que fue entrenado.

En la selección de marzo, espere artículos sobre el uso de ML en la lucha contra COVID-19: determinar la temperatura de las personas en tiempo real mediante radiación infrarroja, diagnosticar el virus, rastrear brotes de la epidemia y más. Mientras tanto, eso es todo. ¡Gracias por la atención!

Una selección de artículos sobre aprendizaje automático: casos, guías y estudios para febrero de 2020

Anuncios de herramientas de código abierto.

Guías

Casos

Investigación

More articles: