Compartimos la capa de datos más grande de Rusia sobre aprendizaje en línea con proyectos en lingüística, personalización, diseño, ML

Antes del año nuevo, el equipo de Michael VerdloveSverdlova anunció que estaba lista para compartir datos anónimos de las lecciones de Skyeng con investigadores externos y nuevas empresas. Poco después de las vacaciones, hablamos con Misha sobre qué tipo de datos están en cuestión, qué ya están haciendo con ellos y por qué puede obtener su conjunto de datos solo escribiéndole por correo.



- Si comparte datos, ¿por qué no simplemente cargar el conjunto de datos en alguna parte?
El mayor cuerpo de inglés en Rusia, en mi opinión, es de 10 mil puestos. A fines de enero, se impartieron más de 9.1 millones de lecciones en todo el mundo en nuestra escuela; hasta donde yo sé, solo las escuelas chinas tienen una gran cantidad de educación en línea y lecciones individuales.

Sabemos lo que sucedió y cómo cambiaron las acciones del maestro y el alumno en todas las lecciones que pasamos, tenemos un seguimiento de la historia de todos los ejercicios en ellos. Estas son aproximadamente 120 métricas para maestros, así como también alrededor de 300 parámetros para niños de dos grupos de edad (4-11 y 11-18 años) y adultos de diferentes edades, ciudades, estados (por ejemplo, estudiantes), etc. Y esto definitivamente no es todos los parámetros que podemos recopilar, parece que puede usar 2-3 veces más. En tal volumen, la historia "aquí hay un enlace al conjunto de datos, tuerza a quien quiera" difícilmente funcionará.

- ¿Quién está listo para cargar conjuntos de datos a pedido?
El primer tipo de socios probables son los científicos y las organizaciones que realizan investigaciones básicas, escriben artículos, etc. Por lo general, necesitan una base para la investigación: estamos listos para convertirnos en uno.

Ahora, por ejemplo, estamos discutiendo estudios neurofisiológicos conjuntos con una de las universidades más grandes del país, así como con socios de Cambridge y Arizona.


Para empezar, queremos tomar el contenido actual, marcarlo de cierta manera, y los neurofisiólogos realizarán una prueba para las personas que acuden a ellos y recibirán capacitación en tales "orejeras". Entenderemos cómo funcionan los materiales para el público objetivo, cuáles son las características psicológicas y neurológicas, y luego podremos entrenar el modelo en retrodatos para cambiar el contenido y los formatos, haciéndolos lo más conveniente posible para el estudiante.

Paralelamente, estas mismas métricas de enfoque y asimilación del material que ahora estamos analizando con una de las startups en transmisiones de audio y video.

- ¿Qué beneficios recibirá cada parte?

1. Inicialmente hacemos todo gratis el uno para el otro.

2. Los resultados del estudio pertenecen a ambas partes: no importa si el experimento tuvo éxito o fracasó, podemos escribir artículos conjuntos, ser una base de referencia, etc.

3. Si el resultado del estudio es positivo, el socio puede comercializarlo y nosotros podemos usarlo para nuestras necesidades.


También estamos listos para mostrar los resultados finales a los clientes de nuestros socios en el campo de la educación. Pero inmediatamente discutimos el tema de la no competencia: esta es una condición básica. Por ejemplo, inmediatamente estipularon con los neurofisiólogos que si se trata de un producto, no deberían venderlo a nuestros competidores directos durante un año o dos. Aproximadamente, puede venderlo al ejército chino de inmediato, y algún día más tarde a otra escuela de inglés en línea. Esta es una redacción aún no perfeccionada por los abogados, pero se parece a esto.

- Ok, ¿y si te llega un proyecto comercial?
Las empresas que están introduciendo herramientas de aprendizaje automático en la educación o incluso en otras áreas, también nos interesan. Estas pueden ser herramientas para personalizar trayectorias educativas, síntesis o análisis del habla, motivación en el proceso de aprendizaje, psicología, etc.

Ya trabajamos con tales, por ejemplo, definimos varios pilotos para que coincidan con el maestro y el alumno.


Por lo tanto, las startups que trabajan para acelerar el proceso de adquisición de nuevos conocimientos, mecanismos y métodos de memorización rápida, larga y profunda, están ocupados con los sistemas de recomendación, etc. Nuevamente, será necesario discutir el tema de la no competencia.

- Ok, ¿y cómo se ve todo para una pareja?
Escríbame a data@skyeng.ru : cuéntenos sobre sus competencias y temas deseados, discuta esto. Cuando hemos acordado todo, firmamos un acuerdo y vamos a crear historia en la educación.

Habrá varios muchachos de nuestro lado, proyectos que lo recogerán y lo ayudarán a recibir todas las descargas de manera oportuna, iniciar experimentos, etc. El socio nos da los algoritmos y / o la lógica, comenzamos el análisis mecánico y le damos al socio un archivo de texto ya agregado con una descripción. En realidad, los datos: las imágenes, el video y el audio no se transfieren al socio.

Y el resto ... Solo escribe, no seas tímido, o haz preguntas en los comentarios, intentaré responder al máximo.

All Articles