Nous partageons la plus grande couche de données en Russie sur la formation en ligne avec des projets en linguistique, personnalisation, conception graphique, ML

Avant la nouvelle année, l'équipe de Michael VerdloveSverdlova a annoncé qu'elle était prête à partager des données anonymes des leçons Skyeng avec des chercheurs et des startups externes. Peu après les vacances, nous avons discuté avec Misha du type de données en question, de ce qu'elles en font et des raisons pour lesquelles vous ne pouvez obtenir votre jeu de données qu'en lui écrivant par courrier.



- Si vous partagez des données, alors pourquoi ne pas simplement télécharger l'ensemble de données quelque part?
Le plus grand corps d'anglais en Russie, à mon avis, est de 10 000 postes. À la fin du mois de janvier, plus de 9,1 millions de leçons étaient dispensées dans notre école dans le monde - à ma connaissance, seules les écoles chinoises proposent un large éventail de cours en ligne et de cours particuliers.

Nous savons ce qui s'est passé et comment les actions de l'enseignant et de l'élève ont changé pour toutes les leçons que nous avons passées, nous avons une trace de l'historique de tous les exercices sur eux. Il s'agit d'environ 120 mesures pour les enseignants, ainsi que d'environ 300 paramètres pour les enfants de deux groupes d'âge (4-11 et 11-18 ans) et les adultes d'âges, de villes et de statuts différents (par exemple, les élèves), etc. Et ce ne sont certainement pas tous les paramètres que nous pouvons collecter - il semble que vous puissiez en utiliser 2-3 fois plus. Sur un tel volume, l'histoire «voici un lien vers l'ensemble de données, tordez celui qui le veut» ne fonctionnera guère.

- Qui êtes-vous prêt à télécharger sur demande des jeux de données?
Le premier type de partenaires probables est constitué de scientifiques et d'organisations qui effectuent des recherches fondamentales, rédigent des articles, etc. Ils ont généralement besoin d'une base de recherche - nous sommes prêts à le devenir.

Maintenant, par exemple, nous discutons d'études neurophysiologiques conjointes avec l'une des plus grandes universités du pays, ainsi qu'avec des partenaires de Cambridge et d'Arizona.


Pour commencer, nous voulons prendre le contenu actuel, le marquer d'une certaine manière - et les neurophysiologistes effectueront un test pour les personnes qui viendront à eux et seront formés à ces «oreillettes». Nous comprendrons comment le matériel fonctionne pour le public cible, quelles sont les caractéristiques psychologiques et neurologiques, puis nous pourrons former le modèle sur les rétrodonnées pour changer le contenu et les formats, en les rendant aussi pratiques que possible pour l'étudiant.

En parallèle, ces mêmes métriques de focalisation et d'assimilation du matériel que nous analysons maintenant avec l'une des startups sur les flux audio et vidéo.

- Quels avantages chaque partie recevra-t-elle?

1. Au départ, nous faisons tout gratuitement les uns pour les autres.

2. Les résultats de l'étude appartiennent aux deux parties - peu importe si l'expérience a réussi ou échoué, nous pouvons écrire des articles communs, être une base de référence, etc.

3. Si le résultat de l'étude est positif, le partenaire peut le commercialiser et nous pouvons l'utiliser pour nos besoins.


Nous sommes également prêts à montrer les résultats finaux aux clients de nos partenaires dans le domaine de l'éducation. Mais immédiatement, nous discutons de la question de la non-concurrence - c'est une condition fondamentale. Par exemple, ils ont immédiatement stipulé avec les neurophysiologistes que s'il s'agissait d'un produit, ils ne devraient pas le vendre à nos concurrents directs pendant un an ou deux. En gros, vous pouvez le vendre immédiatement à l'armée chinoise, et un jour plus tard à une autre école d'anglais en ligne. Ce libellé n'est pas encore perfectionné par les avocats, mais il ressemble à ceci.

- Et si un projet commercial venait à vous?
Les entreprises qui introduisent des outils ML dans l'éducation ou même dans d'autres domaines, nous sommes également intéressés. Ceux-ci peuvent être des outils pour personnaliser les trajectoires éducatives, la synthèse ou l'analyse de la parole, la motivation dans le processus d'apprentissage, la psychologie, etc.

Nous travaillons déjà avec ceux-ci - par exemple, nous définissons un certain nombre de pilotes pour correspondre à l'enseignant et à l'élève.


Par conséquent, les startups qui travaillent pour accélérer le processus d'acquisition de nouvelles connaissances, mécanismes et méthodes de mémorisation rapide, longue et profonde, sont occupées par des systèmes de recommandation, etc. - venez aussi. Encore une fois, il sera nécessaire de discuter de la question de la non-concurrence.

- D'accord, et comment tout cela recherche-t-il un partenaire?
Écrivez-moi à data@skyeng.ru : parlez-nous de vos compétences et des sujets souhaités, discutez-en. Lorsque nous nous sommes mis d'accord sur tout, nous signons un accord et allons créer l'histoire de l'éducation.

Il y aura plusieurs gars de notre côté - des projets qui viendront vous chercher et vous aideront à recevoir tous les déchargements en temps opportun, à démarrer des expériences, etc. Le partenaire nous donne les algorithmes et / ou la logique, nous démarrons l'analyse mécanique et donnons au partenaire un fichier texte déjà agrégé avec une description. En fait, les données - les images, la vidéo, l'audio ne sont pas transférées au partenaire.

Et le reste ... Il suffit d'écrire, ne soyez pas timide, - ou posez des questions dans les commentaires, je vais essayer de répondre au maximum.

All Articles