Kami berbagi lapisan data Rusia terbesar di pelatihan online dengan proyek-proyek dalam linguistik, personalisasi, peddesign, ML

Sebelum Tahun Baru, tim Michael VerdloveSverdlova mengumumkan bahwa dia siap untuk berbagi data anonim dari pelajaran Skyeng dengan peneliti dan startup eksternal. Segera setelah liburan, kami berbicara dengan Misha tentang data seperti apa yang dipertanyakan, apa yang sudah mereka lakukan dengan mereka dan mengapa Anda bisa mendapatkan data Anda hanya dengan menulis kepadanya melalui surat.



- Jika Anda berbagi data, mengapa tidak mengunggah dataset di suatu tempat?
Badan bahasa Inggris terbesar di Rusia, menurut saya, adalah 10 ribu posisi. Pada akhir Januari, lebih dari 9,1 juta pelajaran diadakan secara global di sekolah kami - sejauh yang saya tahu, hanya sekolah Cina yang memiliki satu set besar pendidikan online dan pelajaran satu-satu.

Kami tahu apa yang terjadi dan bagaimana tindakan guru dan siswa berubah untuk semua pelajaran yang kami habiskan, kami memiliki jejak sejarah dari semua latihan yang mereka lakukan. Ini adalah sekitar 120 metrik untuk guru, serta sekitar 300 parameter untuk anak-anak dari dua kelompok umur (4-11 dan 11-18 tahun) dan orang dewasa dari berbagai usia, kota, status (misalnya, siswa) dan sebagainya. Dan ini jelas tidak semua parameter yang dapat kami kumpulkan - sepertinya Anda dapat menggunakan 2-3 kali lebih banyak. Pada volume seperti itu, cerita "di sini adalah tautan ke dataset, putar siapa yang menginginkannya" tidak akan berhasil.

- Siapa yang siap Anda unggah set data berdasarkan permintaan?
Jenis pertama dari mitra yang mungkin adalah ilmuwan dan organisasi yang melakukan penelitian dasar, menulis artikel, dan sebagainya. Biasanya mereka membutuhkan basis untuk penelitian - kami siap menjadi satu.

Sekarang, misalnya, kita sedang membahas studi neurofisiologis bersama dengan salah satu universitas terbesar di negara ini, serta mitra dari Cambridge dan Arizona.


Untuk mulai dengan, kami ingin mengambil konten saat ini, menandainya dengan cara tertentu - dan ahli neurofisiologi akan melakukan tes untuk orang-orang yang datang kepada mereka dan akan dilatih dalam "penutup telinga" tersebut. Kami akan memahami bagaimana materi bekerja untuk audiens target, apa fitur psikologis dan neurologis, dan kemudian kita dapat melatih model tentang retrodata untuk mengubah konten dan format, menjadikannya senyaman mungkin bagi siswa.

Secara paralel, kami sekarang menganalisis metrik fokus dan asimilasi yang sama dengan salah satu startup untuk stream audio dan video.

- Manfaat apa yang akan diterima masing-masing pihak?

1. Kami awalnya melakukan semuanya secara gratis untuk satu sama lain.

2. Hasil penelitian menjadi milik kedua belah pihak - tidak masalah jika percobaan telah berhasil atau gagal, kita dapat menulis artikel bersama, menjadi basis referensi, dll.

3. Jika hasil penelitian positif, mitra dapat mengkomersialkannya, dan kita dapat menggunakannya untuk kebutuhan kita.


Kami juga siap untuk menunjukkan hasil akhir kepada pelanggan mitra kami di bidang pendidikan. Tetapi segera kami membahas masalah non-kompetisi - ini adalah kondisi dasar. Sebagai contoh, mereka segera menetapkan dengan ahli saraf bahwa jika menyangkut suatu produk, mereka tidak boleh menjualnya kepada pesaing langsung kita selama satu atau dua tahun. Secara kasar, Anda dapat menjualnya kepada militer Tiongkok segera, dan suatu hari nanti ke sekolah bahasa Inggris online lainnya. Ini adalah kata-kata yang belum disempurnakan oleh pengacara, tetapi terlihat seperti ini.

- Ok, bagaimana jika proyek komersial mendatangi Anda?
Perusahaan yang memperkenalkan alat ML dalam pendidikan atau bahkan bidang lain, kami juga tertarik. Ini dapat menjadi alat untuk mempersonalisasi lintasan pendidikan, sintesis atau analisis ucapan, motivasi dalam proses pembelajaran, psikologi, dan sebagainya.

Kami sudah bekerja dengan yang seperti itu - misalnya, kami menentukan jumlah pilot yang cocok dengan guru dan siswa.


Oleh karena itu, startup yang bekerja untuk mempercepat proses memperoleh pengetahuan baru, mekanisme dan metode menghafal cepat dan dalam yang lama, sibuk dengan sistem rekomendasi, dan seterusnya. Sekali lagi, perlu untuk membahas masalah non-kompetisi.

- Ok, dan bagaimana semuanya mencari pasangan?
Menulis kepada saya di data@skyeng.ru : beri tahu kami tentang kompetensi Anda dan topik yang diinginkan, bahas ini. Ketika kami telah menyetujui segalanya, kami menandatangani perjanjian dan menciptakan sejarah dalam pendidikan.

Akan ada beberapa orang di pihak kami - proyek yang akan menjemput Anda dan membantu Anda menerima semua pembongkaran tepat waktu, memulai eksperimen, dan sebagainya. Mitra memberi kami algoritma dan / atau logika, kami memulai analisis mekanis dan memberi mitra file teks yang sudah teragregasi dengan deskripsi. Sebenarnya data - gambar, video, audio tidak ditransfer ke mitra.

Dan sisanya ... Cukup tulis, jangan malu-malu, - atau ajukan pertanyaan di komentar, saya akan coba jawab secara maksimal.

All Articles