我们与语言学,个性化,peddesign,ML等项目共享俄罗斯最大的在线培训数据层

新年之前,迈克尔的团队 韦德洛夫Sverdlova 宣布她准备与外部研究人员和初创公司共享Skyeng课程中的匿名数据。假期过后不久,我们与Misha讨论了有问题的数据类型,它们已经在处理哪些数据以及为什么仅通过邮寄给他来获取数据集的原因。



-如果您共享数据,那为什么不将数据集上传到某个地方呢?
我认为,俄罗斯最大的英语机构是一万个职位。截至1月底,我们学校在全球范围内举办了超过910万堂课程-据我所知,只有中国学校才有大量在线教育和一对一的课程。

我们知道发生了什么以及在我们花费的所有课程中老师和学生的行为是如何变化的,我们对所有练习的历史都有追踪。这是针对教师的约120个指标,以及两个年龄段(4-11和11-18岁)的儿童以及不同年龄,城市,身份(例如,学生)的成年人的约300个参数。这绝对不是我们可以收集的所有参数-看来您可以使用2-3倍以上。在这样的数量上,“这里是到数据集的链接,无论谁想要它”的故事很难奏效。

-您准备好根据要求上传数据集了?
第一类可能的合作伙伴是从事基础研究,撰写文章等的科学家和组织。通常他们需要研究的基础-我们已准备好成为一个基础。

现在,例如,我们正在与该国最大的大学之一以及来自剑桥和亚利桑那州的合作伙伴讨论联合神经生理学研究。


首先,我们希望采用当前的内容,并以一定的方式对其进行标记-神经生理学家将对来访者进行测试,并接受有关“耳坠”的培训。我们将了解这些材料是如何为目标受众服务的,其心理和神经学特征是什么,然后我们可以在回溯数据上训练模型以更改内容和格式,从而为学生提供尽可能的方便。

同时,与音频初创公司之一一起分析音频和视频流的材料集中和吸收的这些相同指标。

-各方将获得什么好处?

1.最初,我们彼此免费做任何事情。

2.研究结果属于双方-实验成功与否无关紧要,我们可以撰写联合文章,作为参考依据等。

3.如果研究结果是肯定的,则合作伙伴可以将其商业化,并且我们可以将其用于我们的需求。


我们还准备向合作伙伴在教育领域的客户展示最终结果。但是,我们立即讨论了不竞争的问题-这是一个基本条件。例如,他们立即同意神经生理学家的意见,即如果涉及到该产品,则不应将其出售给我们的直接竞争对手一两年。大致来说,您可以立即将其出售给中国军方,有一天以后可以出售给另一所在线英语学校。这是律师尚未完善的措词,但看起来像这样。

-好吧,如果有商业项目来找你呢?
在教育甚至其他领域引入机器学习工具的公司,我们也很感兴趣。这些可以用作个性化教育轨迹,语音合成或分析,学习过程中的动机,心理学等的工具。

我们已经与此类人员合作-例如,我们定义了一些飞行员以匹配老师和学生。


因此,致力于加快获取新知识,机制和方法的工作的初创公司正在忙于长期而深入的记忆,而忙于推荐系统等等。同样,有必要讨论不竞争问题。

-好的,这一切如何寻找合作伙伴?
写信给我data@skyeng.ru:告诉我们您的能力和所需主题,并进行讨论。当我们就一切达成共识后,我们将签署协议并开始创造教育历史。

我们这边会有几个人-项目将接您,并帮助您及时接收所有卸货,开始实验等。合作伙伴为我们提供了算法和/或逻辑,我们开始了机械分析,并为合作伙伴提供了已经汇总的带有说明的文本文件。实际上,数据-图像,视频,音频不会传输到伙伴。

剩下的……只要写下即可,不要害羞,或者在评论中提问,我将尽力回答。

All Articles