悬挂于封山期的每一杆猎枪,最终都会派上用场(续)

刘 钊 0

年初的一次访谈中,韦晓亮将SmartStudy的知识切片化作为区别新东方的一个重要标志,半年过去了,他们走的比其他产品更远,也遇到了更多棘手的问题。

截止到现在,算法还并没有部署在SmartPigai和SmartStudy上,十多万的行为数据还在跑仿真、做校正。如何铺开数据指导教学的细节,如何建立在线的逻辑结构,都是亟待解决的问题。


以下是韦晓亮带来的分享,由茄葩编辑整理。


我的数据挖掘进阶史


第一个阶段,是在我学习阶段。很感谢冯老师让我从事软算法的研究,这是后来我研究的原点和基础。


第二个阶段,是在新东方期间。我们做了一个院校匹配模型,计算出任何一个同学和美国大学的匹配率,这个算法来自于过去新东方已经送出去的几十万同学的数据,最终当来一个未知样本的时候,我们可以匹配他和过去哪一个样本最接近,从而推荐最适合的学校。


第三个阶段,是在极智批改网。数据挖掘的核心和本质是什么,很多人都说big data,说quantity重要,我一点不觉得quantity是最重要的,quality更重要,deep更重要。因此当可能谈big data的时候,我现在更多研究的是deep learning和deep data,这是我们研究学生学习动机的一个很重要的因素,数据挖掘用到教育行业里面最重要的本质不是做统计、归类、分析,而做的是主观揣测,比如说你今天答对了对少题,这不叫数据挖掘,这叫数据统计,你想不想学。这叫挖掘,而不是你学了多少。


技术存在瓶颈,但人工不等于Heavy


2月份的时候,国内非常知名的一个企业家,建议我砍掉批改网,他说:“晓亮,尽管你们的批改控件非常先进,但批改网是人工批改,应该砍掉它。”当时我就反问了一句:“如果你作为一个孩子的家长,把你的孩子送到我的平台上来学习,你就不会建议我砍掉批改网了。”他哑口无言。我们所在的不是一个普通的行业,它最终一定是结果导向的,如果没有批改,我们无法完成对学生学习内容的真正的监控,以及在这个层面的个性化的服务。SmartPigai和SmartStudy做的是整个一个闭环,大家只看到智课网,其实我们的个性化主要依靠极智批改网来完成,而个性化的学习内容靠智课网来完成,很多人告诉我,是不是太heavy了,但是我们认为,现在的机器翻译不成功,写作只能人工来批改。


直播与录播,本就不是相互排斥


我非常欣赏直播,但我不认为直播和录播是个非此即彼的关系,它们是相互的补充的。直播依然没有解放时间的条件限制,在线教育首要解决是anytime、anywhere、anypace,尤其是anypace,直播和录播不矛盾。智课网采用的就是直播+录播的手段,为什么我们要采用这种手段,想和大家分享一下自己的拙见,师者传道授业解惑,我想告诉大家传道授业不需要即时,传道授业强调的是权威性,系统性,而解惑需要的才是即时。因此我们把这做了分离。跟老师的交流过程中,一定是即时的,但听老师的课堂过程中,是非即时的。


用工业化的思维做出视频课程的专业性


我想说下国内语言考试类在线培训的状态,老师们讲的都很好,品质似乎就弱了点。我的很多从新东方过来的同事,最开始录制智课网的视频是很不适应的,被喊停的次数很多。SmartStudy从课件的设置、拍摄的手段、角度、维度,到后期的研发,全面改造教学模式,所有的内容都在影棚里面完成拍摄制作,在录制课程之前,会细化到分镜头、剧本、包括所有的知识切片和中英字幕。我们利用电影的手段进行课程的研发,因为只有这样做的时候,才是尊重用户的眼睛,尊重用户的感受,这样的课堂才有可能让学生提高课程的完成率。我们现在的课程完成率大概在39%左右,在我们的领域,这个数字是比较高的。


教育是反人性的,唯一要做的是不断纠错


游戏是迎合人性的,因此容易让人接受,而教育是反人性的,要做的一件事就是不断纠错。我想问一下大家,健身是反人性的还是顺人性的,它一定是反人性的,我想在每天健身,非常痛苦,但健完身之后,我很舒服。于是,我就有了我的私人教练,而你在SmartPigai上的私人教练就是我们批改作文的老师,因此遇到反人性的东西的时候,人力、平台的作用是很重要的。口语批改我们是拿到了软件著作权的一个东西,简单来说,就是用声音来改声音,没有所谓的语义识别,但我们有语音识别,依然是人工结合机器来做,学生录完音后,拿到的口语批改是听的,而不是看的,上面只要有标签的地方就代表外教认为这里有问题,学生可以依据批改不断纠错。