牛津大学教授:大数据会使顶尖名校受到冲击

维克托·迈尔-舍恩伯格,现为英国牛津大学互联网研究所教授,是大数据领域公认的权威,也是最早洞见大数据时代发展趋势的数据科学家之一。维克托·迈尔-舍恩伯格的力作——《与大数据同行:学习和教育的未来》去年出版以来,受到国内教育界的广泛关注,并荣获2015年度“影响教师的100本书”之TOP10图书。

 

近日,迈尔-舍恩伯格在北京访问,中国教育新闻网“围绕大数据时代的学习和教育”专访了迈尔-舍恩伯格教授。

 

W020160526394284335759

 维克托·迈尔-舍恩伯格,《与大数据同行:学习和教育的未来》的作者

 

近日,迈尔-舍恩伯格在北京访问,中国教育新闻网“围绕大数据时代的学习和教育”专访了迈尔-舍恩伯格教授。

 

Z:中国教育新闻网

M:迈尔-舍恩伯格

 

大数据将带来学习的三大核心变化:反馈、个性化和概率预测

 

在小数据时代,学习的方式和目的往往是为了通过考试。而在大数据时代,人们可以实现通过学习中所犯的错误来理解这些错误,并最终改进这些错误。

 

Z:大数据时代对于学习者到底意味着什么?

 

M:可汗学院的案例大家可能比较熟悉,我想举另外一个案例来说明大数据时代的学习是什么样。在美国,有一个著名的外语学习网站——多邻国(Duolingo),每天都会有数以百万计的人们通过它来学习外语。网站的设计者从平台所收集的大量学习者所犯的错误信息中,发现许多有价值的信息。比如,他们发现大多数西班牙语使用者在学习英语的初级阶段,会对代词“it”很困惑,原因是“it”很难翻译成西班牙语。于是,多邻国针对这类学习者调整了学习安排,先教他们其他代词,等到数周后再开始教“it”。

 

多邻国通过大数据发现,语言教学手段有效与否,取决于学习者的母语以及他们将要学习的语言。另外,多邻国还发现了所谓“数据尾气”(data exhaust)现象,即由人们与网站之间的互动中衍生的副产品:如熟练掌握一门语言的某一方面需要多长时间、最合适的习题量是多少、落下几天课程进度的后果是什么,等等。

 

Z:这些数据在传统教学中确实很难收集。

 

M:可汗学院和多邻国的教育实践,为我们展示了大数据时代的教育前景,也反映了大数据改善学习的三大核心要素:反馈、个性化和概率预测。过去,人们针对语言学习方法的实证研究数量很少,比如很多理论主张先教形容词,再教副词,但是几乎没有实证数据支撑该主张。多邻国的出现,使这样的研究成为可能,也使人们可以通过数据分析,进一步了解学习者是如何学习的。

 

多邻国的教学模式和商业模式也非常有意思,它要求人们在同一时间翻译一些较短的词组,也可以评价或修订他人的翻译。而它所提供的翻译样本,其实是从翻译公司那里获得的真实句子,因此公司能够从中获取报酬。一旦有足够的学习者能够翻译或验证特定的词组,系统就会接受他们的译文,并收集所有零散的句子,将其整合到完整的文档之中。因此,学习者可以免费获得外语学习指导,同时创造出具有经济价值的回报。这种赢利模式在过去是难以想象的。

 

Z:大数据时代的学习反馈,与传统学校中的学习反馈有何本质不同?

 

M:我们利用传统教育方式所获得的反馈其实存在很大缺陷。比如,我们难以对学习过程进行反馈;在对学习结果进行反馈时,我们也只是把关注点放在学生身上,我们对学生的考卷和各种表现进行打分,并要求他们对这一结果负责。然而,作为教育者,我们却很少评价自己,也很少对我们所采用的教科书、教学方式和内容以及测验手段是否对学习有益进行评价。导致这种现状的原因之一是数据很难收集,收集到的数据又很难获得有效处理。因此,这是一种单向度的反馈。

 

在大数据时代,我们则可以实现对学习效果的双回路反馈。我们能够收集过去无法获得的数据,通过对这些数据的分析,我们可以提高学习的效果和学业表现,并将数据分享给教师和决策者以改善教学。

 

在小数据时代,我们学习的方式和目的往往是为了通过考试,而在大数据时代,我们可以实现通过这些错误来理解这些错误,并最终改进这些错误。多邻国的实践就是最好印证。

 

学习者将获得真正定制的个性化学习

 

当学生能以最适合自己的步调和方式进行学习时,即使那些看起来最没有能力的“差生”,也可能在最终表现上超过优等生。

 

Z:看来,大数据时代能真正实现学习者的个性化学习。

 

M:实现因材施教是人类教育的理想。大数据时代,学习者将可以获得一种定制的适合自身的学习安排。比如,在纽约地区有一个“个人的学校”数学项目,每个学生都拥有个人的“播放列表”,通过相关算法分析个人需求,学生可以获得为其定制的每日习题集。

 

再比如,有一个名为“半岛大桥”(Peninsula Bridge)的暑期班项目,曾使用可汗学院的数学课程教授来自贫困社区的中学生。有一个女孩一直学得很慢,成绩也一直垫底。但是过了一段时间,她竟然像开了窍一般地飞速进步,到课程结束时成绩已排名第二了。学习记录显示,她曾长时间在某个学习环节徘徊,而一旦掌握了这个核心概念后,她就开始突飞猛进了。可见,当学生能以最适合自己的步调和方式进行学习时,即使那些看起来最没有能力的“差生”,也可能在最终表现上超过优等生。

 

Z:您提到的“概率预测”会对学习带来何种影响和变化?

 

M:人们通常不太愿意接受概率。其实,我们一直都生活在概率的世界里,只是没有认识到它。通过大数据分析,我们可以进行更准确的预测,并进行更有效的干预。比如,我们可以不再简单地要求学生暑假时补习数学,而是建议他进行2周的二次方程集中课程学习。

 

另外一个需要转变的观念是:探寻“是什么”而非“为什么”。过去我们更强调探寻事物的因果关系,而现在我们通过大数据看到的往往是相关关系。对相关关系意识的确立,是具有挑战性的。因为深层的研究显示,通常我们对因果关系的快速直觉往往是完全错误的。

 

大数据能为我们展示事物背后无数的相关关系,通过这些相关关系,我们可以更准确地认识事物的本质。当然,我们也要理性对待概率预测,尤其是涉及教育决策和学生,因为这将对人们的未来造成极大影响。

 

大数据推动教育决策更准确高效

 

在大数据出现之前,大多数教育政策都是在缺乏实验数据的情况下制定的。

 

Z:有了大数据的帮助,教育决策是否会更准确高效?

 

M:几乎可以肯定,在大数据出现之前,大多数教育政策都是在缺乏实验数据的情况下制定的。我们的教育决策往往是非常主观、甚至是“拍脑袋”产生的,有一些最基本的原理可能都未曾验证过。比如,今天大多数学校的日程和时间安排,还遵循着农耕时代的习惯,人们甚至没有思考过学生是否真的在这个时间段进行学习最有效。

 

再比如,人们通过数据研究发现,一个能预示大学生继续学业的重要指标,不是年龄、性别或分数,而是他们的选课数量,即那些开始时选择较少同期课程的学生更有可能坚持下去。而美国财政拨款的资助条件是要求受资助人修读全日制课程,显然这些条款是有严重缺陷的。

 

尽管教育决策的意义重大,但是其制定的过程却往往基于相对较少的数据。而且,这类数据的收集和分析,也并不是由客观的局外人,而是由典型的内部人士操作的。从组织上看,这是不合理的。商业公司早就知道,有关反馈和质量保障的信息,应该由与结果毫无利益关系的专业人士进行收集。

 

Z:是否可以认为MOOCs的重要价值之一是能够收集海量的学习数据?对于这些数据的分析和使用,是否需要巨大的投入?

 

M:确实是这样。MOOCs的一个重要构成要素,就是它能产生大数据。大数据能够告诉我们什么是最有效率的,并且揭示那些过去无从发现的事实和真相。

 

从长远来看,新技术的最初使用永远都是昂贵的,但是大数据的吸引人之处在于,当数据收集起来后,其分析并不是很昂贵。人们可以依托云计算,或者是外部团队来进行数据处理,而不需要学校再通过采购设备等投入来做这件事。

 

想象力永远比知识本身重要

 

由人类的智慧、独创性、创造力造就的理念,这是大数据无法分析预测的。要知道,想象力永远要比知识重要。

 

Z:您提到,大数据不仅会改变学习的方式,也会改变学习的内容。

 

M:长久以来,学生所学习的内容经常是成人的意志,而不是完全基于客观和理性的内容。而真正的启迪,是需要理性而非主观的。大数据时代的学习,可以通过数据来提供一种洞见,基于科学和事实来做决定,让教育真正帮助学生客观、理性地认识世界,学会基于事实做决定。

 

大数据时代还需要人们学会转变思维方式,要学会看待整个世界以及世界中的所有事物时,要从物质事物转向交互作用,并把它看作一个收集和分析数据的平台,这就是“大数据思维倾向”。

 

当然,我们也要继续重视那些数据不能解释的事物:由人类的智慧、独创性、创造力造就的理念,这是大数据无法分析预测的。要知道,想象力永远要比知识重要。

 

Z:教育行业相对较保守,对新技术可能会有一种天然的抵触。这是否意味着,大数据时代的教育变革,可能不是在传统的学校中发生,而是在社会机构甚至是商业组织中最先脱颖而出?

 

M:其实大数据的最初应用主要在产业领域,是针对那些刚刚起步的项目进行分析。对于成熟的行业和产业,大数据在初期往往是用不到的。因此,大数据在教育中的应用也会是这种情况,其应用可能会先在一些创新公司中出现,或者是从一所完全革新的新学校中开始全面应用。当然,决定教育之未来的,一定是那些能更好地利用大数据来适应学习的组织。

 

一旦数据开始流动,即使顶尖学校也将受到冲击

 

大数据会让我们明白,最好的学校并非是那些所谓的世界名校,而应该是那些能够给孩子带来最大变化的学校。

 

Z:您曾以亚马逊击败巴诺书店为例,指出“导致巴诺书店落后的主要原因,不是便利性和海量库存,而是数据。一旦数据开始流动,即使一些顶尖学校也将受到冲击”。您确定会是这样吗?您会为自己的孩子选择什么样的学校?

 

M:这种情况的出现,将是未来所有变化中最有趣的事情。因为所有人都会认为,大数据的应用对那些顶尖级学校最有帮助。但是,让我们看看事实如何。那些世界名校真正为学生做了些什么呢?他们挑走了最好的学生,教起来当然既容易又简单。不过,如果只教最好的学生,我们又何必对这样的名校趋之若鹜呢?

 

要让我来为自己的孩子选学校,我将更看重学校会给孩子带来何等提升。我会选择能给孩子带来最大变化的学校,从入学到毕业,孩子能经历最大的变化与提升,这才是最好的学习过程。哈佛大学的学生从入学到毕业一直都最优秀,学校不需要替他们操太多心,也未必给他们带来多少提升。

 

有了大数据,我们会开始明白,那些世界名校并不是世界最好的学校,最好的学校目前还不为人知,因为我们还不知道哪所学校可以给孩子带来最大的提升。不过随着大数据的应用,我们终究会发现这些学校。

 

所以20年后,人们为孩子选择学校时,肯定与现在的选择大不相同。

 

本文来源:中国教育新闻网,记者郜云雁,有删节