《与大数据同行 学习和教育的未来》一书指出,当下大数据正悄悄影响到教育体系的每个层面,对于全世界的学习与教育活动,都会产生极为深远的影响。
大数据领域公认权威、百万级超级畅销书《大数据时代》作者、牛津大学互联网研究所迈尔-舍恩伯格教授以浅显易懂的语言讲述了最前沿的理念——大数据将如何改变教育。
他举出MOOC、可汗学院、多邻国语言学习网站等案例,告诉我们,蓬勃发展的在线教育领域产生了大数据,教育不只是“你讲我听”、考试评分或是选修科目更多而已。
历史上第一次,我们拥有了强大、具有实证效果的工具,能够空前的看到学习的过程,破解过去不可能发现的重重学习阻碍,让教育可以实现“私人定制”,改善学习的成效。
教师的工作不但不会被网络视频所代替,还会变得更高效,更有趣,学校和政府部门也能用更低的成本提供更多的教育机会。
在这一刻,我们可以清晰地看到:一个全新的教育时代正在到来!
大数据领域公认权威、百万级畅销书《大数据时代》作者维克托·迈尔-舍恩伯格教授最新力作
“终身学习”时代的必读书,开启全新教育时代
专为中文大陆版增设“追问”一章,解读最新进展
《认知盈余》作者克莱·舍基教授、中国教育技术领军人黎加厚教授亲笔作序
著名教育学者朱永新、李希贵力荐
译者为华东师大教育学博导赵中建教授,与作者数次面谈后,反复修正译稿
书未上市,已被《中国教育报》、澎湃网、中新社、《文汇报》《ChinaDaily》《上海教育》《新民晚报》《解放日报》等众多媒体争相报道
案例翔实、可读性强,既有说服力、又简单易懂
无论是在线教育的机构,还是传统学校,都能看到利于自身发展的别样途径
精装硬皮版本,内文特别选用100克高档纯质纸
编辑推荐篇章:
P21令人愉快的双赢设计
P36补习班:适应性学习软件的用武之地
P84无法驳斥的大数据预测
P124大数据时代背景下的教师与学校管理
未来教育的形态
与大数据同行的学习就是未来的教育,这既是书名的意义,也是本书的主题。“大数据”一词反映了人们愈益意识到我们大家留下的数字痕迹,就如“大数据”关注数据本身一样。哥伦比亚大学心理学教授邓肯·沃兹(Duncan Watts)认为,有关人们行为和喜好的丰沛数据正改变着社会科学,使社会科学从数据最贫瘠的领域转变为数据最丰富的领域。在从商务学到社会学再到文学这样一个又一个领域中,我们获取和解释数据的能力得到迅速成长,同时也需要获得新的工具。
与其他任何领域相比,这一点在教育领域或许显得更为真实。多年以来,事实上是多个世纪以来,教育领域的决策从来就是在缺乏任何数据的基础上作出的。常识(common sense)一直成为正常的决策资源,即使在常识导致消极结果的情况下也是如此,而常识其实只是习惯和一厢情愿的混合物罢了。
迈尔-舍恩伯格和库克耶写到塞巴斯蒂安·迪亚兹(Sebástian Díaz)受数据驱动的关于学生矫正教育(remedial education)的发现:要求学生修读全部大学课程可能确实会导致他们辍学而不是毕业。迪亚兹的这一发现与当前美国政策所鼓励之事并不一致,而这种政策与现实之间的背离足以让教育家们欲哭无泪。由此可见,如果仅通过常识来设计一种教育体系,只不过是在浪费时间和金钱,那就只会导致一种情况——正如作者所指出的——我们当前的政策或许正在浪费生命,而我们却还没有制定出可以取代它们的有效政策。
弄明白哪些教学技术确实会产生作用,而哪些教学技术不会产生作用,正是本书所探讨的一场革命。
与大数据同行的学习意味着两种迥异的学习过程。对于学生而言,他们是在一个同样也在向他们学习的体系中学习着课程。这一体系知道学生何时需要加倍依赖于概念,知道何时需要继续往下学习,还知道如何让学生在每一天中平衡“温故”和“知新”。这些学生是在伴随着大数据而学习,因为在他们所身处的系统之中,有关他们如何从事与他人和课程目标相关之事的证据,可以在分秒之中产生,而不是需要一个学期或学年才能出现。
但是,教育工作者们也在伴随着大数据而学习。我们第一次有机会来检验假设,来比较方法,来了解(而不只是猜测)什么是有效的和什么是无效的。反馈循环(feedback loop)对于学生来说将是一种改进,而对于教师来说则会是一种转型。
克里斯·阿吉瑞斯(Chris Argyris)是一位组织理论专家,他介绍了学习型组织的理论。大多数组织采用被阿吉瑞斯称为“单回路学习”(single-loop learning)的模式,它们在学习中犯了错误之后才会努力去纠正。例如,当一所学校进行的一次考试或一堂课的难度过低或者过高时,学校就会确定问题并在下一次加以克服。这就是单回路学习——犯了错误,将其抓住并予以纠正,尔后继续前行。
“双回路学习”(double-loop learning)则与之不同。一个践行双回路学习的组织会纠正自身的错误,但它还会做许多更重要的事情,包括分析其犯错的原因。双回路的学习需要分析组织本身在反馈回路中所使用的大量数据。本书中诸多有趣的故事都是关于双回路学习的,例如萨尔曼·可汗(Salman Khan)在运用学生如何学习的数据时,他不只是在设计教学,而是在设计可汗学院本身。
迈尔-舍恩伯格和库克耶认识到了这一巨大的进步。大多数组织习惯性地拒绝变革,而且并不认为这种变革将是迅速的或是由精英们领导的。只有当创新经常出现时,比如要改变人们过去受到不好的服务或根本没有受到服务的状况,这种变革才会发生:人们需要矫正教育,人们处在当前功能健全的机构之外,当前的教育制度让所有年龄段的人感到失败。
迈尔-舍恩伯格和库克耶认为,这一变革最终将波及各行各业。从生物学界到篮球界,最初都会有一些员工在短期内抗拒数据驱动的分析,但在数据能够影响结果的每一个领域,最终都会采纳数据驱动的决策方法。教育机构同样如此,一开始只有少数机构愿意接受,但最终会扩展到全部。
正如作者所说:“信息技术作为进步的基础是不容置辩的,但当下面临的变革并不是技术层面上的。”当前的变革是组织变革。要作出应用数据的决定,就不得不成为知道如何变革自身的那种组织,以便回应新信息,回应经常与传统实践相冲突的新信息。
我们第一次要求自己拥有理解学生正在做什么的能力。我们能够理解在最大规模情况下学生是如何学习的,理解在任何给定的学年中数以百万计的各种数据。我们能够理解在最小规模情况下学生是如何学习的,理解每一个个体在10分钟的课程中是如何学习的,而不只是每一个个体是如何学习的。不同于旧有的调查世界和样本,我们能够连接上述两类规模——大数据是数以亿万计的小数据的汇集。
高等教育的未来依赖于本书巧妙而有力地论证的特征:教学的个性化、把有效努力从无效努力中分离出来的反馈循环,以及由大规模数据集的概率预测而产生的设计或体系。决定着教育之未来的,是那些更好地利用大数据来适应学习的组织。
[美]克莱·舍基(Clay Shirky)
美国纽约大学、上海纽约大学教授
被誉为“互联网革命最伟大的思考者”
著有《认知盈余:自由时间的力量》等畅销书
维克托·迈尔—舍恩伯格(ViktorMayer-Schönberger),生于奥地利萨尔兹堡。
获哈佛大学法律学硕士,伦敦政治经济学院国际关系学硕士,奥地利萨尔兹堡大学法律系博士。
现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院国家公共政策专业副教授、哈佛信息政策监管项目负责人。
曾受邀在包括白宫、世界经济论坛、欧盟议会、欧盟委员会、国际电信联盟、谷歌、微软、IBM、德勤、英特尔等许多国际知名机构及企业进行演讲交流。
畅销书作家,作品《大数据时代》一经出版即登上《纽约时报》及《华尔街日报》畅销书榜,同时入选《金融时报》2013年度最佳商业图书、CNN财经年度最佳商业图书。中文版获2013年度CCTV中国好书。
肯尼思·库克耶(KennethCukier),《经济学人》(TheEconomist)数据编辑,是一位著名的大数据发展评论员。
序一 未来教育的形态
序二 大数据时代教育的新图景
1、薄暮
截然不同的教学形式
数据的非凡效果
大数据正在进入教育的方方面面
有别于“讲台上的贤能者”的传统教育
风投资金涌入教育领域
大数据服务于各行各业
大数据将为教育带来巨大变革
2、改变
令人愉快的双赢设计
小数据时代单向度的反馈
电子教科书的优势
会“回话”的电子教科书
教育机会均等的代价
缺乏个性化的教学改革
“一个尺寸适合一个人”
补习班:适应性学习软件的用武之地
大规模定制:创建个人的“播放列表”
理性对待概率预测
概率预测日渐精准
探寻“是什么”而非“为什么”
3、平台
数据分析:可汗学院的大脑
对数据的充分利用
学校、班级、课本和课程是重要的数据平台
教育系统太过保守
大数据使教育资源得以松绑
在线课程无法替代课堂教学
规模空前的数据资料收集平台
大学率先感受大数据的浪潮
亚马逊击败巴诺书店对教育的启示
大数据浪潮袭来,大中小学无一幸免
数据分析:女学生何以后来者居上
未来教育体系的特征
4、后果
正视大数据的黑暗面
永久的过去
过往的个人数据,能否成为主要评估依据?
最大隐患:无法遗忘的旧数据
无法驳斥的大数据预测
备受争议的教育分流
与大数据同行的一大风险
做好数据资料的管控
算法专家:一个新角色的诞生
谨慎使用个人数据
不要让过去完全决定我们的未来
5、破晓
什么原因让学生中止在线课程的学习?
绝非技术层面上的变革
大数据为学习带来三大改变
确立多重安全措施
大数据将从根本上改变教育
认识世界的新方式
淘汰过去的捷径
想象力远比知识更重要
6、追问
大数据与学校教育系统的重塑
大数据关照下的数字鸿沟问题
大数据时代背景下的教师与学校管理者
大数据与求变且渐变的学校教育模式
大数据的潜在威胁与可能的应对策略
大数据的背后其实是人的问题
资料来源
译者后记
令人愉快的双赢设计
路易斯·冯·安(Luis Von Ahn)的外表与行为和大家身边典型的美国大学生没什么两样。他喜欢打电子游戏,喜欢飞快地驾驶他的蓝色跑车,他就像现代的汤姆·索亚(Tom Sawyer),热衷于差遣别人替他做事。但是人不可貌相,实际上,冯·安是世界上最杰出的计算机科学教授之一,而帮他做过事的,足足有10亿人。
10年前,22岁的研究生冯·安参与创造了一项名为CAPTCHAs的技术,要求人们在注册电子邮件等网络应用时输入弯弯曲曲的文字,以证明进行此操作的是人类而非恶意灌水的程序。冯·安把CAPTCHAs的升级版(reCAPTCHA)卖给了谷歌,这个版本要求人们输入扭曲文字的目的不仅是作验证,更主要的目的,是为了破解“谷歌图书扫描计划”中那些计算机难以识别的文字。这是个聪明的做法,发挥了一项数据的两种作用:在线注册的同时识别文字。
在那之后,成为卡内基梅隆大学(Carnegie Mellon University)教授的冯·安开始寻觅更多的“一石二鸟之计”——使人们提供的零散数据为两种目的服务。于是,在2012年,他启动了新的设计——多邻国(Duolingo),通过网站和智能手机APP帮助人们学习外语。作为一个幼年在危地马拉学习英语的人,冯·安对学习外语抱有共鸣,而更重要的是,多邻国的教学方式非常巧妙。
它要求人们在同一时间翻译一些较短的词组,或者评价和修正其他人的翻译。不同于一般翻译软件呈现其自创词组的做法,多邻国呈现的是需要翻译的文档中的真实句子,因此公司能够从中获取报酬。一旦有足够的学习者能够翻译或验证特定词组,系统就会接受他们的译文,并收集所有零散的句子,将其整合到完整的文档之中。
多邻国的客户包括CNN和BuzzFeed等媒体公司,后者通过多邻国的服务,翻译用于其海外市场的相关内容。和reCAPTCHA一样,多邻国也是个令人愉快的“双赢”技术:学习者免费获得外语学习指导,同时制造具有经济价值的产物作为回报。
此外,还有第三个益处,那就是多邻国收集的“数据尾气”(data exhaust),即由人们与网站之间的互动中衍生的副产品:如熟练掌握一门语言的某一方面需要多长时间、最合适的习题量是多少、落下几天进度的后果等等。冯·安意识到,所有这些数据都可以采取某种方式加以处理,从而揭示出促进人们学习的最佳策略。在非数据环境中,做到这一点并不容易。然而,对于2013年间的每一天都有大约100万访问者,并且人均花费30多分钟用于线上学习的多邻国来说,巨大的用户数量足以支撑此类研究。
冯·安最重要的发现是:关于“人们怎样学得最好”的问题是错误的。重点不在于“人”怎样学得最好,而是具体的“哪个”人。对此,他解释说,针对最佳语言学习方法的实证研究数量很少,比方说,在许多理论中,主张先教形容词,再教副词,但几乎没有确凿的数据支撑。他指出,即使存在相关数据,通常也是针对数百名学生的小规模研究所得,将之作为普遍的研究发现加以推广,终究是不可靠的。为什么不以多年来数以千万的学习者为研究对象得出结论呢?多邻国的出现,使这样的研究成为可能。
冯·安在处理数据的过程中得到了一个重要的发现,即语言教学手段有效与否取决于学习者的母语以及他们将要学习的语言。以西班牙语使用者为例,通常,他们在学习英语的最初阶段就会接触到“he”“she”和“it”等代词。然而冯·安却发现,“it”一词容易引起他们的迷惑和焦虑,原因是“it”很难翻译成西班牙语。于是冯安进行了几次测试,只教“he”和“she”,直到数周后坚持学习而不放弃的人数显著增加,再开始“it”一词的教学。这样就能显著提高坚持学习的人数。
他还有一些发现是有悖直觉的:女性的体育术语学得更好;男性更擅长学习与烹调和食物相关的单词;在意大利,女性总体来说比男性在英语学习上表现得更出色。许多类似的发现始终在不断涌现。
多邻国的故事为我们呈现了大数据重塑教育的最有前景的方式之一。其中反映了大数据改善学习的三大核心要素:反馈、个性化和概率预测。
无法驳斥的大数据预测
第二个威胁也同样严峻。以所有人为对象收集到的全面教育数据,将用于对未来进行预测:我们应该以这样的速度、按这样的顺序学习;我们只有在晚上8点至9点间复习学习材料,才能有90%的可能性得到B,如果复习得早了,其可能性将会降至50%;等等。诸如此类的概率预测将会限制我们的“学习自由”,并有可能最终威胁到我们对生活中机遇的获取。
大数据蕴含的巨大潜力在于推进个性化学习、改善教材和教学,并最终提高学生的成绩。数据应该被视为促进产品改良的反馈,而不是对产品使用者进行简单评价的依据。在今天,被收集的有限数据几乎都是用来评价学生的,即学习中的“消费者”。
我们评估可能的方案和潜在的成就:从高中提升课程的受理到高校录取,再到研究生院的入学。但是此类基于有限数据的小数据预测,充满了不确定性,因此招生委员会对这些数据的处理极其谨慎。委员们认识到数据展示的内容并不完善——那些以高分通过SAT考试的自大狂并不是凭借真才实学,而仅仅是因为记住了复习指南——便积极地增加评估的主观性,当他们意识到依赖数据可能造成以偏概全的结果时,会将主观判断置于数据决断之前。
然而,大数据时代的预测精确度将远远超过现在。这向招生委员会和招聘人员等决策制定者施加了更多的压力,使其更倾向于相信基于大数据的预测。在过去,我们可以辩称所属的分组不是特别适合自己,为某种情况找到开脱的理由。比如,我们有可能被分到“好学生,但是搞不定统计课”的群组中,并最终因此被经济学专业拒之门外。但是我们仍然可以凭借这样的解释说服别人:基于这一分组的预测于我们而言是不正确的,所以即使同组的其他成员会失败,我们还是有可能获得成功。因为该预测是基于“小数据”作出的,决策制定者往往倾向于相信当事人是“无辜”的,而当事人能够通过协商为自己辩解。
而新的威胁在于,基于大数据的预测是如此准确、个性化程度如此之高,我们将不再因为名义上所属的分组,而是实实在在的“自己”被问责。因此,任何借口都可能不足以说服决策制定者站在我们这一边。事实上,任人来作判定有可能完全地从决策过程中移除,取而代之是以机器算法为基础的操作,包括读取电子数据表、计算概率并作出有约束力的决定,而这一系列操作仅需耗时几毫秒。
比如说,一些大学正在开展“电子顾问”(e-advisors)的实验,这款大数据软件系统通过数字处理提升学生的毕业率。自2007年亚利桑那大学采用该系统至今,学生顺利升学的比例已由77%上升到84%。在田纳西州的奥斯汀州立大学,当学生选修“学位罗盘”(Degree Compass)软件向其推荐的课程后,他们有90%的可能性得到与软件预测一致的B以上的高分,而没有获益于“学位罗盘”的学生,获得同样分数的比例仅占60%。
……