1、图书在版编目(CIP)数据与大数据同行:学习和教育的未来(英)迈尔-舍恩伯格,(英)库克耶著;赵中建,张燕南译.上海:华东师范大学出版社,2014.12ISBN 978-7-5675-2840-6.与.迈.库.赵.张.数据库应用学习方法研究.G791中国版本图书馆CIP数据核字(2014)第283040号与大数据同行:学习和教育的未来著者维克托迈尔-舍恩伯格肯尼思库克耶译者 赵中建 张燕南策划编辑 李永梅 何佳憶审读编辑 王悦 卢风保封面设计 吴元瑛责任印制 殷艳红出版发行 华东师范大学出版社社址 上海市中山北路3663号 邮编 200062网址 电话 021-60821666 行政传真 02
2、1-62572105客服电话 021-62865537邮购电话 021-62869887地址 上海市中山北路3663号华东师范大学校内先锋路口网店 http:/印刷者 北京汇林印务有限公司开本 8901240 32开插页 2印张 5.5字数 65千字版次 2015年1月第一版印次 2015年1月第一次印数 20000书号 ISBN 978-7-5675-2840-6/G7783定价 42.00元出版人 王焰(如发现本版图书有印订质量问题,请寄回本社市场部调换或电话021-62865537联系)序一 未来教育的形态与大数据同行的学习就是未来的教育,这既是书名的意义,也是本书的主题。“大数据”一词
3、反映了人们愈益意识到我们大家留下的数字痕迹,就如“大数据”关注数据本身一样。哥伦比亚大学心理学教授邓肯沃兹(Duncan Watts)认为,有关人们行为和喜好的丰沛数据正改变着社会科学,使社会科学从数据最贫瘠的领域转变为数据最丰富的领域。在从商务学到社会学再到文学这样一个又一个领域中,我们获取和解释数据的能力得到迅速成长,同时也需要获得新的工具。与其他任何领域相比,这一点在教育领域或许显得更为真实。多年以来,事实上是多个世纪以来,教育领域的决策从来就是在缺乏任何数据的基础上作出的。常识(common sense)一直成为正常的决策资源,即使在常识导致消极结果的情况下也是如此,而常识其实只是习惯
4、和一厢情愿的混合物罢了。迈尔-舍恩伯格和库克耶写到塞巴斯蒂安迪亚兹(Sebstian Daz)受数据驱动的关于学生矫正教育(remedial education)的发现:要求学生修读全部大学课程可能确实会导致他们辍学而不是毕业。迪亚兹的这一发现与当前美国政策所鼓励之事并不一致,而这种政策与现实之间的背离足以让教育家们欲哭无泪。由此可见,如果仅通过常识来设计一种教育体系,只不过是在浪费时间和金钱,那就只会导致一种情况正如作者所指出的我们当前的政策或许正在浪费生命,而我们却还没有制定出可以取代它们的有效政策。弄明白哪些教学技术确实会产生作用,而哪些教学技术不会产生作用,正是本书所探讨的一场革命。与
5、大数据同行的学习意味着两种迥异的学习过程。对于学生而言,他们是在一个同样也在向他们学习的体系中学习着课程。这一体系知道学生何时需要加倍依赖于概念,知道何时需要继续往下学习,还知道如何让学生在每一天中平衡“温故”和“知新”。这些学生是在伴随着大数据而学习,因为在他们所身处的系统之中,有关他们如何从事与他人和课程目标相关之事的证据,可以在分秒之中产生,而不是需要一个学期或学年才能出现。但是,教育工作者们也在伴随着大数据而学习。我们第一次有机会来检验假设,来比较方法,来了解(而不只是猜测)什么是有效的和什么是无效的。反馈循环(feedback loop)对于学生来说将是一种改进,而对于教师来说则会是
6、一种转型。克里斯阿吉瑞斯(Chris Argyris)是一位组织理论专家,他介绍了学习型组织的理论。大多数组织采用被阿吉瑞斯称为“单回路学习”(single-loop learning)的模式,它们在学习中犯了错误之后才会努力去纠正。例如,当一所学校进行的一次考试或一堂课的难度过低或者过高时,学校就会确定问题并在下一次加以克服。这就是单回路学习犯了错误,将其抓住并予以纠正,尔后继续前行。“双回路学习”(double-loop learning)则与之不同。一个践行双回路学习的组织会纠正自身的错误,但它还会做许多更重要的事情,包括分析其犯错的原因。双回路的学习需要分析组织本身在反馈回路中所使用的
7、大量数据。本书中诸多有趣的故事都是关于双回路学习的,例如萨尔曼可汗(Salman Khan)在运用学生如何学习的数据时,他不只是在设计教学,而是在设计可汗学院本身。迈尔-舍恩伯格和库克耶认识到了这一巨大的进步。大多数组织习惯性地拒绝变革,而且并不认为这种变革将是迅速的或是由精英们领导的。只有当创新经常出现时,比如要改变人们过去受到不好的服务或根本没有受到服务的状况,这种变革才会发生:人们需要矫正教育,人们处在当前功能健全的机构之外,当前的教育制度让所有年龄段的人感到失败。迈尔-舍恩伯格和库克耶认为,这一变革最终将波及各行各业。从生物学界到篮球界,最初都会有一些员工在短期内抗拒数据驱动的分析,但
8、在数据能够影响结果的每一个领域,最终都会采纳数据驱动的决策方法。教育机构同样如此,一开始只有少数机构愿意接受,但最终会扩展到全部。正如作者所说:“信息技术作为进步的基础是不容置辩的,但当下面临的变革并不是技术层面上的。”当前的变革是组织变革。要作出应用数据的决定,就不得不成为知道如何变革自身的那种组织,以便回应新信息,回应经常与传统实践相冲突的新信息。我们第一次要求自己拥有理解学生正在做什么的能力。我们能够理解在最大规模情况下学生是如何学习的,理解在任何给定的学年中数以百万计的各种数据。我们能够理解在最小规模情况下学生是如何学习的,理解每一个个体在10分钟的课程中是如何学习的,而不只是每一个个
9、体是如何学习的。不同于旧有的调查世界和样本,我们能够连接上述两类规模大数据是数以亿万计的小数据的汇集。高等教育的未来依赖于本书巧妙而有力地论证的特征:教学的个性化、把有效努力从无效努力中分离出来的反馈循环,以及由大规模数据集的概率预测而产生的设计或体系。决定着教育之未来的,是那些更好地利用大数据来适应学习的组织。美克莱舍基(Clay Shirky)美国纽约大学、上海纽约大学教授被誉为“互联网革命最伟大的思考者”著有认知盈余:自由时间的力量等畅销书序二 大数据时代教育的新图景欣闻维克托迈尔-舍恩伯格与肯尼思库克耶新作、赵中建教授翻译的与大数据同行:学习和教育的未来即将出版,受邀为该书撰写序言,于
10、是有机会先睹这本介绍大数据时代教育变革的新书。初识赵中建教授,缘于他关于其创新引领世界美国创新和竞争力战略一书内容的讲学。今天,又看到赵教授翻译的与大数据同行:学习和教育的未来,感觉很酷。这是一本与时俱进,站在当今信息技术与教育变革最前沿的力作,让读者一下子就站在时代的前沿,对大数据与教育的关系有个初步的了解。可以说,这是身处大数据时代的每一位教育工作者都需要阅读的一本关于未来教育发展的普及读物。在这本书里,作者迈尔-舍恩伯格和库克耶通过一个又一个生动的故事、大量惊人的证据、高瞻远瞩的科学家视野,阐明了他们对大数据时代教育将如何变革的深刻理解,给读者描绘了未来大数据时代人们全新的生活、工作和思
11、维方式的图景。大数据对社会生产和生活的影响,在教育以外的行业已经十分明显,无论是银行、电信、铁路、航空,还是军事、政治、工业、商业,基于大数据的决策已经成为现代社会各行业运行的基础。以医疗行业为例,21世纪,临床医学借助新兴科技的发展,进入了以科学和大数据为基础的现代医学时代。例如,计算机图像处理技术与X射线、超声波、核磁共振技术相结合,促进了基于大数据的新型复杂成像技术的发展。生物信息学、计算机辅助药物设计以及大数据分析在医学临床和科研中的广泛应用,从根本上改变了疾病的诊断、治疗和预防的理念与技术。在解剖、病理、生化、药理等基础学科的实验基础之上,医学从古代经验型医学的范式,进入现代循证医学
12、(evidence-basedmedicine,EBM)时代,在临床中采用前瞻性随机双盲对照及多中心研究的科学方法,系统地收集、整理大数据样本研究所获得的客观证据以作为医疗决策的基础。临床医生根据最新的指南对疾病进行诊疗,避免了过去依据个体经验积累来进行医疗决策时有可能发生的偏差和失误。但是,迄今为止,我们的教育系统依然沿袭远古教育的范式,主要依靠教师的个人教学经验对课堂上学生的学习行为进行判断和制定教学决策。21世纪后,世界各国的教育改革都倡导针对学生个体差异实施个性化教学,力争做到像医学一样根据学生的学习行为大数据来调整教学策略,在课堂教学中采用基于证据的教学(evidence-based
13、 teaching,EBT),这一直是人们所追求的未来教育的理想形态。过去,在学校的教育教学活动中开展实证教学受到技术水平的局限,要收集和处理学生在教学活动中的大数据比较困难。现在,随着全社会移动终端的普及、云计算服务的发展、大数据分析技术的突破,基于学生行为大数据分析的教学将逐步变成现实。在本书中,作者具体介绍了教育中运用大数据技术的实例,如可汗学院的学习分析系统、Coursera的主讲教师如何基于大数据改进教学、亚马逊如何基于大数据实现高精确度的个性化推荐服务的故事,深入讨论了大数据给教育带来的深刻影响,给读者展示了大数据改变教育教学的美好前景。全书内容丰富,观点新颖,可供关心新兴技术对教
14、育发展之影响的研究者参考,更值得广大一线教师阅读学习。黎加厚上海师范大学教育技术学术带头人教育部全国教师教育信息化专家委员会委员英特尔未来教育中国项目专家组专家1 薄暮大数据正在进入教育的方方面面,并将对这个世界的学习产生深远的影响。大数据能告诉我们什么是最有效率的,并且揭示那些过去无从发现的谜题。截然不同的教学形式达瓦(Dawa)正在集中注意力。他在笔尖上蘸一抹颜料,小心翼翼地下笔画出一条细细的黑线,然后又蘸了一点颜料,再画出一条细细的黑线。几小时后,一副唐卡由迷人的几何细节构成的、描绘佛祖的丝绸卷轴画逐渐成形。屋外,环绕着不丹首都廷布四周的喜马拉雅雪峰,在傍晚阳光的照射下闪闪发光。屋内,达
15、瓦和他那些同样20来岁、身着蓝色长袍的同学们,已经在中年师父的注视下持续作业了很长时间。唐卡画家的培养遵循传统。达瓦和他的同学们来到这里,不是为了拓宽思维,而是为了成为一个训练有素的学徒。这里的学习,不是探究,而是模仿。早在几百年前就制定下的诸多规则,决定了该画什么、画在哪里和怎么画。达瓦的师父要确保这些年轻人严格遵守他的指令,重复那些先代唐卡画家的操作。对规则有任意一点的偏离或是破坏,不仅会惹得师父怒上眉头,还会遭到严令禁止。最好的画家,是能够完美再现师父作品的学徒。尽管师父给予的持续指导能够实现即时的反馈,但这仍然是一种极度缺乏数据的学习形式。这与吴恩达(Andrew Ng)的教学形式有根
16、本上的区别。吴恩达是斯坦福大学计算机科学家,在互联网上教授他的机器学习(machinelearning,计算机科学的一个分支)课程。吴恩达教授是提供在线课程服务的新兴公司Coursera的创始人之一,他的尝试预示着大数据对教育的变革。吴恩达教授收集所有关于学生举动的信息,从中提取最有效的内容并将其纳入系统设计,从而使他的课程能够自动实现:教学的改善,学生理解力和成绩的提高,基于个人需求的定制教育。比如,他追踪学生与视频讲座的互动行为:当学生观看视频时,点击了暂停或快进键,又或是在视频结束前选择了放弃这种数字互动意味着学生提早溜出了课堂。他能发现学生多次回看同一门课程,或者后退至上一个视频浏览课程内容的行为。此外,他也会在视频课程中穿插突击测验,其目的并不是要督促学生集中注意力学习,这种重视课堂纪律的古老教学形式不是他关注的内容,他想知道的是,学生是否正在领会教学材料,以及是否卡在了某个问题上。每一个学生个体,都是他的观察对象。通过追踪学生在计算机或平板电脑上完成作业和测验的情况,吴恩达教授能够确定学生需要额外帮助的具体内容。他可以分析整个班级的数据,观察这一群体的学习情况,并以此为依据