大数据时代的外语教育科研
发布时间:2015-10-29 浏览次数:

——摘自刘润清教授的《外语教学中的科研方法》

    在大数据时代,在今后二三十年里,外语教育(可能主要是英语教育)会发生根本性变化。由于教学模式、学习模式的变化,在教师认知和学生认知上也会发生变化,所以我们的科研方向和重点(题目,领域,所跨学科)也会有根本性的改变。由于计算机技术的高度发达和大数据时代的到来,我们的科研方法和统计方法也会有根本性的改变。本节分别讨论网上外语教育的变化趋势和实现网络教育后,外语科研方面可能发生的重大改革。先讲网络教育带来的各种变化。

    一、教师的角色转变。教师不再是知识的唯一占有者和提供者,而变为课堂的组织者和学习的引导者,英语描写这一变化更为有趣:教师从God变成Guide,从Sage on the stage 变成 Guide on the side,从teacher变成helpercouncilorfacilitator等。组织者和引导者并不好当,因为教师要对学习内容十分熟悉,并知道网上有何种公开课视频可以提供。教师同时最好了解学习者的特征(性格、认知方式、学习方法、学习目的、特殊经历等),能比较准确地告诉学习者在特定阶段什么视频最适合他。只有这样,才能实现教学的个性化。当然,引导者必须熟悉学习内容,否则引导就是空话。换句话说,教师备课量不会减少,只是在课堂上呈现量减少了;而准备须回答的问题时,思维范围会加宽,内容也会多种多样,千差万别。此外,教师对教育技术的掌握也就成为理所当然的了。

    少部分教师会成为公开课视频的演讲者或导演。提供公开课的教师,其教学理念要彻底转变。他要知道网络公开课不是课堂搬家;他要面对几万、十几万世界各地的水平不同、兴趣不同、学习方法不同的选修学生;内容之精准、繁简之恰当、表达之清晰,以及吸引学生之牢固而持久等,都是对他极大的挑战。例如,视频要模块化——每个主题只占35分钟,方便学生利用零碎时间观看;重要知识点处,须嵌入交互式问题,方便学生及时检查学习效果;涉及背景资料时要嵌入超链接,方便学生先链接到网上查看资源,然后立刻返回原处。将来,以课程为载体的视频会不断地被生产、积累、淘汰和沉淀。可以肯定地说,通过互联网上的编辑与合作,在不久的将来,世界上的每个领域、每门课程、各个层次的视频,都会出现一些经典之作,保留下来。它们将取代教师的课堂授课,成为最受学生欢迎的学习材料。随着在线平台的推广和普及,会有越来越多的教师把自己的授课视频放到网上。美国有个Udemy网站,教师可以根据自己发放视频的点击率获得报酬。除了课程视频,教案也可以放到网上进行交易。佐治亚州的一位学前班老师的教案成交量已达79万美元,月均收入6万美元。教案的交易还出现了由学校牵头组织团购,统一发给全校老师参考使用的形式。

    还有的教师瞄准了“引导者”的角色,推出了提供专门辅导的家庭网站。学习者可以从网站上公布的专家中,按自己的专业课程选择自己喜欢的辅导者。通过网上辅导,10分钟的视频交流后辅导服务开始按分钟计费。这样,学习者和辅导者可用很低的成本、很少的时间,实现有效的对接,构建一对一的学习环境。涂子沛(2014)称之为“微学校”。由于计算机和网络无处不在,“微学校”可以随时随地地搭建。

    多年来,我们总听说高排放、高污染、高能耗的重工业正经历着“结构性调整”。现在,轮到教育来经历“结构性调整”了。结构性调整不仅更换结构,更重要的是革新理念和生产方式。不过,看来教师们不用担心会丢掉饭碗,只是要调整教学理念,适应新的教学模式,提前做好准备,说不定我们能在新的环境下大显身手。

    二、学习者角色的转变。学习者成了真正的中心:他自己决定学什么、何时学、如何学、在哪学、学多少、学多快。学习者的主动性要充分发挥出来:首先他不能是计算机盲,而是要娴熟掌握网络技术;第二,他要主动了解有关课程的一切信息,包括他自己的责任、教师的责任、管理人员的责任等,以便决定自己选修的专业和课程;第三,他必须在网络通知的限制之内,完成课程作业,按要求修够学分等;第四,他有大把的时间和绝对的主动权,个人的决定和努力决定了自己的未来。这要求学生有高度的自觉性、自律能力、毅力、自我管理能力等。放任自流、自由散漫、不能自律的学生会遇到困难。也会有极个别意志薄弱或娇生惯养的学生,被网络上的八卦信息所吸引,迷恋于不三不四的游戏、大片、赌博等,成为大数据时代的牺牲品。

    师生角色的变化比表面看去上要深刻得多。在从前的学徒制和私塾制里,讲究“师徒如父子”,是很不平等的关系,知识的传授是一对少,老师是绝对权威;后来的学校制,开始了师生关系,解除了不平等的“父子”关系,打破了师生的小比例关系,但一对多的教授方式和工厂生产线式的批量生产,无法给学生提供个性化的、持续性的指导和评价;而且,教师仍然把持着知识权威的地位。用一个模子刻制零件的批量生产式,也扼杀了学生的个性和创造性。大数据时代则不同,教师从“父亲”、“权威者”变为指导者、帮助者、协商者——师生间的关系平等多了。现在,学生成了中心,是被服务的对象,无限扩大了自我发展的空间,不再被放入同一个模子里压铸成统一型号的产品。

    三、学习材料的转变。可能纸质教材和参考书会减少(但不会彻底消失),音频、视频资料会大大增加。电视使用会减少,MP3MP4、笔记本和手机等会更加普遍。2013年的全国国民阅读调查结果显示,传统纸质媒介中,2013年成年国民对图书、报纸和期刊的接触时长均有不同程度的减少;新兴媒介中,上网时长和手机阅读的接触时长呈增长趋势。中国新闻研究院院长魏玉山表示,超九成的数字化阅读方式接触者表示阅读电子书后就不再购买其纸质版,这一数据连续四年持续上升,反映出数字出版对传统出版物的冲击作用不断加强。学习材料的可及性极度增长:数字化材料应有尽有,有文字的,有声音的,有视频的,包括百科全书、词典、虚拟场景、虚拟地图、虚拟世界。因为媒介的彻底转变,将来教材编写的原则也会发生变化。比如,原来繁琐的文字阐述和描写,可能被模拟视频所代替。只依靠视觉输入的文字材料会减少,要求手、眼、耳、口并用的材料会大大增加。技能层次类的课程大多具备可拷贝性,可以交给大投入的电影制作模式完成。文化性和学术性的教材制作起来挑战性大些,可能要经过几年的试验阶段。最重要的学习材料是公开课视频。每节时长为2个小时的课程视频,一般会被分解为若干个时长为815分钟的知识模块(modules)。这是为了让学生自己驾驭课程学习,学生自己在与学习材料的互动当中选择属于自己的路线和速度。只有按教师要求完成一个模块,才能进入下一个模块的学习。每个知识模块里包括的课程活动有:815分钟的讲座视频,其中有嵌入式小测验、课后测验和考试、同伴评价题目、编写程序作业、调查题目、课程讨论区、谷歌视频群聊,等等。当然,还有上传给学生的额外的背景材料。认知心理学告诉我们,回溯检索性学习(the retrieval task)可以提升学生的学习质量。大规模网络开放课程(MOOCs,可译为“幕课”,即屏幕上的课程)的课堂教学由于在讲座中成功地嵌入了测试问题(embed quiz questions),使得学习者投入学习的热情大大增加。在大规模网络开放课程中,这些测验的结果并不计入学生修课成绩,否则学生会因此变得焦虑,对课程及学习内容产生畏难情绪,甚至本来很想学习这门课程的都因此而弃选。

    四、学习环境的变化。大学校园的界线会变得模糊甚至被打破,学生在教室里学习的时间减少,而随时随地的学习会成为普遍现象,有人称之为“学习时间碎片化”。师生之间和学生之间面对面的交流不多,而在网上的视频互动机会大大增加。来自不同国家的学生会在网上相遇、互动,成为学习伙伴——求学过程的国际化程度会发展到不可想象的地步。那时会有多个大网站,提供各门学科的各种资料,相当于多个大图书馆。输入关键词,想查阅的资料就会呈现于屏幕。只要学生能有上网的机会,就能克服地域限制,就能实现教育的相对公平、受教育机会的相对均等。网络公开课程有着极富生气的讨论区,选择同一门课程的数以万计的同学,以他们特有的方式互帮互助。有些授课教师会通过网络社交平台积极参与到同学们的讨论中去,而有的教师则会邀请助教对同学们的讨论和问题进行反馈和必要的提醒。前面提到,会有“微学校”或称“家庭辅导网站”出现,学生可以选择自己看中的辅导老师就某一门课程进行辅导,那绝对是一对一、个性化的交流,按时间付费即可。以社交媒体为特征的Web2.0)技术已经把人际交流互动推向登峰造极的应用。现有的信息技术可以通过网络视频和智能软件,为每个学习者提供一个学习情境,像活生生的人一样对学习者的学习行为提供持续性的引导、评价和支持,如发出提示或建议,指出错误,教授学习方法,帮助养成良好学习习惯等。部分“课程时代”的学生已经在使用Google Hangouts on Air Weekly videoTwitter feedFacebook page进行在线聊天,并制作在线教室、分享学习体验、交换意见和看法等。部分距离较近的学生甚至会通过线上约定方便的时间、地点见面,讨论学习情况。大规模网络开放课程作为一种基于科学学习理论和经过精心设计的教学模式,首次把学习的本质、学习过程、学习动机、学习策略等学习科学的基本规律运用到教学当中,从而大大提升了学习体验和学习质量。放眼看去,几十年后,大学校园的围墙将不复存在,课程、教案、辅导、讨论统统被搬到网上去了,教师都在网上“上班”了,这对去教育行政化和官僚化大概会起到不小的作用。以后的网络管理和网络政务,不知道可以精简多少百万公务员。

    五、评估和测试的变化。首先,笔纸测试(pen and paper test)会逐渐减少,代之以机测、网上测试。机测的好处之一就是它能自动调整项目的难易度;好处之二是它不仅记录下考生的答案,同时也记录下答卷的过程——改动几次才“碰”对答案,并把过程错误加权后计入分值;好处之三是随着机器智能的提高,外语考试不再大量依靠多项选择题,机器可以对口语表达和作文进行评分。多年来难以对主观试题评分的棘手问题会逐渐彻底解决,并不断完善。以后的面试,考生不用再跋山涉水,“帷幄私宅,即可决胜千里之外”。口试还可以录像,评分时参考视频效果,甚至可对视频进行多模态分析(multimodal analysis)。一旦机器可以评阅主观试卷,“人情分”、“成见分”就会随之消失。考试作弊也会杜绝——机器上的身份认证、可视镜头、网上监控等会比保安人员更“六亲不认”。一旦发现作弊的机器,立刻屏蔽,三年之内不能登录(比方说);枪手躺着也得中枪。顺便说一句,那时不用几万人、几十万人同时考试,每个人都可随时考试,立刻知道成绩。网测的试卷也不同于目前的纸笔试卷。一定是听、说、读、写、译综合考试,语言地道自然,真实场景再现,图文声情并茂,让学生有身临其境之感。再往后,机器会让考生“进入”虚拟场景,与里面的人物对话、解决问题、完成任务等,那才叫考查语言运用。让一切考查语法知识、四项填空等远离自然语言运用的做法,统统见鬼去吧。

    当然,大规模网络教育也会带来问题。第一,学习者直接面对的是冰冷的机器,这会使原本是社会性行为的学习活动成了“孤军奋战”。社会性元素的缺失,可能导致学习者完不成社会化的进程,这对中国的独生子女尤为致命。第二,时空分离和面对面交流的缺失,可能会导致学习者缺乏信任感、身份认同感、集体感和相互承诺感,这也会削弱共享知识和彼此协作的责任感。第三,学习者可能会找不到归属感。在传统教学中,学生属于一个集体,受着群体的约束,同时也得到老师和同学们榜样的激励。而在网络教育中,这些传统的元素被大大地淡化,学习效果几乎完全取决于个人的学习能力和自我约束控制能力,这有可能让学习者缺乏一种归属感,进而产生孤独感和距离感。

    不难想象,在上述教学背景下的科研一定与现在大不相同。目前我想到的大概包括以下几点:

    一、大数据对哲学观点的冲击。近些年来,经验主义受到不少批评,因为人类对事物的感知极为有限,靠人工收集数据几十年充其量还只能算“样本”(sample)。自从数据库的出现,人们开始对经验主义产生新的认识:瞬间获取海量数据,从量变跳到质变(见本章第一节),让研究者突然观察到从来不敢想象的发现。维克托·迈尔–舍恩伯格和肯尼思·库克耶在《大数据时代》中谈到三大变化:第一,现在的科研能分析更多的数据,有时甚至是关于某个现象的全部数据,因此不再依赖随机采样。他们提出,我们的目标是“样本=总体”(这一“野心勃勃”的目标只有在大数据时代才有可能)。第二,我们拥有的数据如此之多,所以不再热衷于追求精确度,当然,也不是放弃精确度,只是不再迷恋于它。适当忽略微观层面,会让我们在宏观层面有更好的洞察力。第三,有了以上两个变化,我们不再热衷于寻找因果关系,而更注重相关关系。这三条会彻底改变我们在科研问题上的本体论、认识论、方法论。以前,因为我们能够收集的数据少,所以只能依赖随机抽样。因为是随机抽样,所以讲究精准。因为观察范围小,只能人工设计实验求因果关系。但是,抽样再精确,推理出的总体统计也有偏差;实验设计再好,也是人工控制了某个变量,总有几分不自然。迈尔–舍恩伯格和库克耶在书中说:“大数据对个人的影响是最惊人的。在一个可能性和相关性占主导地位的世界里,专业性变得不那么重要了。行业专家不会消失,但是他们必须与数据表达的信息进行博弈。如同在电影《点球成金》(Moneyball)里,棒球星探们在统计学家面前相形见绌——直觉的判断被迫让位于精准度数据分析。这将迫使人们调整在管理、决策、人力资源和教育方面的传统理念。”(注:《点球成金》改编自2003年出版的《魔球——逆境制胜的智慧》,它被《财富》杂志推荐为商业必读。这本书记录了美国体育界一个真实的商业奇迹:“烂队”奥克兰运动家队自从采纳了一种基于精算、概率论等的计算程序后,横空出世,拉扯着一帮“衰兵败将”型球员,创下103场比赛连胜的纪录。这可以说是一部财经电影,其中包含统计学、会计学、经济学、管理学、矩阵计算、矢量计算、精算、概率论等,以此搭建起一个传说中的完美数学模型。这又是一部励志电影,充满丰沛的美式“挑战”精神:个人挑战体制,衰人挑战大牌,被钉死的钉子挑战命运的板子。)下面,我们根据维克托·迈尔–舍恩伯格他们的论断,引申出几个重要问题加以讨论。

    二、随机抽样要不要坚持?很长时间内,随机抽样是一条好的捷径,它使得数字时代前的大量数据分析成为可能。但是,就像把一张数码照片或一首数码歌曲截成多个小文件似的,在抽样分析时,许多信息就丢失了——我们无法欣赏一首歌曲的抽样。中国有句流行的话是“解剖麻雀”,意思是研究一只麻雀就能知道所有的麻雀是什么样子。这话可能只说对了8090%,肯定有些信息没有涉及到。比如,椋鸟跟麻雀差不多大,但它们是生性喜欢群飞的鸟,以其群飞队形的变幻莫测而闻名,并成为摄影家的宠爱。请看下面几张椋鸟群飞图。据说,它们飞行时靠得很近,但从来不会相撞,这一技能的功用是迷惑捕食者(如隼鹰)。沙丁鱼的群游和蝙蝠的群飞也有这种特性。像椋鸟的群飞能力,单靠解剖一只麻雀是发现不了的。这个例子说明了抽样研究的局限性,即是说观察一个个体不同于观察一个群体,观察一个小群体也不同于观察一个大群体。

    迈尔–舍恩伯格还举过一个恰当的例子。具有革新性的Lytro相机把大数据运用到了基本的摄影中,传统相机只能记录一束光,而Lytro相机能记录整个光场里所有的光,达到1,100万束光。具体生成什么照片则可在拍摄后根据需要而定。这就等于收集了全部数据,“样本=总体”。因此,这些照片就更具有“可循环利用性”。普通相机就像随机抽样,拍摄前必须决定聚焦点。所以,随机抽样虽然优点突出,但它是没有办法的办法,如我们没有能力调查研究10亿人,所以只好随机抽样200人。现在的大数据常常超过几百万、几千万的被研究者——网民有多少,被试就有多少。在我们有能力全面利用大数据开展外语科研之前,只能坚持随机抽样;但在不久的将来,随着大数据技术的普及,我们会在某个题目上或某个小领域中,达到或接近“样本=总体”的境界;越到后来,此类情况会越来越多,直到某一天我们积累了各种各样的大数据,随机抽样不再唱主角,只有在个别题目上偶尔/仍然使用。如今,我们掌握的数据库越来越全面,它不再只包括一点点可怜的数据,而是包括与研究问题相关的大量甚至是全部数据。我们不再需要担心某一小部分数据对整套分析产生不利影响。我们要接受这些纷繁、杂乱的数据,并从中受益,而不是以高昂的代价去消除那点不确定性。维克托·迈尔–舍恩伯格说:“要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不是应该竭力避免的。”他还说,世界上只存在唯一真理的想法已经过时了,再去追求它是对注意力的分散。传统数据库的设计要求在不同的时间提供一致的结果。但是,随着数据量的大幅增加以及系统用户的增加,此类一致性将难以保持。以后的大数据库将不固定在某个地方,而是分散在多个硬盘和多台电脑上。为了确保其运行的稳定性和速度,一个记录可能分开存储在两三个地方。当服务器上每秒钟都接受成千上万条搜索指令时,同步更新记录就不太现实了。因此,承认多样性是个解决问题的办法。我们也许要学会容忍模糊性和不确定性——只要能对事物有个清楚的、完整的概念,其中掺杂点模糊也可以接受。

    三、如何处理因果关系和相关关系?我们喜欢求真,这是好的。但是,相关关系比较容易发现,因果关系则很难判定。前面讲过,这个世界充满相关关系,而且是我们想象不到的相关关系:我们能预测许多事情,但无法解释其背后的原因。例如,医生依靠大数据取得了病理分析,制定出治疗方案,但却无法说明其病学干预的合理性。我预料,将来在外语学习上也会发现此类现象。比如说,凡是读过英语《哈利·波特》的学生都能通过“雅思”,但解释不出为什么。相关不是因果,但相关本身就很重要。维克托·迈尔–舍恩伯格说:“大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化了。拥有大量的数据和更多不那么精确的数据为我们理解世界打开了一扇新的大门。社会因此放弃了寻找因果关系的传统偏好,开始挖掘相关关系的好处。”反过来讲,如果多次、大面积地发现AB密切相关,也许就有理由相信它们之间存在一点因果关系或间接的、逻辑不通的、理性不接受的因果关系,暂且称之为“尿布和啤酒式的因果关系”(参见本章第一节)。况且,相关关系分析本身意义重大,它也为探讨因果关系奠定了基础。如果存在因果关系,我们可以进一步找出背后的原因。我们还可以从相互联系中找出某些重要变量,这些变量可以用到验证因果关系的实验中去。

    已有许多例证说明相关关系重于因果关系。世界上最火的网上书店亚马逊最初雇用了一批书评专家写书评(等于推荐),以期增加销售量。结果发现,书评的作用微乎其微。于是便开始使用一种协同过滤技术(靠书的内容联系)推荐图书。后因通过数据推荐产品所增加的销售量远远超过书评专家的贡献,亚马逊于是解散了书评小组。还有谷歌对流感的预测:在某个特定的地理位置,越多的人通过谷歌搜索与流感相关的词条,就表明该地区有越多的人患上了流感。此外,沃尔玛通过分析无数个年轻女客户的购物趋势,便可预知哪些女孩快成准妈妈了,于是提前给她们寄去孕妇必需品说明书。这些例子都说明,“知道是什么就够了,没必要知道为什么。”这等于说,知道相关关系就够了,没必要知道因果关系。在大数据背景下,相关关系大放异彩,它让我们能够更容易、更快捷、更清楚地分析事物。

    四、实验设计还要不要坚持?近期,我们在外语教育中还收集不到很多大数据,所以,人工设计的实验还要持续一段时间。但是,由于有了网上教育,我们的实验在规模上和控制手段上都会发生变化。例如,随机抽样可在网上进行;实验组和控制组的分配可让机器完成;前测、后测、改卷和评分一律网上完成;实验不用总是面对面,可以在线进行;实验教学过程也可以用录像记录下来;问卷的回答和提交都在网上完成等。传媒手段的变化也会引起内容的变化。例如,问卷不再纯是纸质的,而是有录音、录像、虚拟情景的。我预料,当我们能够全面收集外语教育大数据时,也许再设计大型实验的意义就不那么重要了。那时我们能观察和分析的场景、因素、学生、教材、教育技术等,已是数量巨大、种类繁多、层次分明、角度多维,比不够自然的实验所揭示的东西不知要多几百、几千倍。我们现在还想象不出到底那时能开展什么研究以及如何研究。不过,话又说回来,作为辅助手段和验证手段,小型实验、勘查、观察、民族志研究等本书前面提到的方法永远不会全部消失,它们是新手研究者的入门教材,是刚接触、了解、体会科研时的蹒跚步履,也是大数据分析后的三角核查工具。

    五、统计学可能发生的变化。统计学、会计学、经济学、管理学、矩阵计算、矢量计算、概率论、正态分布等知识和原理不会发生重大变化,因为它们揭示出世界的某些自然规律。但是,为应对大数据,计算技术和范式会向前跨出一大步。现在出现的云计算、云存储、众包和外包模式等崭露头角,方兴未艾,以后会开发出更多、更完美的计算方式。目前我们使用的诸如SPSS之类的统计/计算软件还会使用相当长一段时间,直到需要修改来应对新型数据。换句话说,在今后的20年里,我们应该进一步学习统计学原理和方法,尽可能多地掌握计算方法,如怎样对音频、视频、各种图像等进行计算,同时开始了解大数据的有关情况,为科研做好长足准备。迈尔–舍恩伯格他们在书中略显狂妄地说:“行业专家和技术专家的光芒都会因为统计学专家和数据专家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。”“大数据的先锋们通常并不是来自他们做出极大贡献的领域。他们是数据分析家、人工智能专家、数学家或统计学家,但他们把自己掌握的技能运用到了各个领域。”此话意味着,我们不但不会放弃统计学,还要加强对它的学习和研究,还要开始学习数据分析,而且是大数据分析。

    六、如何取得大数据?有关外语教育和学习的大数据从何而来?这是我们现在就应该考虑的问题。我们现在就应该意识到收集外语教育大数据的必要性和迫切性。一旦开始网络教学、网上辅导、网上考试、网上报名、网上缴费、网上取得毕业证书等,就要有意识地对有关信息进开展物联网、云储存、云端分析、云端分享等,为开展各式各样的科研提供条件。英语教师必须承担开辟收集、挖掘、发现外语教育大数据的责任。近期我们也许还建立不了自己的引擎,但可以借助百度、谷歌等引擎或者其他出路。重要的是,我们首先应该阅读关于大数据的文献,深刻了解大数据时代的特点及其可能性。我们尤其要发挥最大想象力,记住“数据,从最不可能的地方提取出来”之名言,苦思冥想,挖掘再挖掘。举个例子,日本先进工业技术研究所的越水重臣教授研究了一个人的坐姿。很少人会认为坐姿能提供什么有用信息,但它真能提供不少宝贵信息。当一个人坐着的时候,他的身形、姿势和重量分布都可以量化和数据化。该教授和他的工程师团队通过在汽车座椅下部安装总共360个压力传感器以测量人对椅子施加压力的方式,把人体臀部特征转化成了数据,并用从0256这个数值范围对其进行量化,这样就会产生独属于每个乘坐者的精确数据资料。这个系统能根据人体对座位的压力差异识别出乘坐者的身份,准确率高达98%。这项技术可以作为防盗系统安装在汽车上。有了它,汽车能够识别驾驶员是不是车主;如果不是,系统就会要求司机输入密码;如果输入的密码不正确,汽车就会自动熄火。把一个人的坐姿转化为数据后,就孕育出切实可行的服务和一个前途光明的产业。我们也可以分析事故发生前的人体姿势变化,找出坐姿与安全的关系。该系统还可以在司机疲劳驾驶时发出警报或自动刹车。另外,如果汽车被盗,还可利用坐姿数据识别盗贼身份。细想起来,这位教授的想象力实在惊人。我们恰恰需要这种钻研精神。

    总有一天,我们会突然发现,被英语学习者搜索最多的英语词是哪些,有何特征,用于何种目的,反映出搜索者何种倾向,英语学习成绩如何等等。拥有大数据之后,我们回去分析什么视频被观看得最多,什么教材的借阅率最高,中国英语学习者写作中最常犯的错误是什么,每个学习阶段的词汇量是多大,等等。从大数据里的细节里,我们可以分析出学习者的性格、学习风格、认知倾向、学习策略、动机类型等,也可以分析出教师的教学理念、认知方式、习惯性教学行为、与学生的互动倾向、反馈时的风格、知识面的宽窄、教师的魅力、学生的评价等。将来,我们肯定会去分析为什么某些视频最受欢迎,为什么某些“微课”最讨学生喜欢,为何某人的教案被大量售出。总之,任何教授和学习行为都会在网上留下“指纹”,我们的信息会被第二次、第三次加以利用,而且不同的利用必将创造出不同的价值。