① 大数据怎样高效运用在教学实践中
教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术。
预测(Prediction)——觉知预料中的事实的可能性。例如,要具备知道一个学生在什么情况下尽管事实上有能力但却有意回答错误的能力。
2.聚类(Clustering)——发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很有用。
3.相关性挖掘(Relationship Mining)——发现各种变量之间的关系,并对其进行解码以便今后使用它们。这对探知学生在寻求帮助后是否能够正确回答问题的可靠性很有帮助。
4.升华人的判断(Distillation for human judgment)——建立可视的机器学习的模式。
5.用模式进行发现(Discovery with models)——使用通过大数据分析开发出的模式进行“元学习”(meta-study)。
实施这些技术就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。研究者们相信这些技术将帮助教育工作者更加有效地指导学生朝着更加个性化的学习进程迈进。
总而言之,通过大数据进行学习分析能够为每一位学生都创设一个量身定做的学习环境和个性化的课程,还能创建一个早期预警系统以便发现开除和辍学等潜在的风险,为学生的多年学习提供一个富有挑战性而非逐渐厌倦的学习计划。因此,有识之士经预言未来的学习将是大数据驱动的新时代。我们应该积极迎接这个新时代,通过大数据来分析学习,进一步改善教学的方式与方法,进一步促进学生学习成绩的提高。
② 如何发展大数据在教育转化中的应用
编者按:大数据时代,数据能否成功运用将深刻影响着我们的生活质量。大数据商用越来越多,回归应用本质才好。 《大数据时代》的作者维克托·迈尔-舍恩伯格在2016中国云计算大会上谈到,直到最近150年的时间里,人类的生活质量和收入才发生了爆炸式的改变,但在这之前的漫长岁月里,人类的生活质量却改进得非常缓慢。主要是因为测量世界的能力和观察世界的方式改变了,基于观察和数据,人类增强了洞察。 互联网是个神奇的大网,大数据开发也是一种模式,你如果真想了解大数据,可以来这里,这个手机的开始数字是一八七中间的是三儿零最后的是一四二五零,按照顺序组合起来就可以找到,我想说的是,除非你想做或者了解这方面的内容,如果只是凑热闹的话,就不要来了。随着观察范围和计算能力扩大,大数据时代会发生什么呢? 大数据会说话维克托说,大数据能够影响人类的能力,将使得人类可以用一个全新的方式来与周围的世界相处,即通过增加数据的数量来获得对世界更深刻的洞察。比如,大家在拍照时,可以通过选择焦点来确定清晰的拍摄对象,这样其它地方就会被拍得模糊。那么问题来了,如果以后想看清模糊的地方,该怎么呢?维克托给大家展示了用大数据照相机拍摄的照片,它将把所有被拍摄进来的数据收集进来,让照片局部可以在模糊和清晰之间自由转换。这样一来,就算当初拍照的时候不知道应该突出哪个部分,事后也不会无法补救。推广到其它日常处理事务时,道理也是一样的。再比如,大数据还可以用来帮助弱势群体。在加拿大,有一个研究团队用大数据帮助早产婴儿。由于发现得太晚,早产婴儿经常因为感染而死亡。有一位博士给这些早产婴儿身上放置传感器后,可以通过测量他们的一系列身体指标来实时测量其体征情况。通过获取的大量数据,医生能够在在婴儿出现症状的24小时前就会提前发现,拯救这些早产儿的性命会容易很多。 大数据将在三大领域突破大数据对已经对营销、电子商务、可预测的飞机维护带来了重大的影响,维克托认为,大数据接下来可能对以下这三个领域产生更大的影响。1、无人驾驶的汽车。汽车非常昂贵,然而在欧洲,人们只有4%的时间在使用汽车,96%的时间把车停在停车场,这是非常不高效的系统。如果未来普及了无人驾驶的汽车,我们就可以过上另一种生活。我们将只需要在手机上点一个按键,车就会自己开过来,把我们带去目的地。这种车就像没有驾驶员的出租车,可以被反复使用,效率和可持续性都得到了提升,也避免了资源浪费。有研究发现,如果自动机动车得到普及,可以减少25%的交通拥堵,减少30%的城市停车场面积。如果北京减少30%的停车场需求,城市生活将大不一样。2、医疗。我们的寿命现在都比较长了,但仍然希望能够更长。现在,我们的医疗水平并不是很好,由于我们忽视了每一个人的个体差异,医生会用通常的方法治疗每一个人。然而,基于大数据,我们可以做精确医疗,通过大数据分析每个人的差异,进行精确的治疗、剂量、用量,让患者更快恢复健康。3、学习。我们要让下一代有能力了解这个世界。然而,因为没有数据,我们难以做到因材施教,所有孩子获得同样的教学,学习同样的书本。低效率的教学就是在浪费脑力、知识和我们解决问题的能力。如果我们用大数据去分析孩子在发展学习能力时遇到的问题,就可以进行个性化的学习,就可以释放知识和理解力的力量,让每一个孩子充分开发潜能。附:当日,记者有幸参加了对维克托先生的采访,以下收录部分记者及同行与维克托先生的问答,以飨读者。 记者:如果把数据比喻为石油,石油是有国界的,那么数据也有国界吗?维克托:这个其实每一个社会、每一个国家都是有数据的,甚至小的团体,我们都是有数据的。现在问题不是大家没有数据,而是这个国家也好,这个组织也好,是不是真正的愿意把这个数据用来做事情,真正用大数据做决策的。大数据涉及储存、分享等,但关键在于把这个大数据真正用起来,真正能够促进经济、促进社会发展。举个例子说,现在所有车都有ABS系统,都配有GPS,如果我们把这两种数据放在一起进行分析,在那些路段上,大部分人都在紧急刹车?为什么会有这种情况出现,是车的问题,路的问题,还是控制的问题,总之,数据交叉稽核,会给我们带来新的启示。记者:我们浏览网页、查询信息,这都属于大数据,怎么看待个人在大数据时代的隐私呢?政府管理部门应该做些什么呢?维克托:这是一个好问题,现在数据隐私保护的方法完全是错误的。现在的做法是询问每一个客户、个人,你同意不同意公开数据,实际上,每个个体并都不知道我的数据会被怎样使用,有一些人对此并不在意,往往会点同意。这是一种错误的隐私保护的做法。对于数据的隐私保护,可以考虑反过来的做法,可以考虑由政府设立一个规则:确定哪些企业为了哪些目的,可以以某种方式和规则来收集数据和使用,例如医疗数据,目的是治疗病人,这样的大数据收集和使用就是合理的,可以不顾及隐私。但是如果利用这些数据作恶,例如帮助保险公司创造保单,那是不合法的。政府应该制定措施做好隐私保护,不把这个问题扔给个人。记者:您写的《大数据时代》,我个人觉得给IT产业吹来一股春风,您已经写了好几本书了,当时写《大数据时代》的时候,您初衷是什么呢?目前是否实现了你当时心目中的设计?维克托:现在就是揭秘大数据时代的时间了。10年之前,我每年都一个非常小型聚会,是一个相当高层的聚会,有微软的高层,有一些政客、经济学家、学术界专家聚在一起,讨论数据社会价值。当时有一个记者,每年据此出一个报告,有关讨论的内容。我感觉一年一年讨论过程中,有一些东西在哪里,可以真的能感觉到的,但是没有一个准确的名字,两年之后,我确定这就是数据价值,所以决定写一本书。一定要看到这个数据深层次的价值,所谓的价值就是我们提到的数据的相关性。这是大数据的根本。大数据应用的过程可以用"旅程"来描述,我们运用数据、事实分析做更好的决策,这些都是基于事实的,不是基于主观的判断。所谓"旅程",意味着反反复复,有前进也会有后退。希望有人用数据,用事实,用大数据方法辅助思考,用到讨论,这都是有意义的。我一直强调这个是一个旅程,在这个旅程中,我们不断往前,但是有时候也要后退一两步。记者:大数据作用是预测,现在能做到准确预测吗?维克托:至少比用其他的东西好的多的。现在大数据不是百分之百准的,但是我们现在要的东西,比我们有的东西更好。记者:未来大数据趋势是什么?维克托:大数据未来的趋势是怎么样让每个人使用大数据,而不只是用专业的大数据公司。透露一下,也许这是未来新书的内容。
③ 大数据在教育行业是如何运用的
1、重心变化在大数据时代,教师的工作不再简单的是知识传授,而是将知识的输出形式变得多样化,关注学生的个性特征。将统一形式、集体化的教学转变为信息技术支持下的教学。也就是说在了解学生的认知能力和知识结构的前提下,将知识进行迁移、整合并进行传授。2、精准满足需求这里所说的精准满足用户需求,就是说要将教育信息及时的传送给有需求的用户。譬如一个学生近期要进行英语培训,那么有关英语培训的信息会及时的传送给该学生。根据用户的学习习惯、生活习惯会有一个智能的数据匹配,这样一来,该用户所收到的资讯和信息也正是自己所需求的。3、精准进行广告投放在大数据时代,用户的的行为习惯很容易通过一些数据分析推测出来。一些教育及培训机构可以通过数据分析,将用户进行锁定进行广告的投放。譬如用户打开手机的频次以及用户在某一时间段的习惯性行为。通过大数据可以将自己的广告精准投放给需求的用户。除此之外,互联网和大数据的发展,还给我们带来发展个性化的机会,可以说在教育学上是有非常大的意义的。那些所谓的学习不好的学生,如果他们在某些方面有一定的特长,同样发挥其特长,不再是标准化的教育。大数据技术可以在教育平台上跟踪和关注老师和学生的教学、学习过程,记录老师和学生的课堂表现以及课下行为的数字化痕迹,通过在教育活动中点滴微观行为的捕捉,为教育管理机构、学校、老师和家长提供最直接、客观、准确的教育结果评价等。可以说,大数据在教育领域的运用是当代教育发展的必然趋势。
④ 如何用大数据来进行教学
用大数据进行教学还是教学大数据?这两个期不一样的,用大数据进行教学是指用大数据的规律和能力对业务进行赋能,利用别人的经验进行高效的学习,这就是大数据的魅力所在。
⑤ “人工智能”,“大数据”+教育如何驱动教育的未来
近日,由论答公司主办的教育大数据研讨会在北京举行,讨论会主题为“大数据+教育,有哪些可能性?”。本次研讨会主要关注数据在教育领域的应用,具体包括自适应学习、学习数据分析和教育数据挖掘。来自宾夕法尼亚大学、人民大学、华中师范大学的专家和企业界代表,共同探讨了教育大数据和自适应学习领域的技术趋势和产业机会Ryan Baker是国际教育数据挖掘协会(International Ecational Data Mining Society)的创始人、《教育数据挖掘》杂志(Journal Ecational Data Mining)主编,在各类期刊和会议发表了260余篇学术论文,先后主持了美国科学基金会(National Science Foundation)、盖茨基金会(Gates Foundation)等研究基金的多项重大项目,累计获得研究经费超过1600万美元。他也在哥伦比亚大学教育学院和爱丁堡大学同时担任教职,他在Coursera和edX上开设的“Big Data in Ecation(教育大数据)”课程,有来自100多个国家和地区的学生注册。研讨会现场,Ryan Baker通过远程视频,分享了他对教育大数据的体验和应用。据他介绍,目前在教育大数据领域主要有四大研究组织,分别研究人工智能与教育、教育数据挖掘、学习数据分析和大规模学习。Ryan Baker表示,在教育领域广泛应用大数据的时代正在到来。教育数据挖掘有很多的应用方向,包括:预测学生是会辍学,还是会成功完成学业;自动检测学生的学习投入程度、情感、学习策略,以更好地达到个性化;给教师和其他相关人员提供更好的报告;教育科学的基础研究和发现。他认为,个性化教育至少要做到三件事情:1、确定学生的有关数据;2、了解对于学生的学习来说什么是真正重要的;3、有针对性地为学生提供合适的教学。而通过教育数据挖掘,我们可以推断很多事情:学生的元认知和求助。比如,这个学生有多自信?当他需要帮助时,有没有在寻求帮助?他有没有在给自己解释问题,有没有思考这个答案是正确的还是错误的?最重要的,当他面临挑战时,能否坚持下去?没有投入学习的行为。比如,“玩弄”系统,为了找到正确的答案,有的学生会试各种不同的答案,从“1”试到“38”。粗心,本身会做,但是不用心,最后给出的答案是错的。有些孩子会做非常难以解释的行为,比如不用方程符号,而是画了一个笑脸。学生情感。Baker的研究团队和其他研究团队,已经创造了研究模型,可以根据数据推断,学生是否感到厌倦、沮丧、困惑、好奇、兴奋、快乐,是否投入,等等。长期的学习结果。比如,学生能够记住刚才他学的东西吗?学生准备好学习下一个主题、下一个知识没有?中学生能上大学吗?他会从大学毕业还是辍学?Ryan Baker表示,要获得这样的推断,只需要学生与系统交互的数据,不需要学生戴上头盔检测器。目前,这些模型已经开始大规模应用于自适应学习,应用于几十万的美国学生。Ryan Baker列举了一些自适应学习系统的案例。Knewton通过系统决定学生下一个要学习的问题是什么,已在全球的多个领域多个学科中运用。ALEKS-ALEKS用的是先行知识结构和知识点模型,来选择最适合学生的学习材料。比如,一个学生在学习上出现了问题,系统能够检测出来,是以前学的知识点出了问题,然后让学生回到以前的知识点上去学习。ALEKS系统应用于美国高中、大学的数学、科学学科。Cognitive Tutor系统能自动检测学生的知识,直到学生掌握为止。比如,系统不会让学生学习下一步的知识,直到他展示出他已经学好了他现在正在学习的知识。系统能够给学校提供数据报告,学校根据报告能够更好地让学生投入到学习中去。每年大约被50万的美国初高中生用于数学学习。论答论答公司的系统与ALEKS的系统有些类似,也是用先行结构和知识点模型,选择合适的学习材料。同时也是自动检测学生的知识状态直到学生掌握为止。应用领域目前包括数学和英语,完全针对中国学生开发。Reasoning Mind用各种自动检测的模型来检测老师的教学是否有效。通过数据生成报告给每个地区的教学管理员,让他们找到方法帮助老师提高教学。主要是用于美国的小学数学。Duolingo自动检测学生记忆,来决定什么时候回顾已经学过的知识。在全世界范围内应用于外语词汇的学习。其他的像Civitas,Course Signals,Zogotech都是地区供应商,运用风险预测模型提供行动信息预测。它们会对学生做出预测,可能学不好、会失败,把报告提供给老师。已在世界范围内的大学应用。Ryan Baker指出,在这些系统中,有足够的证据证明,至少以下两个系统是非常好的。1、胡祥恩教授在美国做了大量实证研究,证明ALEKS系统对于帮助学生学习是有效的。他的研究证明,ALEKS系统对于不同人群的学生是同样有效的;特别值得提出的是,ALEKS可以帮助少数人群群体提高学习成绩。2、Ryan Baker本人领导的研究团队与论答公司合作的研究表明,学生通过论答系统学习,比通过传统的在线学习系统学习,效果更好。他们在中国3个不同的地区做的3次实证研究,都证明了论答系统的有效性。Ryan Baker分析了教育大数据算法模型的潜在发展方向。他认为,这些模型的长期潜力是,通过学生的知识和学习模型来确认,学生什么时候需要更多的支持:首先是“mastery learning”,学生在掌握一个知识前,不会让他去学习下一个知识。当学生需要支持的时候,自动介入;同时告诉老师和父母,这个学生什么时候需要支持。通过学习投入程度模型判断,学生什么时候开始变得厌倦、沮丧了,并调整学习活动,让厌倦的学生不再厌倦,让沮丧的学生的学习变得更容易一些。学习投入程度模型还可以检测,在线学习中,什么样的学习活动,能让学生更容易地投入进去,并最终发现,什么样的学习活动对学生更好、对什么样的学生更好。这样的模型也能告诉老师和父母,学生什么时候开始变得不再投入学习了。还可以运用学习模型确认,学生什么时候没有真正学会,需要更多支持。最后,Ryan Baker指出,下一步的目标是优化之前已经验证的经验和方法,然后把它们运用到系统中,最终让中国和世界上的数十亿学生受益。讨论:“因材施教”的千年理想该如何照进现实?王枫博士,论答公司(Learnta Inc.)创始人兼CEO胡飞芳博士,美国乔治华盛顿大学(George Washington University)统计学终身教授,中国人民大学统计与大数据研究院的教授胡祥恩博士,美国孟菲斯大学(University of Memphis)心理系、计算机科学系、计算机工程系终身教授,华中师范大学心理学院院长马镇筠博士,论答公司联合创始人兼首席数据科学家辛涛博士,北京师范大学中国基础教育质量监测协同创新中心常务副主任、博士生导师,兼任国家督学、教育部基础教育课程教材专家工作委员会委员、中国教育学会学术委员会委员。技术发展到今天,“因材施教”如何实现?王枫:因材施教,我首先到的是,每位学生学习的内容都不一样。如果有新的技术或者系统,系统应该像一个好老师一样,不会头疼医头脚疼医脚。比如说,一元二次方程做错了,好老师不会简单说一元二次方程做错了,你继续再做十道一元二次方程的题目,这其实是很差的老师,他没有真正去全面评判学生,到底是哪些掌握好、哪些掌握不好。一个好的老师可能会说,我全面地看了你整个学习,可能你的问题不是出在一元二次方程上面,老师看了你做的题目,一元一次方程没有掌握好、因式分解也没有掌握好,你继续做一元二次方程是浪费时间。这就是从系统角度来说,系统做到了根据每个学生最基础的先行知识点的结构,给你提供最适合你当前学习的知识点,题目也好、视频也好、还有其他各种各样的学习内容。胡飞芳:因材施教是我们教育的理想状态。孔子很早提出因材施教,在他当时的历史环境里面,因材施教可能更多是个体性的,因为那时学生少、老师也少,因材施教相对比较容易做到。随着历史的发展,我们有更多的人需要教育时,我们做的一件事情是什么呢?就是做了一个标准化。标准化做的是什么?课堂教育。课堂教育从某种意义上来讲是标准化。现在这个历史阶段,教育大数据可能真正要做到的就是因材施教,自适应学习本身想做的也是这个。胡祥恩:因材施教事实上在学习理论里有两个:一个是outerloop“学什么”,一个是innerloop“怎么学”。用技术来细化因材施教是教育产业走向成熟的一个标志。但是这个路非常非常难,因为“怎么学”那个层次非常非常难。马镇筠:“因材”代表认识到学生的个体化差异,“施教”指进行差异化教学,这是根本思想。但如果考虑到时代背景,孔夫子时代专注的是学生的职业发展方向,也就是说,把适合当政治家的培养成政治家,把适合当学者的培养成学者。现在再提因材施教,我们其实能做得更多、更精细化。比如,“因材”,对“材”的分类不仅是职业方向,还会考虑到学生的学习状态、学习目标、潜在能力、兴趣偏好等。而且,传统意义上的因材施教考虑的是学生个体间的差异,没有重视学生本身状态是在发生变化的,学生在不断学习,状态甚至兴趣各方面都可能发生变化。但这些是自适应学习能够做到,甚至比传统的因材施教做得更好的地方。再说到“施教”,现在我们能做的几件事,包括学习路径推荐,给不同的学生匹配他最合适的学习内容,这种非常精细化的层面,我们已经有了一定的技术积累。怎么判断一个产品做到了真正的自适应?马镇筠:大多数产品的学习过程可以分为测、学、练,可以从这三个环节去看这个产品做到什么程度。测,各种学习机构都有测评。但是国内只有论答团队第一个做出来能够在几十道题内,精准判断你一百个知识点,哪21个没掌握,哪79个掌握了。市场上大部分竞品,只会告诉你,知识点掌握率或者分数,79分或者知识掌握率达到79%;或者一些其他维度的总结,比如逻辑思维能力比较强、阅读的磨炼技巧比较好、学习动力哪方面稀缺。他们做了降维,本来很复杂的学习状态这样说出来,相对比较容易实现。但如果要做到具体告诉你,哪些知识点掌握、哪些知识点没掌握,这个难度就高很多了。关于学习路径推荐的话,很多题库类的软件,知识点学完之后,会给一些题目推荐,但真正实现路径推荐的很少很少。路径推荐也是很核心的,有20个知识点没掌握,先学哪个知识点,后学哪个知识点,学习顺序是非常关键的,必须遵循循序渐进的原则,哪些知识点是前提知识点,哪些知识点是后续知识点,随机给你知识点去学习的话不能起到最好效果。真正到了练或学的环节,推荐什么样的视频,先推视频还是先推文字讲义,推简单题、中等难度题还是复杂题目,都需要根据学生实际情况来决定。刚才只是举了几个例子,具体涉及到背后的算法、整个系统跟学习内容的结合以及整个教学流程的实现,中间很多环节必须要打通,形成一个闭环,才能对最终的结果负责。辛涛:我的研究领域是教育和心理学的测量和评价。我个人的学术观察,基本上在现代这领域是两个类型。一个是心理测量领域,有一套成熟的方法,包括早期的IRT(Item Response Theory)和现在的ADT。另外一个是人工智能检测。心理测量系统,是一小群人在做;人工智能化是大的方向,现在是显学,给大家提供了明显的可能性。重要的是,那些背后的算法,能够在企业里真正实现出来。现在可能很多算法已经在那儿了,大体上路径是通的。自适应学习基本上是把学习和评价联动起来了。因为,要自适应学习,必须有一个系统随时看到学生学到什么程度,这个完全是评价。但是,评价完了之后有一个新的呈现。这一块现在已经有一些很成熟的一些东西了,但不是一时半时可以说得特别具体的。我做教育的测量和心理测量,人工智能那块我不熟。但是,从教育测量角度来说,在自适应学习和新技术结合之前,很大一块还是自适应考试,CAT(computer adaptive test)。系列化产生一个CAT变成了一个自适应学习的过程。总的来说,使用最简单、最机械化的方法,连续的CAT实际上是可以破解一个学习过程的。测评本身经历了好几个阶段,通常用三个应用介词表示。accessment to learning and teaching;现在国家倡导的,accessment for learning and teaching,测评要对学习和教学有帮助;跟信息化结合,accessment as learning and teaching,它是学习提供的完全融合的一个环节。王枫:什么样的自适应学习系统才是真正的高级自适应学习系统?在中国的落地到底是怎么样才能真正落地?我在马博士的基础上想补充一点。自适应系统如果一定要分级,也可以简单分一下。一种最基础的系统是基于规则的,比如说埋点。一个学生做10道一元二次方程题目,我预先埋好了,你做错了,立马给你推五道一元一次方程题目、五道因式分解题目。这个是埋点埋好了,这是规则,预先由老师或公式设置好了。但这个规则有用性是非常有限的,因为每个学生不一样,A学生是因为一元一次方程不会,B学生可能是因式分解不会,C学生可能连小学的乘法快速运算都不会,这个没法预先直接埋点准备好。所以自适应系统真正到了更高级一点的话,一定是真正通过大数据、根据算法模型来分析学生的学习数据,匹配下一步应该学什么。在中国,自适应学习有效应用于教学有三个前提条件。做到这三点,自适应学习在中国的教育里面前途无限。好的产品。必须要有针对中国本土化的自适应学习产品,把它开发出来。像ALEKS系统的确算法不错,但里面连一套国内的高考题都没有,家长不会让小孩子用这样的系统,因为直接影响应试目标。真正本土化开发的话,没有一成不变的算法,世界上最好算法就是没有开发出来的。教育非常复杂,每个学科不一样。比如数学后台有强大的关系,先行后续关系;英语没达到数学这么强的相关性,但算法是一样可以应用的。好的学生、家长、老师。有了好的产品,首先学生应该真正投入进去学习。像Ryan Baker教授讲的,学生如果随便学一下,再好的系统也没用。第二,家长得督促孩子学习。第三,老师非常重要。老师应该做有价值的事情,比如给学生做个性化的辅导答疑,给学生针对性的讲解,组织学习活动小组,鼓励学生发挥创造能力,领导能力的培养。学校以点带面。学生大部分时间都在学校里面学习。如果学校里最基本的、有效的在线教学产品都不应用的话,其实是有问题的。但是改变绝对不是简单的行政命令可以解决的。一个好的产品,一定是从点到面,逐步推广。自适应学习,更适合有明确目的的学习,像应试教育这块可以做得更好。所以学校可以应用进去。胡祥恩:我觉得大家做自适应也好、因材施教也好,比较好的例子大家可以看一看。教育这个领域有多大,自适应概念就该有多宽。所以说,实验室里面有很多小的做得非常非常好的东西,只是没有到市场上面去,有很多非常非常巧妙的算法、一些东西。你会发现很多欧洲的、美国的实验室做的system,我每次看了都有种,自己是坐井观天的感觉。怎么看待人工智能在教育中的应用?胡飞芳:AlphaGo跟master,谷歌做了一个非常好的广告,人工智能在某些方面可以做得非常好。但是,我现在给你们讲另外一个谷歌自己不会去说的例子,但这也是事实。2008年、2009年的时候,谷歌推出一个免费产品,用各种搜集到的数据,预测美国的流感发展趋势。开始时很成功,预测跟实际发生的情况很相似。但到2015年,他自动撤回去了,不再提供预测。因为在2012跟2013年预测的时候,预测结果跟实际情况相差非常远。这说明像这种不确定性的问题,人工智能还有非常大的局限性。一旦有不确定的数据,就有噪音。数据量很大时,大数据可能产生大噪音。怎样使噪音下降?2015年一个哈佛教授的研究团队在谷歌的基础上,用谷歌的数据去做同样的预测。他用了什么呢?就是用了模型,实际上模型在很多时候降噪是很有用的,用模型去预测,而不完全是人工智能的方式去预测。结果,他做出来的预测基本都比较准。人工智能相对比较成功的,是比较确定的问题,所谓的确定是不管有多少种可能性,还是一个确定的东西。而流感很多时候是完全不确定的因素。教育其实很多时候也是不确定的。同样一个人,现在让他回答这个问题,他可能思路清楚地回答出来;过了一个小时后,即使是同样类型的问题,按道理他应该回答出来,结果他回答不出来。这是说,实际上有很多因素在干扰的时候,人工智能的功能是不是会减少一点。把模型跟人工智能加在一起,会弥补人工智能在某些方面的弱点,这样会更好。怎样促进商界和学界的交流,更好地把学界已经有的一些成果,运用到市场上来?胡祥恩:教育产业应该是一个最大的产业,教育产业事实上是一个知识产业链。到目前为止,很多人认为自己要做一整套系统而在美国汽车业,最赚钱的是供应商,是做轮胎、做玻璃的。一旦标准化之后,一个人如果螺丝钉生产得最好,他就能够养活几家人、几代人。到目前为止,美国推的就是教育标准化,教育内容的标准化、教育技术的标准化。比如说97年的时候,就说怎么样把内容标准化,你做的东西我可以用。我只是做整个教育知识产业链里面一个小块,做得很好。教育整个的产业链,有可能发挥特别特别技巧的那些小的公司,就能够在这个产业链里面生存、可以做得很好。第一个是要标准化,第二个要理解整个教育是一个产业链。
⑥ 如何利用大数据分析的手段促进教学
一、大数据的概念:大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。 二、大数据的五个基本方面 1、可视化分析:大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。 2、数据挖掘算法:大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现出数据本身具备的特点,也正是因为这些被全世界统计学家所公认的各种统计方法(可以称之为真理)才能深入数据内部,挖掘出公认的价值。另外一个方面也是因为有这些数据挖掘的算法才能更快速的处理大数据,如果一个算法得花上好几年才能得出结论,那大数据的价值也就无从说起了。 3、预测性分析能力大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。世界杯期间微软和网络、阿里云等大数据公司就进行了准确的预测那支球队的输赢,几乎每次都能成功。 4、语义引擎大数据分析广泛应用于网络数据挖掘,可从用户的搜索关键词、标签关键词、或其他输入语义,分析,判断用户需求,从而实现更好的用户体验和广告匹配。 5、数据质量和数据管理:大数据分析离不开数据质量和数据管理,高质量的数据和有效的数据管理,
⑦ 如何通过抓取教育大数据来深化课堂教学改革
现代信息技术的发展为大数据的收集和分析提供了无限的可能,大数据时代的这一趋势也对教育产生了巨大的影响:一方面,在科技理性的指导下,通过多维度收集学生行为的数据并进行模型建构,可以对学生的学习行为进行预测;另一方面,大数据时代的人文主义转向使人们更关注教学活动的适应性,教育大数据的挖掘和利用可以更好地实现适应个人需求的定制化教学。
国际数据公司(IDC)认为大数据时代数据有4大特点——数据的规模大、价值大、数据流转速度快以及数据类型多。大数据的挖掘和利用对教育——特别是课堂教学——产生着深远的影响。学习科学家索耶认为:越来越多的学习将经过计算机中介发生, 并产生越来越多的数据,我们有必要运用这些数据分析什麼时候有效的学习正在发生。所以数据挖掘可以用於探究行为与学习之间的关系,如学习者的个体差异与学习行为之间有何关系,不同行为又会导致何种不同的学习结果等。2012年美国发布《通过教育数据挖掘和学习分析促进教与学》(Enhancing Teaching and Learning through Ecational Data Miningand Learning Analytics)提出大数据时代教育数据的特点:具有层级性、时序性和情境性,其中数据的层级性指,既收集教师层面的数据也收集学生层面的数据,既收集课堂数据也收集活动数据,为後期模型的建立提供了多维度的资源;数据的时序性是指,数据是实时的、连续的,为材料的前沿性提供了保障;而数据的情境性是指,数据是基於真实情境脉的,保证了模型的信度。
大数据技术能够促进以学生为本的学习,数据不仅仅是科技理性指导下收集数据和拟合成模型,并针对学生的群体行为做出预测判断,还可能在固有模型的基础上,通过诊断学生在课堂中的行为表现,对固有模型进行修改,使课程内容更加适合学生的长尾需求,实现个性化教学。大数据的利用可以支持对教育活动行为的建模预测,还可能支持教育实践中的适应性教学。前者是後者的基础,後者是前者的深化。
建模与预测导向的大数据应用
大数据时代数据促进教育变革的方法之一是收集和分析处理数据,并进行预测。现如今,由於数据记录、存储与运算的便捷性,海量的、多层次的数据可以便捷地加以收集,由随机抽样带来的误差因此减小,建模和预测可以基於全数据和真实数据,因而就更为精确。大数据时代通过探求海量数据的相关关系获得盈利的最成功的案例是亚马逊的市场营销,亚马逊收集读者网上查阅行为和购买行为数据,建立读者偏爱阅读模型,预测读者购买的群体行为,实现书籍的推荐。近几年,教育研究的对象逐渐关注学生的学习行为,其背後是一种学习观的转变,学习被视为一种识知的过程(knowing about),识知是一个活动,而不是将知识作为一个物品加以传递。识知总是境脉化的,而不是抽象的和脱离於具体情境的。识知是在个体与环境的互动中交互建构的,而不是客观准确的,也不是主观创造的。所以,学生的行为活动数据被认为是可以反映学生在学习过程这一情境化的动态变化进程中的情况。海量、多层次、连续的行为数据在收集後被拟合成模型,实现预测,如学习管理系统(LMS)的运用。然而,由於建模和预测依赖的基本原理为数理统计,其预判对象主要是学生的群体行为。
1.案例分析
学习管理系统(Learning Manage System)简称LMS,是基於网络的管理系统平台,用於监控学生学习活动行为,识别和预测学困生(student at-risk),并为其提供相应的帮助。大多数LMS包括5个部分:有和课程相关的学习资料、用於确保学生提交作业与完成测试的评价工具、用於沟通的交流工具(如邮件、聊天室等)、用於确保教师记录和存储学生的学习活动并发布活动截止日期的课程管理工具、用於帮助学生学习回顾和跟踪学习进程的学习管理工具。在高校大量使用的BB(Blackboard)平台就是一个常见的学习管理系统。系统记录了学生参与选修的网上课程的种类、在线时长、阅读和浏览的文章数量,反映学习者的学习行为。2008年,Leah P.Macfadyen和Shane Dawson教授在加拿大不列颠哥伦比亚大学通过分析5个本科班级使用BB平台选修生物课的数据,建立了预测模型。平台记录了学生课程材料的使用情况、参与学业交流情况和完成作业提交和考试情况。大数据时代教育数据记录的层级性在这裏充分显现,课程材料的使用包括记录在线时长、邮件的阅读时间、邮件的发送时间、讨论信息的阅读时间等。参与学业交流记录了发布新讨论的时间、回复讨论的时间、使用搜索工具所花的时间、访问个人信息的时间、文件的浏览时间、浏览谁同时在线的时间、浏览网页连结的时间等等。评价模块记录了评价的阅读时长和提交评价的时间等。通过应用统计工具描述散点图,发现了在LMS记录下学生在线时长和学业表现呈相关关系。在进行多元回归时,研究者发现,学业成就处在後四分之一的学生在线时间略长於平均时间,而学业成就处於前四分之一的学生的在线学习时间低於平均水平。紧接着,研究人员为了作出预测,利用逻辑斯特回归生成了一个预测模型,通过收集学生的新的行为数据,预测学生是否处於真正参与了学习活动,并得出如下结论:讨论举行的次数、邮件信息发送量和测评的完成情况这三个维度构成的模型可以预测学生的学业水平情况。
大数据时代,通过探求学生行为与学业水平之间的相关关系,建立模型,实现预测,能够对课堂教学产生重要影响。然而,数据建模过程中,为了保证模型的效度与信度,极端个别数据被处理,使模型只能实现群体行为的预测,不能针对学习者个体实现定制化和个性化。
2.建模与预测的不足
数据建模与预测的背後充分体现了实证主义的思想和方法。19世纪上半叶,以孔德为代表的社会学家提出了实证主义的基本信条:利用观察、分类,探求彼此的关系,得到科学定律。实证主义的哲学思潮到20世纪60年代,演变成一种科技理性,实践知识逐渐染上了工具性的色彩,专业活动存在於工具性的解决问题之中,所有的专业活动都被视为厘定目标、套用已知的方法解决问题的过程。这一期间,大量的学科被系统地整合发展,甚至包括教育学和社会学这样的「软科学」。用证据解决未知的问题,用数据预测未来一时成为潮流。
学生活动行为数据的建模尤其侧重体验实证主义的思想,模型注重成功教学行为的共性,忽视教师与学生群体的独特性需求时,科技理性的主导有可能使课堂教学被视为独立於真实境脉的模块,只要教学行为取得成功,就会被数据抽象化,形成模型,对学生群体行为产生预测。科技理性有赖於人们认同的共有目标,教学实践目标的厘定极其复杂,包含巨大的不确定性和独特性,甚至,由於社会角色的不同,还会带来价值冲突。一个稳定的、为所有人所认同的目标不复存在,依据科技理性精神和方法推理预测的行为模式并不可能满足每一个人的需求,教育变革在大数据时代下出现新的取向。
从数据模型到支持适应性学习
在数据建模的基础上实现教学的适应性是大数据时代促进教育变革的另一成果。数据建模及行为预测依旧属於科技理性指导下的行为模式,可能会造成忽视学生个性需求的现象,而个性化需求正是知识社会的重要特徵,个性化的教育也受到教育研究者、政策制定者和教育实践者越来越多的关注。教育系统设计专家赖格卢斯认为,教育投入没有达到效果的一个很重要的原因是忽视了社会的转型。「社会已经从工业社会步入了资讯时代,劳动力市场对人才的要求不再是工业时代在流水线上操作的工人,而是具有创新性思维、决断力强的知识性人才。」教学面临从产生清一色的劳工转向产生有判断力和适应性能力的人群。2010年,OECD的报告《The Nature Of Learning》中指出,适应性能力(adaptive competence)是21世纪核心竞争力,包括在真实的境脉中灵活并有创造力地使用有意义的知识和技能。吴刚在《大数据时代的个性化教育:策略与实践》中提出了个性化教育的必要性和必然性,指出「只有利用信息技术所提供的强大支持,才有可能真正实现个性化学习」。大数据时代的来临,正是个性化教育发展的一个良好契机。2012年,美国颁布了《通过教育数据挖掘和学习分析促进教与学》,提出大数据时代,通过收集在线学习数据,对数据进行分类和探寻数据之间关联的方式挖掘数据,形成数据模型。通过学生行为和模型的互动,形成适应性学习系统。概言之,我们可以以对行为数据的充分利用为基础,改变教学的内容和进度,构建适应性评价和教学系统,充分实现教育的定制化,满足学生的长尾需求。
1.案例分析:适应性教学系统又称适应性学习系统,(Adaptive Learning Support System),简称ALSS系统,强调基於资源的主动学习,认为学习不是知识的传递,而是学习者的自我建构。自上世纪90年代以来,研究者开发了不少适应性学习系统,如1998年De Bra开发的AHA系统,2003年,Brandsford和Smith开发的针对任务型学习的MLtutor系统,以及近几年颇受关注的翻转课堂(Flipped Classroom Model)简称FCM系统。
内容传递模块:传递相关知识与信息支持学生的学习。
学习者数据库:存储学生在参与教学活动中的相关行为。
预测模块:包括学生信息和学生行为数据,跟踪学生的学习,并做出预判。
显示模块:为学生生成行为报告。
自适应模块:根据学生行为生成的报告,反馈到预置模型,为模型做出相应的改变,使之更符合学生。
干预模块:使教师、系统管理者和领导可以在系统运行时实施人为干涉。
学习者学习相关学科内容时,学习行为被记录跟踪下来,学生的学习行为数据被传送到後台,记录在学习者数据库内,作用於预测模块。预测模块通过改变内容传递模块,再次作用於学习者。在整个过程中,教师、教学管理者起干涉作用。
适应性学习系统是一个交互的动态系统,系统往往会提供给学生一些学习行为建议。奥地利针对学生的问题解决的过程设计了一个适应性学习系统。适应性学习系统的第一步是教育数据挖掘(ecational data mining),简称EDM。数据挖掘的过程包括数据收集、数据预处理、应用数据的挖掘和诠释评价发展结果。Moodle提出了CMS数据挖掘系统(Course Management System)。研究者先使用原始数据进行建模,第一步是原始数据的收集,原始数据大约包含2007年73名用户产生的28000活动例子,2008年97名用户产生的265000份解决问题的案例和2009年45名用户产生的115000个活动案例。除了记录学生解答问题时产生的数据,原始数据还收集了学生的信息、问题的信息和解决问题的步骤;在对数据进行分类後,归纳出问题解决的类型,利用很擅长拟合连续数据的Markvo Models(MMs)的一个子模型DMMs拟合了如上的连续性数据,通过添加判断学生学习行为的结果模型和一系列监控和调节模块,构成了整个面向问题解决的适应性系统。当学生使用这个模型时,模型会根据学生的行为数据为学生提供他们所偏爱的解决问题的过程与方法。
除了适应性教学系统,还有适应性评测系统。LON-CAPA(Learning Online Network with Computer-Assisted Personalized Approach)是一个计算机辅助的个性化网络学习测评平台,平台不提供课程设计和课程目标,而是一个教学工具。CAPA通过後台记录学生的基本资料,学生参与的互动交流、学业情况,针对学业课程中的疑难点,提供个性化的考试资源。
2.适应性转向的意义
在大数据时代,科技理性指导下的模型预判在面对结构不良的问题时显得应对能力不足。科技理性指导下的数据建模忽视学习的真实境脉,只能支持群体行为的预判,模型的推广可能会使人们忽视其实践成功背後的个体经验与具体情境,从而导致科技理性与哲学思辨对抗。然而,完全依靠哲学思辨和经验进行教学不仅不利於教育学科系统理论性的发展,也不利於课堂实践的管理与教师的培训。唐纳德·A.舍恩提出了一种适应性思维模式。他指出:「如果科技理性的模式在面对『多样』的情境时,是无法胜任、不完整的,甚至更遭的话,那麼,让我们重新寻找替代的、较符合实践的、富有艺术性及直觉性的实践认识。」适应性学习是在系统理论知识的指导下,针对个体差异,使学习内容和活动高度个性化的学习方式。
适应性平衡了理性与经验的两难,英国学者Hargreaves(1996)首次提出基於证据的教育研究向医疗诊断学靠拢。临床诊断学和教育的相似之处在於,他们都要面对变动不居、极其复杂的环境,在这样一个结构不良的系统中,充分意识到客体(患者或者学生)的独特性与共性,利用系统的专业知识解决问题。
Ralf St. Clair教授在参考医学临床实践研究的三要素後提出基於证据的教育研究的三要素——研究的证据、教育工作者的经验、学习者的环境与特点。其中,行为预测关注的是研究的证据,而适应性学习系统的建设则关注的是教育工作者的经验和学习者的环境与特点。
从预测行为到支持适应性教学的转向,是一种人文主义的转向,教育研究的重点从关注研究的证据走向关注教育工作者的经验与学习环境特点,关注以证据支持个性化学习的实践变革。证据不再是其在科技理性时代所处的指导决策的角色,而是被视作一种资源,教育工作者在大量的基於证据的课堂教学决策中找寻最适合自己特点和学生特点的方式,推进课堂教学流程。也就是说,大数据的更重要价值在於支持适应性学习,满足个性化学习和个性化发展的时代需要。数据的预测功能依赖於大数据收集数据的全面性与处理数据的便捷性,根据统计学原理对群体行为做出预测,一定程度上弱化了个体特徵和具体情境。其主要指向行为预判。而适应性是在模型与客体的交互作用上改变模型,如图3所示,数据的适应性运转模型比预测模型多了一个循环(loop until)系统,使其更加契合个人需求,其主要指向实践改进。预测是支持个性化学习的基础,而支持个性化学习是预测功能的深化和转化——从整体人群到个体学习者、从理论模型到实践策略的转化。
分析与启示
大数据时代由於数据量大,数据收集与携带便捷,使海量学生行为数据被挖掘、收集,通过数据建模对学习者行为的分析变得比前大数据时代更为全面和可靠。数据时代在数据的挖掘和预测上固然潜力十足,但是大数据时代更多的价值是满足学习者的适应性长尾需求,在预测行为的基础上,修改教学模式,使之个性化与定制化。从数据建模走向支持适应性教学,支持对象从群体转向了个人,对教育活动的影响从对行为的认识转向了教育活动的实践,从科技理性指导下的去境脉转向了基於真实情境的教学活动。
走向适应性,不仅改变人类行为方式,更重要的是改变了认知方式。前大数据时代人们在科技理性的指导下完全被数据证据左右(driven by the data),教师和学生、教育决策者和学校形成传统社会契约关系,当事人把自己百分之百地交给专业工作人员,而专业工作人员遵守契约,对当事人全心全意地负责,从而使专业工作人员享受至高无上的垄断性地位。大数据时代,教师不再是知识的控制者,他通过参与学生的学习活动,根据学生的先拥知识和认知特点、个性需求,不断地调整教学步骤、教学进度和难度。学生不用完全将自己有如病人交付给医生一般完全托付给教师。在学习的过程中,通过与教师的互动交流,在教师的协助下,成为自己学习的主体,控制并对自己的学习负责。由於教师精力有限,大数据时代下网络计算机辅助学习系统可以为教师和学生提供辅助指导的机会。
尽管如此,一方面,我们要拥抱大数据给我们带来的便捷的生活和高质量的教育,另一方面,我们需要保持警惕和防止因果关系和相关关系的误用,并且维护数据安全。
在推理方面,教育工作者需要警惕将相关关系和因果关系误用,以Leah P.Macfadyen教授的前述案例为例,BB平台在线时间的长短和学生的学业成就有相关关系,而非因果关系,成绩优异的学生在线时间低於平均在线时间,但不能说低於平均在线时间的学习导致学生成绩优异而要求学生减少在线学习时间。
此外,在信息安全方面,学生和教师的大量信息被收集和使用,在使用的过程中,必须制定相关私隐保护法,保证信息的安全,警惕数据滥用。学生的行为数据也不可以作为教师教学评优的依据,让大数据真正成为支持教学变革、提升教学效能、促进学生发展的手段,而不是控制教师和学生的工具。
⑧ 大数据在教育中应用领域有哪些
有针对教师管理信息化的。一是建立教师管理信息化体系。以教师系统为支撑,逐步实现教师系统与相关教育管理服务平台的互通、衔接,建立健全覆盖各级教育行政部门、各级各类学校及广大教师的互联互通、安全可靠的教师管理信息化体系,为加快推进教师治理体系和治理能力现代化奠定坚实基础。二是形成教师队伍大数据。依托教师系统,实现各级各类教师信息的“伴随式收集”,为每位教师建立电子档案,建立统一高效、互联互通、安全可靠的全国教师基础信息库。同时,高效采集、有效整合教师系统及相关教育管理服务平台生成的教师信息,形成教师队伍大数据。三是优化教师工作决策。将教师队伍大数据作为教师工作决策的基础支撑和重要依据。对大数据进行多角度、多层面、多方位的关联分析、融合利用,评价教师队伍发展状况、找准教师队伍发展问题、研判教师队伍发展趋势、确定教师队伍发展重点,提升教师工作决策的科学性、针对性和有效性。四是提升教师队伍治理水平。积极推进教师系统及相关教育管理服务平台与教师工作的深度融合,逐步推进教师管理方式重构、教师管理流程再造,实现教师管理过程精细化、治理工作精准化,优化教师管理核心工作,不断提升教师管理服务水平。 有专门的文章,如果有需要,可以留下信箱。