5月13日,OpenAI在“春季更新”线上发布会上推出了GPT-4的升级款模型GPT-4o。更新后的GPT-4o反应迅速,能理解复杂场景下的非文本信息,且能流利对话。之后,可汗学院创始人萨尔·可汗(Sal Khan)用最新版GPT-4o辅导儿子做数学作业的视频冲上热搜。视频中,GPT-4o引导孩子渐进式地理解和拆解问题,最终孩子自己得到了答案。
这段视频引起轰动的原因是,GPT-4o对学习者的层层引导和鼓励,让它看起来像一个情绪稳定的家庭教师,这不免激发了大众对于ChatGPT是否会颠覆教育模式的热议。事实上,在GPT-4o之前,ChatGPT在教学中的运用已经逐渐广泛起来。
高等教育规划平台Intelligent.com曾在2023年5月针对3017名高中生和大学生,以及3234名低年级学生家长做了调查。数据显示,在使用ChatGPT辅助学习的学生中,90%的人更喜欢使用ChatGPT,而不是跟随辅导老师;此外95%的学生表示自从使用ChatGPT学习以来,他们的成绩有所提高。
不过,这并不是人类历史上首次用AI促进教育变革的尝试。在1950年代,伴随着“人工智能”概念在美国达特茅斯学院研讨会上被提出,用机器辅助教学的探索就没有停下脚步。
1961年10月,《大众机械》杂志发表了一篇名为《机器人会教你的孩子吗?》的文章,描述了当时席卷美国学校的一系列“试验性机器教学”的热潮。
彼时,最具有跨时代意义的就是伊利诺伊大学Donald Bitzer教授带领开发的在线学习系统PLATO。它不仅可以在文本上叠加图形,还能根据学生答案中的关键词来理解和评估他们的回答,并给出具体的反馈。这种实时回答的方式让学生可以自己掌握学习节奏,也有利于教师调整教学内容。此外,PLATO还设计了早期的社交功能,方便学生在上面交流讨论。
在运行的40年中,PLATO为伊利诺伊大学与当地学校的学生、监狱里的囚犯和其他大学的学生,提供了包括拉丁语、化学、教育、音乐、世界语和小学数学等在内的跨年龄段的各种课程。可以说,PLATO就是现在“AI+教育”产品的雏形。
然而,受当时技术发展的局限,PLATO主要依靠预设的脚本和规则交互,无法真正理解自然语言,也不能对大量用户数据展开分析,因此只能处理有限的且设定好的输入和输出,并不具备对话和分析的能力。
随着认知模型的发展,AI可以模仿人类的思维解决复杂问题,智能教程系统(ITS)也逐渐成熟,由此诞生了Carnegie Learning这类能够根据学生表现调整教学内容,提供个性化学习体验的教学软件。不过,这些软件可以分析学生的学习数据,却无法处理复杂的自然语言输入,也缺乏对学生情感和动机的理解。
后来,互联网和大数据技术推动了在线教育平台的兴起。其中,最被大众熟知的,就是诞生于2010年的非营利教育组织可汗学院(Khan Academy)。这个号称集结了“世界上最牛的老师”,给所有想学习的人提供免费资源的学习平台,被认为是教育领域的一次革命。然而,尽管能为学生提供个性化的学习路径和资源推荐,早期的可汗学院依然只能完成单方面输出,无法实现深度交互。
这种局面在2017年被打破。Transformer架构的提出,使AI模型能够更好地理解和生成语言。以前的AI需要一步步处理信息,效率低且效果一般,而Transformer可以同时处理大量信息,快速理解语义,生成更自然的文本。2022年,ChatGPT应用的火爆推动了Transformer架构在不同产品中的应用,包括学习机、词典笔、错题答疑App等教辅软硬件。AI教育产品的交互方式自此发生了翻天覆地的变化,变得更“随机”、更智能、更多样。
2022年夏末,可汗学院创始人人萨尔·可汗收到了OpenAI联合创始人的电子邮件,邀请他参与最新模型的早期测试。一年后,可汗学院的智能助手Khanmigo宣布由GPT4驱动。
以前的K ha nmigo只能回答预设的问题,现在它可以借助GPT-4的能力“角色扮演”,并展开苏格拉底式对话。比如提出引导性问题“为什么你会这样回答?你认为那是真的吗?如果……会发生什么?”,从而激发学生不仅仅停留在表面答案,而是更进一步探寻why与how的问题。此外,Khanmigo还可以让每个学生根据自己的进度和需求,获得量身定制的学习计划与即时反馈。
不只可汗学院在尝试。中国的技术公司、教培机构们也纷纷瞄准了生成式“AI+教育”的赛道。今年4月,科大讯飞推出了具有A I百科知识问答、AI作文批改等生成式AI功能的学习机。
“AI+教育”历史沿革
不过,考虑到学生的考试做题需求,国内的生成式AI教辅产品更侧重于用大模型优化推荐算法,通过对大量用户数据的分析,更精准地匹配学生不擅长的知识点并加以巩固。“加入大模型后,系统不是简单地通过错题来判断(学生是否掌握一个知识点),而是通过做几道题来评估学生对本章节的掌握程度以及他的总体水平,并推断出他最应该学习和加强的内容。2019年我们就在尝试这种路径,只是在大模型的加持下,我们的算法变得越来越精准。”科大讯飞副总裁章继东对《第一财经》杂志说。
5月30日,OpenAI发布了面向高校学生、教职员工、研究人员的ChatGPTEdu,它能够辅导学生、撰写助学金申请文案、审阅简历,并且还可以帮助研究者做数据分析、文档摘要。哥伦比亚大学Nabila El-Bassel教授的团队已经利用ChatGPT Edu分析和整合过大型数据集,原先需要数周才能完成的工作现在只需要几秒钟就可以完成。
不过,AI在教育教学领域中也有一些无法完成的任务。大语言模型仍然是一种语言模型,在涉及复杂的逻辑推理、步骤计算,以及数学抽象概念的理解上表现一般。但AI的介入已经为教育提供了新的路径——它解决了在线教育中的“重复性教学”问题,既能针对学生的薄弱点查漏补缺、实时纠错,又能通过启发式教学锻炼学生的思维逻辑。在和国内外高校的本硕博学生,以及高中和大学老师聊过之后,我们发现,AI已经逐步深入到老师和学生的日常教学中。或许,曾经因教育资源不均、班级人数过多、教师无法兼顾而难以实现的“因材施教”,正在借助AI成为可能。
徐凝 大三学生
主修:商务英语
每周使用频 3到4次
率主要用于 雅思口语陪练、儿童绘本翻译、课程作业(课程论文、课堂PPT汇报)等
现在市面上的雅思口语培训要么价格昂贵,要么质量不佳,尤其还有很多印度口音的老师陪练,效果并不好。所以在申请海外研究生时,我是用ChatGPT来做我的雅思口语培练的。可以说,它虽然不能和那些一小时要七八百元的老师比,但至少可以达到四五百的陪练老师的水平。
一开始,我输入的指令比较简单,互动效果并不好,有点像雅思口语参考书里的答案详解。为了让它更好地扮演口语老师,我在B站上学了很多教程,开始调整自己的指令。比如我会让它把自己看作一个下周即将参加口语考试的学生,水平大约在7分左右,而我是考官,这样我就可以学习ChatGPT是如何以口语7分的水平回答雅思口语测试中关于第三部分话题讨论的问题。而当GPT-4o推出后,用手机语音对话的体验更流畅。
此外,我还会用ChatGPT帮助完成一些儿童绘本的翻译工作。在翻译中,比较头疼的是那些包含文化背景和俚语的部分。比如说,中国人对数字4有忌讳,很多电梯甚至都没有设置4层。外国人通常不理解这一点,因此在翻译中国作品时,ChatGPT会帮我把4改成6,因为在西方文化里,6这个数字代表恶魔,和中国人对4的忌讳有类似的负面含义。
现在不管写什么,我都想用ChatGPT来改一改,或者有时候没思路了,也会让它辅助我寻找灵感。这种依赖也会让我担心,自己的发散性思维逐渐被削弱,思考的深度和广度会不会不如从前。
“有了GPT-4o,我再也不用花500元请雅思口语陪练了。”
“用ChatGPT来辅助我理解文献,有时会需要更长时间。”
我从大四开始使用ChatGPT,到了研究生阶段使用更频繁。研究生期间,我需要阅读大量外文文献,遇到没学过的概念我就会用ChatGPT来帮助我理解。尤其在涉及复杂的专业名词时,ChatGPT不仅会翻译概念本身的意思,还会介绍其背景和相关内容。
有一次,我问ChatGP T如何理解“Where i s a person whenthe body parts they c ontrol and r eceive feedback f rom a re w idelydistributed?”ChatGPT不仅翻译了这句话,还通俗地解释了其中的含义,并指出这是一个哲学或心理学问题,涉及到意识和身体之间的关系。它还提到一个我从未听说过的概念,我让它进一步解释,ChatGPT又给出了详细的解释和相关文献引用。我随后用Google检索了这个新概念并阅读了相关论文,并因此拓展了知识面,也加深了对这篇文献的理解。
使用ChatGPT来辅助我阅读文献并没有帮我省多少时间,有时甚至时间更长了,但它带给我的信息拓展对我帮助很大,让我更深刻地理解了作者的观点,也更容易形成自己的观点。
此外,日常在完成专业课的作业时,我会在完成初稿的基础上,把一些段落交给ChatGPT来润色和完善。使用ChatGPT后,我的角色从内容创作者变成了内容审核者,不再需要绞尽脑汁地抠每个写作细节,帮我节省了不少时间。
不过我发现,比起从0到1的创作,ChatGPT还是更擅长总结关键内容,它只能作为思维拓展的起点。
李冉 硕一学生
主修:国际法
每周使用频率 2到3次
主要用于 学习文献概念、寻求启发性观点等
张皓 博士生 计算机专业
主修:AI方向
每周使用频率 5到6次
主要用于 写实验代码块、修改论文语法错误等
我在国内没有用过ChatGP T,到美国读博士后才开始了解它,直到现在成为频繁使用者。刚读博的时候,大家会推荐各种实验设计和学习软件,包括ChatGPT。起初我只是用它来聊天或解答基础问题,那时我使用的是3.5版本,还没有购买高级套餐,所以没有觉得它特别强大。后来逐渐了解到它在写代码和解释一些定义上非常有用,我才成为付费会员。
对我来说,ChatGPT更像是一个新的Google或搜索引擎,但它不仅仅是整合信息那么简单。相比于Google,ChatGPT能更好地理解我的问题,并用比较简单的方式给出回答。很多信息在网上也能找到,但ChatGPT的回答更像人话,而不是那些严谨的公式或复杂的数学表达。
以前没有ChatGPT的时候,如果遇到不懂的名词,我会先在Google上搜索它的定义,比如搜索一个定理,搜索结果的第一条通常会给出数学定义,这些定义很难理解,我会继续找论坛上的讨论,看看别人是如何解释的。通过这种方式,我大约需要10分钟才能对这个名词有个大概了解。
但现在,我会直接问ChatGPT。它会整合各种信息来源,告诉我这个名词的起源、历史背景以及应用场景。它不仅会解释符号和定理,还会详细说明这个定理的实际用途和一些拓展概念。这样,全面理解这个名词只需要一分钟左右的时间。
有时候写代码我也会用ChatGPT。以前我们专业经常用Copilot来改写代码,当时的软件已经比较智能。不过C o pi lo t更倾向于实时补全代码,或者帮我写下一个句子;而ChatGPT会直接生成一整段内容。
使用Copilot时,可能十次中只有一次能给出我需要的内容;而ChatGP T九次的回答都很有用,所以我现在用ChatGPT更多。不过实际使用过程中,我会用Copilot补全那些重复性高、懒得写的部分,不会完全依赖它生成完整的代码,因为它写着写着就会胡编乱造或者频繁重复一段内容。但是,我会用ChatGPT帮我生成或修改整段代码块。
我身边的人都在用Chat GPT,我们经常交流使用方法。我经常用ChatGPT来改论文的语法错误和替换更学术的单词。我发现,用ChatGP T改论文时,不要一次性把整段话丢给它,而是逐句输入让它修改,并且要确保输入的一条信息中,每句话前后有逻辑关系。这样可以确保ChatGPT不改变原意,修改得更精细,同时也方便检查是否保留了原意。
目前使用下来,我发现ChatGP T不擅长做数学题,除了解释一些定义,它根本无法完成数学题目,简单的加减乘除它也很吃力,还总容易出错。并且,在回答一些专业知识上也有问题。我们有一门课讲程序语言逻辑,用ChatGPT回答作业的人都得了零分。
“ChatGPT更像一个信息整合的工具,一个新的、说人话的搜索引擎。”
"未来那些会用AI工具的学生,会越学越好。AI有多强大,取决你有多强大。"
和渊 人大附中高中生物老师
《AI时代,学什么,怎么学》作者
每周使用频率 几乎每天使用
主要用于 做PPT、定制数字智能体给学生答疑
生物学涉及很多细胞内的细胞器和生物大分子,对一名生物老师来说,没有视频,学生很难理解这些微观的知识点,现有的学术视频又非常稀缺。如果想要做一个学术性的、能精美展示细胞器如何在细胞内组织的动画视频,每分钟的成本在30万元到100万元之 间。
但OpenAI在2月推出的首款文字生成视频模型Sora让我太兴奋了,这意味着在学习理化生科目时,学生可以从抽象的文字讲解和图示中解放出来,通过看视频,更直观地学习新的知识与理论。比如我可以带学生“进入”细胞,以可视化的方式让他们观察白细胞如何与病毒作战。在物理课上,老师也可以利用视频让学生更直观地看到小球从滑板上掉落的物理过程。
AI给教学带来了更多想象力,不过不是每一个高中生都会深度使用AI。学校本部的学生大多数会参加高考,他们在上课时必须把手机收起来,放学后才能拿到,吃完饭还要参加课外班,回到家后又要马上写作业。对于这些孩子来说,他们能接触手机和电脑的时间比较有限,这是他们无法深度使用AI的制约因素。
国际部的学生会比较宽松一些,他们上课时通常可以使用电脑,学习和记笔记也都是在电脑或平板上完成的。我之前做过一个问卷调研,国际班的学生中有近7成都用过GenAI,大多数人每周用2到3次,每次使用不到半小时。他们一般用AI来帮助他们写一些“无聊”的作业,或者查一些上课听不懂的知识点(与搜索引擎不同的是,针对某一个知识点,学生可以不断地追问,而非从搜索结果中寻找答案)。学生很喜欢用AI。
在《AI时代,学什么,怎么学》这本书里我有提到,教育本质上是一种生产关系,它会随着生产力的变化而变化。如果说工业革命之后,现代学校让普通人都可以接受老师的言传身教,那么到了AI时代,通过一台电脑或是一部手机,学生能获得一对一的学习体验,真正实现了学习的“因材施教、千人千面”。
在国际部,包括我在内的很多老师都开设了选修课,我们多数时候都允许学生使用AI完成作业。比如在学业规划课程中,AI可以帮助他们撰写申请海外大学的文书材料,或者帮他们修改文书中的语法和表达;在经济学课程中,以前学生分析B站2018年到2023年的财务数据需要在Excel中手动输入各种公式,现在只需将数据喂给AI,输入提示词,就能生成线性回归曲线并完成数据分析,这对于高中生来说,是中等难度的AI使用。更复杂的应用比如开发小分子药物,我会带学生模拟药物与蛋白质的结合过程,学生们需要用AI工具确定小分子药物与蛋白质最有效的对接方式。
家长不用过分担心当下学业成绩和未来教育发展的平衡问题,这两者并不矛盾。尽管现在的高考仍然注重成绩,但考试内容正在发生变化。举个例子,现在高考生物科目已经不能仅仅依靠背诵知识点来取得高分。如今的考试更关注孩子的核心素养,解决实际问题的能力、提问能力和创造能力。生物考试中的题目通常涉及复杂的生物学现象和实验设计,需要学生具备生物学思维,并能够灵活运用所学知识解决问题。这些题目往往来自于最新的科学研究,要求学生在没有见过的背景下运用书本知识解决问题。
在这种情况下,AI可以帮助学生学习新知识,并且针对他们的困惑快速提供反馈;在做题过程中,AI也可以即时出题和批改,帮助学生刻意练习,形成肌肉记忆。在我的畅想中,未来高中老师将不局限于黑板与讲台,我们可能更多扮演答疑者、心理辅导员、学业规划师这样的角色,教师的职责也将从讲解知识为主转变为育人为主。
对于学生来说,马太效应会越来越显著——那些利用AI辅助学习的学生会取得更好的成绩,而不会使用这些工具的学生,差距可能会越来越大。
赵斌 复旦大学生命科学院教授
使用频率 几乎每天使用
主要用于 修改论文、写邮件、寻找审稿人、出考卷
类似ChatGPT这种GenAI帮我完成的工作太多了,比如修改文章、润色英语邮件和论文;阅读文献的时候,我会与它讨论,让它帮我挖掘字里行间的意思;我有什么新的想法,也喜欢问问它,看看我是否遗漏了什么……
对于一些有争议的话题,与GenAI聊就特别有意思。前不久,我在翻阅《Science》期刊的时候,看到一篇名为《菲律宾法院阻止了转基因大米》的文章,这和菲律宾一些研究机构在几年前曾高调宣布通过了黄金大米的大规模商业化种植相悖——这是值得讨论的点。
我把文章的PDF版本发给AI,它一方面根据文章内容将其拆解成包括事件背景、转基因大米的目的、法院考量等多维度的详细解读,一方面也给到了比如社会经济影响、国际视角等拓展回答,不过总体上还是泛泛而谈的。
我又继续追问了一些问题,比如黄金大米的食品安全性争议,以及它能在多大程度上解决发展中国家常见的维生素A缺乏症等问题。
我发现,只有通过这种反复提问和逐步深入的方式与GenAI“对话”,才能获得比较好的结果。有的时候它可能会把话题带偏,我需要通过继续追问拉回来,告诉它我们现在讨论的问题是什么。这样一步步走下去,它能引导我更深入地思考。
现在,AI对于我来说,就是一个知识渊博的好朋友,我有问题随时都可以问它,大多也都得到了满意的解 答。
ChatGP T更新后,作为一本杂志的责任编辑,我开始尝试用它寻找审稿人。我会给ChatGPT看论文摘要,要求它根据文章的内容自己策划一个搜索策略,寻找适合审阅这篇稿件的人员——那些发表过类似文章的作者,然后根据这些文章,摘录出作者的电子邮件地址等关键信息。以前要寻找一个合适的审稿人可费劲了,要确定关键词、找文章并下载、阅读文章、寻找文章中的作者信息,这个过程很耗时。现在在ChatGPT的帮助下,我的工作效率大大提高。
用得最疯狂的一次,是我让ChatGPT学习了我一门课程的全部课件,让它帮忙出一份传统的期终考试试卷,结果发现许多试题比我挖空心思出的题目还要好。让它多出几份,老师就可以从中挑选自己满意的试题,然后合成一份理想的试卷。
实际上,现在让学生回答传统试题也没什么太大的意思,我会让学生们各出一份试卷,然后同学之间互测,但他们要说清楚,出这份试卷的思路是什么。我的作业一般都是让学生与AI对话,并把整个问问题的过程展示给我看,这样我就知道学生问了什么问题,AI如何回答,学生又是如何追问的。
有人说人工智能对教育的革命是个性化,我觉得并不是十分恰当。个性化教育自古就有,比如,传统教育中的私塾,规模非常小,有时候甚至只有一位教师,也只有一位学生,这就是一对一的教学。在私塾中,学生可以更直接地与教育者互动,教育内容显然也更灵活,更能根据学生的个体差异调整。毫无疑问,在这种近乎一对一的,或小组教学的方式下,学生更容易获得个性化的学习体验。不过,在提升教育质量方面,Al改变最多的不是个性化教育,而是让个性化教育规模化实现。
“Al最大的潜力不是个性化教育,那是孔子时代私塾的教学方式,AI只是让个性化教育规模化实现。”