1.北京工业大学马克思主义学院,北京; 2.首都工程教育发展研究基地,北京
党的十八大以来,科技创新受到高度重视。我国明确将其作为推动高质量发展的核心动力,尤其是大数据与人工智能领域[1]。2022年8月,科技部等六部门联合印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,进一步鼓励围绕人工智能的相关应用开展广泛探索[2]。近年来,随着人工智能、大数据、云计算等新兴技术的迅猛发展,以人工智能为基础的大型语言模型相继产生,已经具备文本生成、多轮对话、知识问答等多种功能[3]。大模型主要指基于海量数据训练、具有超大规模参数且可以适配多种不同任务的人工智能模型[4]。以ChatGPT为代表的各种生成式人工智能,为教育领域的深入发展带来了巨大的机遇与挑战。实践表明,大模型正逐步革新教育教学的方式[5]。立足新时代,如何发展更有温度的智能教育,如何让大模型支撑教育改革创新,已成为我国教育事业发展面临的重要课题。
目前,国内外关于大模型在教育领域内的应用研究广泛,取得了一定成果,但研究的侧重点有所不同。我国更多依托政策导向,注重结合具体学科特点及教育场景完成开发与应用;国外则更强调技术层面的开源及共享,重点关注使用过程中的伦理规范问题[6]。例如,国内有学者认为,借助ChatGPT可以为学生提供在线学习资源、支持自主学习,同时为教师提供教学资源和工具,帮助改善教学方式[7]。而国外则聚焦教育教学特定场景,如借助Khanmigo、Merlyn Mind、CheggMate、ChatGPT Edu等人工智能教育大模型,通过技术手段提升应用效果[8]。尽管国内外相关研究均表明大模型在教育领域具有巨大的变革潜力,但大模型的广泛应用也导致了知识碎片化及学习者学习行为碎片化等问题[9],同时在具体应用中也面临技术适配、数据安全、伦理公平等多方面困难[10]。
基于此,本研究以2021—2025年国内大模型在教育领域应用的1202篇文献为研究对象,结合CiteSpace可视化分析软件,从发文数量、发文机构、关键词等维度展开计量分析,系统梳理该领域的研究现状、研究热点及未来趋势,从总体上把握大模型与教育融合发展的规律,为后续相关研究的深化与发展提供参考。
本研究基于中国知网数据库(CNKI),以“大模型”和“教育”为共同主题检索词,将文献发表时间设定为2021年1月至2025年12月(相关文献最初出现时间为2021年),共检索相关期刊论文1250篇。对书评、会议等不相关文献进行筛选并剔除,最终共获得1202篇有效文献。将这1202篇文献通过CNKI的Refwork格式引文导出,并在数据文件夹中完成数据转换,转换后的数据适用于CiteSpace可视化软件,用于绘制知识网络图谱。
本研究主要采用美国德雷塞尔大学陈超美博士开发的一项可视化分析软件,即CiteSpace。该软件主要利用信息可视化方法、文献计量学法和数据挖掘算法集成的基本原理,通过绘制可视化图谱、建立节点之间的关联,分析研究对象的共现关系与共引关系等[11]。运行CiteSpace 6.3.2版本后,在具体分析过程中将时间跨度限定为2021—2025年,时间切片设为1年,网络节点选择论文作者、研究机构和关键词3个维度,调整相关阈值参数并绘制知识网络图谱,从而对我国大模型在教育领域的应用这一热点主题和研究趋势进行系统性梳理及分析。
通过对2021—2025年大模型在教育领域应用的相关文献进行计量分析,可以对该主题的研究情况形成整体性认识。下文主要从文献发文量、作者及机构三个方面进行统计分析。
发文量的变化能体现该领域研究热点的变化趋势。如图1所示,2021—2025年,大模型在教育领域应用的发文数量总体呈现显著上升的趋势。根据具体发文数量,可以将其划分为两个时期。第一个时期为平稳起步期(2021—2022年),这一时期人工智能技术刚刚兴起,其在教育领域的应用尚未受到广泛关注,相关研究仍处于初步探索的阶段,该时期的文献数量小于3篇,且变化情况不显著。第二个时期为快速增长期(2023—2025年),2023年成为该领域研究的爆发时期,仅一年时间,关于该主题的文献数量就从22年的2篇上升到2023年的73篇,表现出显著性差异;2023年之后,该领域发文量呈现出逐年递增的趋势,2025年已经达到了756篇,呈现出持续递增且变化情况显著的态势。发文数量的变化趋势可以反映出2023年以来将大模型引入教育领域受到国内学者的广泛关注,这可能是因为我国教育数字化转型战略的深入推进,以及大模型相关技术的不断优化,为大模型在教育领域的应用提供了政策支持与技术支撑。
图 1 大模型的教育应用发文数量分布图
Figure 1 Distribution of published papers on educational applications of big models
研究作者合作网络能够反映研究领域的核心研究群体。各作者间的合作网络如图2所示,其中N=134,E=56,说明该领域的研究作者共有134位,形成了56条合作连接线,发文作者密度值仅为0.0063。将发文量为3篇作为阈值,对该主题论文的作者进行可视化分析,可知发文量最高的作者是陈向东和沈强,均为7篇;其次是黎加厚、刘邦奇和卢宇,发文量均为6篇;吴砥、刘泽民、方海光和王峰发文量为4篇,而其他作者发文量均低于4篇,且多数作者发文量仅为1~2篇。作者与作者之间的连线表示作者之间存在合作关系,颜色越深表示合作越密切。例如,陈奇峰与唐懿文之间用连线表示,说明两者在该主题论文撰写方面存在交叉合作,且联系较刘泽民和陈向东之间更为密切。整体而言,大部分发文作者的论文数量低于4篇,仅有小部分作者超过4篇,且作者间的连线相对较少,这也说明发文作者的分布程度较为分散,合作情况存在但程度不显著。
图 2 大模型教育应用的作者共现图谱
Figure 2 Co-occurrence map of authors on educational applications of big models
研究机构合作网络能够反映研究领域的整体协作水平。如图3所示,通过研究机构知识图谱和相关后台数据可知,N=141,E=66,说明针对大模型在教育领域应用开展研究的机构共141个,形成了66条合作连接线,机构间的密度值仅为0.0067,与研究作者密度值相近。梳理后可将这些机构划分为两大类别,第一类为普通高等院校,尤其是各大高校的技术学院系和教育学院系,如华东师范大学教育信息技术学系、北京师范大学教育学部等,其中华东师范大学教育信息技术学系在推进大模型教育领域贡献度最高,发文量为15篇,成为该领域核心研究机构之一;第二类为集团、出版社、科研机构等,如科大讯飞股份有限公司、中国出版传媒商报等,这类机构更加注重技术研发、产品落地与市场应用等内容。总体而言,上述机构之间存在一定合作关系,部分高校与科研机构、企业之间存在合作关联,如哈尔滨工业大学与科大讯飞股份有限公司等存在合作连线,但整体密度值较低。这反映出机构之间的合作仍较为分散,未能形成长期稳定的合作关系,跨学科、跨地域的协同创新仍有待完善,后续需进一步加强机构间合作,凝聚研究合力。
图 3 大模型教育应用的机构共现图谱
Figure 3 Co-occurrence map of institutions on educational applications of big models
由图3可知,大模型在教育领域的应用仍以各大高等院校为主要研究基地,研究群体主要由高校教师、研究生、技术研发人员及出版行业相关研究者构成,在高校核心作者的引领下,形成了特色鲜明的研究成果,具体涉及的学科有高等教育管理、计算机软件及应用、教育技术学及经济学等。但研究主体分散、缺乏合作的问题仍较为突出,机构与作者后续也应加强资源共享,朝着跨学科、跨地域融合的方向迈进。
研究热点体现了特定研究领域的重点研究方向,对深入分析某一领域的发展情况具有重大意义。关键词的共现、聚类及突现分析,能够有效揭示研究领域的热点主题与演进趋势。
关键词是一篇文献内容的核心凝练,某一领域关键词出现频率较高,则反映了这一领域的研究热点[12]。将文献数据导入CiteSpace软件,时间间隔设为1年,网络节点选择“Keyword”,最终形成如图4所示的关键词共现网络知识图谱。
图 4 大模型教育应用的关键词共现图谱
Figure 4 Keywords co-occurrence map on educational applications of big models
将排名前十五的高频关键词进行梳理,结果如表1所示。颜色越深、标记点越大,代表关键词出现频次越高。出现频率最高的关键词为“人工智能”,频次达到了197次;其次为“大模型”,频次为153次。这表明围绕该领域的相关研究主要围绕人工智能技术与大模型两大主题展开,研究的核心基础关注技术层面的广泛探索。其他高频关键词依次是“教学改革”(39次)、“知识图谱”(32次)、“人机协同”(29次)、“智能体”(27次)、“职业教育”(23次)、“智慧教育”(23次)等,这也反映出研究既关注技术赋能教育的实践应用,也重视对具体教育领域与实践场景的探索。如果中心性>0.1,则表明该关键词为关键节点,如表1所示的前15个关键词均为关键节点。总体而言,大模型在教育领域应用广泛,不仅关注人工智能、人机协同等技术层面的应用,也对教育领域内部的教学改革及人才培养等内容予以高度重视。
表 1 大模型教育应用的关键词频次表(前15)
Table 1 Keywords frequency table on educational applications of big models
| 序号 | 关键词 | 中心性 | 频次 | 首次出现年份 |
| 1 | 人工智能 | 0.87 | 197 | 2022 |
| 2 | 大模型 | 0.80 | 153 | 2023 |
| 3 | 教学改革 | 0.14 | 39 | 2024 |
| 4 | 知识图谱 | 0.13 | 32 | 2023 |
| 5 | 人机协同 | 0.08 | 29 | 2024 |
| 6 | 智能体 | 0.02 | 27 | 2025 |
| 7 | 职业教育 | 0.12 | 23 | 2024 |
| 8 | 智慧教育 | 0.18 | 23 | 2023 |
| 9 | 高等教育 | 0.10 | 20 | 2023 |
| 10 | 智能教育 | 0.03 | 19 | 2024 |
| 11 | 多模态 | 0.11 | 12 | 2024 |
| 12 | 人才培养 | 0.03 | 11 | 2024 |
| 13 | 教学模式 | 0.11 | 11 | 2024 |
| 14 | 教育应用 | 0.02 | 10 | 2023 |
| 15 | 教育技术 | 0.03 | 9 | 2023 |
关键词聚类分析以关键词共现分析为基础,通过聚类统计学的方法,将关键词共现网络关系简化成数量相对较少的聚类[13]。本文在关键词共现分析的基础上,进一步对大模型在教育领域的研究热点进行关键词聚类分析,以探求我国教育领域大模型应用的热点主题。
聚类计算的结果显示,Q(聚类模块值)=0.7208>0.3,说明该聚类结构性显著;S(平均轮廓值)=0.9522>0.7,说明聚类结果良好,二者均表明本研究的聚类效果具有较高可信度。通过关键词聚类分析,本文将相关关键词分成十个不同的研究区域,区域面积表示了该研究领域中包含的各个小节点,区域的面积越大,则表明这一领域是该主题的重要研究热点。如图5所示,共形成了十个聚类,分别是#0人工智能、#1精准教学、#2教学改革、#3大模型、#4多模态、#5高职教育、#6智慧教育、#7虚拟仿真、#8深度学习及#9通用大模型。每个聚类包含若干关键节点,如#1精准教学包含核心素养、数智技术、精准教学、信息技术、教学模式及课堂教学6个关键词。这十大聚类主要包含技术支持、教育应用、场景细分、目标导向等多个维度,较为全面地展现了大模型在教育领域应用的丰富内涵与核心分支。
图 5 大模型教育应用的关键词聚类图谱
Figure 5 Keywords clustering map on educational applications of big models
突现词是指某一时间段内出现频次快速增长、使用频率显著提升的关键词,主要包含强度和年代两个变量,用以反映研究热点随时间推进的迭代变化情况[14]。通过CiteSpace软件对该主题进行时间跨度设定及突变词检测,可以反映大模型在教育领域的研究热点演进路径,如图6显示。
图 6 大模型教育应用的关键词时间线图谱
Figure 6 Keywords timeline map on educational applications of big models
该领域在不同聚类上显示出不同的关键节点特征。2021—2022年,最早出现的两大聚类分别是“精准教学”和“多模态”,时间跨度均为2021—2025年。这说明2021年起,随着技术手段的迅猛发展,这一阶段的研究聚焦于大模型在教育领域的基础应用探索,课堂精准教学、教育数智化等成为早期关注方向,且始终保持着较高的研究热度。在该时期,2022年人工智能技术的迭代升级与场景化落地,为大模型在教育领域的早期探索提供了技术支撑。
2023年开始,“大模型”“教学改革”“智慧教育”“通用大模型”逐步成为研究重点。其中强度值最高的突变词为“教育”(2.31),其次是“师范生”(1.15)、“数智化”(1.04)、“教育技术”(0.94)等。这也表明2023年大模型在教育领域的应用得到深化,通用大模型、教育数智化仍是研究的核心议题。此外,师范生培养、教育技术革新等主题也受到广泛关注,大模型在教育领域的应用开始进入规模化探索时期。
2024—2025年,“虚拟仿真技术”“深度学习”呈现持续突变特征,强度值位列第二的“深度学习”(1.65)成为研究热点,与此同时,“情感分析”(1.3)、“chatgpt(1.3)”、“教学应用”(1.22)与“教育改革”(1.13)也获得广泛关注。这表明相关研究开始朝着教育细分领域及教育深度应用方向发展,不断深化对核心技术、教育应用场景及教学改革的探讨,大模型伦理风险、教育教学公平等问题开始进入研究视野。总体而言,这一演进脉络反映了大模型在教育领域的应用从宏观的技术赋能,正逐步转向技术与教育的深度融合,教育教学的细分领域及安全防控探讨也受到了研究人员的重视。
大模型教育应用的关键词突现图谱如图7所示。
图 7 大模型教育应用的关键词突现图谱
Figure 7 Burst keywords map on educational applications of big models
基于CiteSpace对2021—2025年我国大模型在教育领域应用相关文献的可视化分析,得出以下结论。
第一,从发文量来看,相关研究呈现前期平缓、后期爆发的阶段性特征。2021—2022年,大模型在教育领域的应用仍处于起步探索时期,年均发文量不足3篇,反映出此时大模型在教育领域尚未形成规模化影响力;2023年起,围绕该主题的相关研究进入爆发式增长时期,2024—2025年持续高速增长态势。这一趋势与我国推进教育数字化转型战略、研发人工智能技术密切相关。政策支持可以为研究提供良好的制度环境,技术革新则提供了坚实的技术支撑,二者共同推动该领域成为了研究的热点。
第二,从研究主体来看,相关研究以高校为主阵地,但研究合作力度有待提升。大模型在教育领域的应用研究,形成了以华东师范大学、西南大学等高校教育及技术院系为核心的研究群体,同时联合部分企业及科研机构的研究架构,陈向东、沈强、黎加厚等为主要研究作者。然而从合作网络来看,作者与作者、机构与机构之间的密度值偏低,整体未形成紧密的合作共同体,跨机构、跨学科的深度融合仍需加强。
第三,从研究热点来看,相关研究聚焦于“技术应用”与“教育革新”的双线融合。在技术应用层面,“人工智能”“大模型”“多模态”“人机协同”“深度学习”等关键词,凸显相关研究持续关注新兴技术手段的革新,为大模型应用于教育领域提供了强有力的技术支持。在教育革新层面,则聚焦于“精准教学”“教学改革”“智慧教育”“人才培养”“教学模式”等方向,这表明研究紧密围绕具体的教育教学场景,持续推进大模型深入课堂教学、课程设计等具体实践。同时,“职业教育”和“高等教育”相关研究,也体现出注重大模型在特定教育领域的个性化应用,在教育内部形成了差异化的研究方向。
第四,从研究趋势来看,相关研究正从大模型赋能教育朝着技术与教育深度融合演进。研究初期(2021—2022年),主要聚焦精准教学、数字化等基础应用,此时大模型在教育领域的应用处于萌芽准备阶段。2023年,“通用大模型”“智慧教育”“教育数智化”等成为核心焦点,教育应用场景得到初步探索,标志着大模型赋能教育进入了全面探索期;2024—2025年,研究朝向更深层次拓展,逐渐转向“深度学习”“虚拟仿真”“情感分析”等细分方向,同时对伦理风险、教育公平等更深层次的问题予以重视,显示出大模型应用于教育领域正从宏观探讨,走向场景搭建、深度融合的实践探索,更为注重应用的安全性、科学性与持续性。
第一,加强跨机构、跨学科的交叉融合,形成研究合力。针对研究主体分散、合作不足的问题,未来应着力构建跨学科、跨机构、跨地域的协同创新体系。一方面,推进计算机、教育学、心理学、社会学等多学科交叉融合,整合技术开发、教育理论及应用等多种资源,组建优势互补的专业研究团队,围绕大模型的设计、开发、应用及评估开展体系化研究。另一方面,核心研究群体应发挥示范引领作用,带动更多研究人员参与合作,进一步补充该主题的创新研究成果。
第二,构建一体化的教育大模型,加强教育细分领域的深入研究。教育大模型具备的自主生成与场景适配能力,能够深度服务于教育垂直领域的细分场景,是数字技术与教育需求深度耦合的必然结果[15]。面向教育领域的迫切需求,首先应结合先进教育理念、优质教育资源与真实教育场景数据,构建教育通用大模型,再结合不同学科特色、应用场景、学段特征的个性化需求,构建教育专业大模型,逐渐实现从教育通用大模型向教育专业大模型的跃升。此外,将未经专业教育数据训练的大模型应用于教育领域,易产生算法和数据上的偏误问题,从而进一步影响教师和学生的判断和决策[16]。因此,未来教育大模型需在通用大模型的基础上,进一步提升训练数据的质量和规模,尤其将教育教学知识、先进教育理念及教育核心场景的真实需求,深度嵌入算法模型的底层架构,并结合学习者需求迭代更新,从而实现教育大模型落地应用。
第三,健全风险防控体系,保障大模型在教育领域的安全及可持续发展。生成式人工智能技术的应用高度依赖用户持续输入的海量数据,这也说明数据安全与隐私保护成为未来亟待解决的核心议题[3]。因此,针对已有研究中大模型使用存在的安全及伦理风险等问题,首先,国家应建设和应用基于高质量、面向教育领域专属数据集训练而成的教育专有大模型,以减少内容创作偏见,提高教育知识生成的准确度、学科学段的适切度和意识形态的可控性与安全性[17]。其次,应强化教育数据安全保障机制,在不影响大模型生成内容质量的情况下,对原始数据进行加密处理,保护师生个人信息,防止隐私数据泄露。再次,加强大模型使用的伦理规范与监管机制建设,明确其使用的伦理准则,提前防范虚假有害信息及海量数据偏见带来的潜在风险。最后,应持续关注教育公平,推动大模型向偏远地区、乡村学校延伸,助力包容、普惠的高质量教育惠及更多师生群体。
大模型是顺应人工智能技术、智慧平台发展的具体产物,能够适用于教学资源供给、智慧教学实施等多个具体教育应用场景,深刻影响着教育教学领域的创新与发展。本研究运用CiteSpace软件,系统梳理了2021—2025年间我国大模型在教育领域的应用现状及演进趋势。结果表明,大模型应用于教育领域在短期内得到飞速发展,已经形成技术赋能与教育变革的双线融合格局。大模型与教育的深度融合既是机遇也是挑战,未来围绕该主题的相关研究,也应在凝聚多方合力、构建教育专业模型及健全风险防控体系等方面深入探究。可以预见,大模型将进一步赋能、赋智教育领域,为教师和学生带来更具个性化、高效化和智能化的教学与学习体验,为我国建成更高质量、更公平的教育体系持续注入强大动力。
[1] 蔡跃洲,陈楠.新技术革命下人工智能与高质量增长、高质量就业[J].数量经济技术经济研究,2019,36(5):3-22.
[2] 科技部等六部门联合印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》[J].机器人技术与应用,2022,209(5):2.
[3] 叶健能,沈绍伟,毕德亮.国产大模型范式变革背景下人工智能赋能高校思想政治教育的时代机遇、风险挑战与实践进路[J].黑龙江教育(高教研究与评估),2025(12):1-5.
[4] Bommasani R,Hudson D A,Adeli E,et al.On the opportunities and risks of foundation models[J].arXiv preprint,2021:1-212.
[5] 高洪皓,陈章进.人工智能赋能程序设计课程教学改革[J].计算机教育,2024(7):41-43,48.
[6] 胡小勇,朱敏捷,陈孝然,等.生成式人工智能教育应用政策比较:共识、差异与实施进路[J].中国教育信息化,2024,30(6):3-11.
[7] 张治.ChatGPT/生成式人工智能重塑教育的底层逻辑和可能路径[J].华东师范大学学报(教育科学版),2023,41(7):131-142.
[8] 刘邦奇,喻彦琨,王涛,等.人工智能教育大模型:体系架构与关键技术策略[J].开放教育研究,2024,30(5):76-86.
[9] 白玲,蒋雄飞.后人工智能时代大模型驱动的高等教育教学创新与重构[J].宁波教育学院学报,2025,27(6):81-85.
[10] 张磊.大模型赋能高校智慧教育的研究[J].辽宁科技学院学报,2025,27(5):59-61.
[11] 苗小燕,张冲.大中小学德育一体化研究的热点与发展趋势:基于CNKI数据库的CiteSpace分析[J].中国特殊教育,2018(8):87-92.
[12] 王晓军,赵文平.21世纪以来我国职业教育教材研究热点主题及演进趋势:基于CiteSpace的知识图谱可视化分析[J].中国职业技术教育,2023(17):71-81.
[13] 任恒.近25年来国内社会智库研究进展与趋势:基于CiteSpace的信息可视化分析[J].西南民族大学学报(人文社会科学版),2021(3):232-240.
[14] 王卉卉.高校实验教学示范中心研究的热点、演进和趋势分析:基于Citespace的文献计量分析[J].实验室研究与探索,2024,43(5):129-134,139.
[15] 向超,任雪琪,张铭凯.教育大模型赋能高等教育:风险识别与治理进路[J].黑龙江高教研究,2026,44(1):6-12.
[16] 祝智庭,戴岭,胡姣.AIGC技术赋能高等教育数字化转型的新思路[J].中国高教研究,2023(6):12-19,34.
[17] 刘邦奇,聂小林,王士进,等.生成式人工智能与未来教育形态重塑:技术框架、能力特征及应用趋势[J].电化教育研究,2024,45(1):13-20.