首页  >>  产品服务   >>  业界动态

【中华读书报】人工智能时代的外语教学与研究利器

日期:2024/04/25

2024年4月17日,《中华读书报》在第18版图书推荐专题中刊登了我社图书《大语言模型的外语教学与研究应用》书评——《人工智能时代的外语教学与研究利器》。

图片

■都帮森

在人工智能迅猛发展的今天,大语言模型(Large Language Models,简称LLM)脱颖而出,在语言理解、文本生成、智能辅助等众多领域展现出强大的能力和无可比拟的影响力。其中,外语教学和研究无疑是这项技术的重要契合点。北京外国语大学语料库研究团队在许家金教授的带领下推出的《大语言模型的外语教学与研究应用》一书已于近日由外语教学与研究出版社出版。该书围绕外语教学和外语科研设计了约100个提示语示例,手把手地讲解教学,易学易用,为我们全面理解大语言模型在外语教学和研究中的革新性应用提供了极具实践价值的指引。

全书共分四章。第一章对大语言模型进行了概述,旨在使读者对大语言模型以及提示工程有基础性了解。第二章围绕大语言模型在外语教学各环节中的应用展开,从词汇教学、语法教学,到听说读写译能力的训练,以及词典编纂等教学应用进行了具体的示例展示及解析,展示了大语言模型改进现有外语教学实践的有效实施路径。第三章则深入探讨了大语言模型在外语科研中的具体应用,就其如何辅助科研工作者在文献阅读与评述、量化数据及质性的数据采集与分析、学术写作的语言表达与润色等方面结合具体案例进行了详细展示和讲解,具有极强的操作性和启发性。最后一章,本书在展现大语言模型所带来的机遇和未来发展趋势的同时,也没有回避大语言模型带来的挑战,如准确性和公平性以及伦理问题,让人更深入地了解大语言模型的影响和可能性。

究竟什么是大语言模型? 与大语言模型紧密相关的提示语以及提示工程又是什么? 大语言模型是利用深度学习技术训练语言相关数据得到的一种计算系统,是运用人工智能理解和生成文本的一种方式。在本质上,它是一种生成式的人工智能技术,即通过计算机系统对大量的文本数据进行学习和模拟,并能生成与训练数据相似的续写,可用于生成文章、程序代码、图片、音乐、视频等。由于此类模型目前主要使用海量文本数据(即语言数据)进行训练,因而被称为“大语言模型”。目前,比较具有代表性的大语言模型应用有:OpenAI公司的GPT大语言模型,如用于ChatGPT聊天机器人的GPT-3.5、GPT-4、DALL·E模型;谷歌公司用于Gemini平台(之前称Bard)的LaMDA、PaLM2、Gemini模型;Anthropic公司的Claude2、Claude3模型等。我国则有百度公司的文心一言大语言模型、科大讯飞公司的星火认知大语言模型、智谱华章公司的智谱清言大语言模型,以及阿里云公司的通义大语言模型。

当前主流的大语言模型主要通过用户提交的"提示语"(Prompt)信息进行工作。在人工智能领域中,“提示语”是指在交互式人工智能或机器学习模型中用来引发特定输出的输入语句或命令。提示语可以帮助模型理解应该执行什么类型的任务,并指导模型生成相应的响应。例如,在聊天机器人中,一条提示语可以是“告诉我今天的天气如何?”。这个提示语的目的是引导模型去查询天气信息并将结果以用户可理解的方式表达出来。提示工程(Prompt Engineering)则是一种数据训练和模型应用策略,针对特定的人工智能模型(如GPT-3、4)设计和选择最有效的提示语来获得期望的输出。这个过程可能会进行反复的训练和微调,以找到最合适的提示语,并优化模型的输出响应。提示工程的目标是充分利用模型的能力,提高其在特定任务上的效果。例如,在自然语言处理(NLP)任务中,精心设计的提示语能够引导模型生成更准确的文本,或者帮助模型更准确地解析输入的语义。提示工程在许多人工智能应用中,如聊天机器人、自动生成文案、预测模型等,都能起到关键作用。

提示语在很大程度上基于自然语言来设计和构建。因此,我们在使用人工智能或大语言模型时,可以像和人对话一样使用自然语言(如英语、中文等)进行,入门难度较低。这也是大语言模型一经推进,便迅速得到普及的原因。但要想有效地运用大语言模型,还是要针对具体的领域进行一定的提示词学习,类似掌握一门专门的自然“编程”语言。这也是《大语言模型的外语教学与研究应用》一书重点关注的问题。

该书首先关注的是大语言模型在外语教学领域的应用。众所周知,外语教学是一项系统性的工程,涵盖了听、说、读、写、译等多个教学环节。在传统的语言教学场景下,每个环节的教学都要面对一些耗时且需要付出很大努力的任务。现在,借助大语言模型,这些任务能够得到有效的解决。例如,大语言模型可以根据不同的语言环境和语境生成各种生动、准确和富含真实语料的例句,可以极大地丰富词汇和语句教学。同时,它还可以用在口语教学、阅读教学、写作教学和翻译教学中,协助教学者为不同学习风格、不同水平和不同学习阶段的学生提供风格和难易度相适应的语言学习内容,有力地提高教学效率。特别值得一提的是,在词典编纂中,大语言模型展现出了强大的潜力。借助大语言模型,编撰者能够创作出更为精准、实用和符合要求的词汇条目,这对外语教材的编写也颇具参考价值。

可以看到,大语言模型的应用并非是要替代教师,而是成为教师的助手,协助教师进行多元化的教学。但也要注意的是,大语言模型的角色定位应该也必须是一个随时可得、有问必答的“副驾驶”(copilot),教学者不可盲目相信并采用其生成的内容,要做好充分的校验和判断,用好这个智能助手。

在展示大语言模型在外语研究中的应用时,该书采用具体的研究问题和提示语及结构示例,展现了大语言模型在文献阅读与评述、量化数据采集与分析、质性数据采集与分析、语言表达与润色等环节中给外语研究者带来的巨大辅助作用。作者认为,目前大模型在研究数据采集和分析过程中作用明显,是“大语言模型语言学方法论”(许家金等2024:5)的关键应用场景,能够获取和处理海量的文本数据,并利用这些数据来分析、预测和解释语言现象,从而推动外语研究的深入发展。例如,大语言模型在解读言外之意方面表现出色,能很好地识别言语行为、概念隐喻等质性数据,研究者可以通过自然语言描述问题,提出要检索的目标对象,如衔接连贯、零形回指、会话结构等,交由大语言模型检索并标注,可显著提高数据收集的效率。研究者还可以将收集到的数据借用GPT-4进行基于Py⁃thon和R的数据建模分析,进行数据可视化呈现。

该书特别指出的是,研究者在与大模型的互动交流中,应注重人机之间的“相互切磋”“相互启发”,基于自身已掌握的“学科背景、核心知识和现实需求,从学理和实践角度提出真问题”,获得有价值的启示,提升“问商”(prompting quotient),以问促创,而不是任由人工智能左右方向。

在本书的成书过程中,编辑团队在与设计团队确定装帧设计方案时,虽经多次修改,封面设计仍难以令人满意。已有的设计稿虽图案简明大方,然而设计主题不显,面世后必然泯然于众。于是,本书作者基于“语言如行棋、智能似处子、模型即分布、提示乃问商”等意涵,并结合“语料可成事”(“语料橙”,即北外语料库团队专用色),编写了提示语,利用GPT-4生成了若干封面图案,供设计团队进一步进行专业处理,从而确定了现在的整体装帧方案。图书作者、人工智能、设计师的三方协作,更显大语言模型在实际产业流程中的价值和意义。相关详情,可参见本书的“后记”部分。

此外,书中的参考文献、附录等部分也为读者提供了丰富的后续学习材料和资源。本书还特设配套网页,提供书中所用的提示语和大语言模型反馈结果,并将持续同步后续的技术更新,更好地帮助读者掌握本书内容。本书出版面世后,无论是外语教师、科研工作者或是硕博研究生,还是广大对大语言模型有兴趣的普通读者,都能从中获益匪浅。

(作者系外语教学与研究出版社“数字技术与外语教育丛书”项目负责人)