11月21日中午,“数字与人文节气沙龙”系列活动第52期暨人工智能研究院学术沙龙第23期举行。讲座聚焦人工智能与司法交叉领域,为与会者介绍大模型基础理论知识、大模型监督强化推理、智慧司法机遇与挑战。本期沙龙由北京大学人工智能研究院杨浩主持,邀请北京大学人工智能研究院张牧涵担任主讲人,北京大学法学院党委副书记、北京大学人工智能研究院副院长杨晓雷为与谈人。来自法学院、人工智能研究院、国际关系学院等院系的多名师生参与讨论。

活动现场

张牧涵作主题报告
讲座从基本概念入手,帮助听众理解大语言模型的原理与技术基础。张牧涵指出,公众对大模型的认知最早源于GPT的发布。其核心特点包括:具备生成文本的能力、利用大规模互联网语料进行广泛训练、预测下一个词元的概率分布。张牧涵以“词元”“分词器”与“向量嵌入”等概念为例,说明模型如何将文本转化为机器可处理的高维向量空间表示,并介绍注意力机制的作用。他将大模型的训练分为三大阶段,即通过海量互联网文本,让模型学习语言结构、逻辑关系与世界知识的预训练阶段;用任务型数据对模型进一步训练,使其更贴近特定应用领域的微调阶段;通过“奖励机制”让模型在对齐性、安全性、合规性等维度更加优化的强化学习阶段。当前业界正在尝试通过更精细的推理训练,提升模型的逻辑推理能力与可信度。
在技术基础阐述后,张牧涵将大模型与“智慧司法”结合,指出其面临的机遇与现实挑战。机遇方面,大模型可协助初筛文书、提取证据要点、生成辅助意见等,极大提升司法文书处理效率。同时,智能咨询、自动化法律检索等功能为企业与个人提供更精准的信息服务,增强司法服务专业性与普惠性。大模型还可以助力司法行业的数字化升级。当然,法律场景对安全性、准确率的要求更高,模型错误可能造成严重后果,因此模型可靠性、推理一致性仍需提升。此外,法律知识结构复杂,但大模型的专业语料匮乏,需要更多团队与专家参与。
张牧涵介绍了团队正在构建的“元法大模型”体系,展示了模型如何从输入的法律事实中抽取关键信息、生成稿件格式、补充必要的法规引用,逐步得出更符合司法体系要求的结构化输出,并与现场与会者互动。张牧涵强调,当前团队正在推进高难度、高价值的智慧司法研究项目,非常欢迎对AI、司法、数字治理等领域感兴趣的同学加入,共同探索大模型在司法领域的未来发展方向。

杨晓雷进行回应
在对谈环节中,杨晓雷围绕“智慧司法”的主题进行进一步回应。他提出,法律体系可从“信息-知识-价值”三个维度理解。互联网时代极大提升了公众获取法律信息的能力,人工智能的出现进一步推动法律知识普及化,使普通人在复杂法律问题上的理解与判断能力不断增强。他强调,这类系统不仅能为普通公众提供知识支持,也将提升专业法律群体的工作效率,有助于构建更高效的法律服务体系。同时,杨晓雷表示,真正的挑战并非来自技术本身,而在于法律知识体系的边界与不可完全形式化的部分,如价值判断、道德意涵等。人工智能无法完全替代法律人的判断,人机协作将成为未来法律工作的重要方向。

自由讨论发言
在自由讨论环节中,与会师生围绕法律大模型的发展展开了深入交流,讨论内容涵盖模型在数据标注、知识更新、反馈循环等方面的核心技术挑战,以及法律场景对大模型稳定性和推理能力的特殊要求等。
本次活动中,社会科学部继续与勺园中餐厅合作,推出小雪节气特色美食,为与会师生提供了良好的交流环境。玻尔知识库继续为沙龙活动提供专属知识库,方便不同专业背景的观众了解主题内容。

小雪节气美食
信息来源: 北大社会科学部