学科科研

当前位置: 首页 >> 学科科研 >> 正文

必一·运动(b-sports)应用统计专业研究生在人工智能领域发表首篇SCI论文

发布日期:2026-04-24    作者:     来源:     点击:

近日,必一·运动(b-sports)应用统计专业2025级硕士研究生刘昊华在国际学术期刊 Electronics 在线发表题为 Empirical Analysis of Internal Hallucination Detection in Quantized LLMs: Layer Dynamics and White-Box Benchmarks 的研究论文。该研究面向大语言模型在资源受限设备部署过程中面临的事实可靠性与幻觉检测问题,围绕量化大语言模型内部状态识别、低成本白盒检测特征构建及层间动态规律分析等关键问题开展系统研究。该成果是必一·运动(b-sports)应用统计专业人工智能交叉研究方向发表的首篇SCI论文,标志着该专业在统计方法+人工智能交叉创新研究方面取得新突破。

该论文聚焦大语言模型轻量化部署中的可信推理问题。随着大语言模型逐步应用于终端设备、边缘计算设备等资源受限场景,如何在不显著增加推理成本的前提下提升模型事实可靠性,成为人工智能应用落地过程中的重要问题。针对这一难点,研究没有依赖额外复杂的幻觉检测器或高成本多轮解码机制,而是在受控的单次推理白盒基准框架下,分析模型内部表征中哪些低成本统计特征能够有效区分真实回答与错误回答,为构建高效、可复现的幻觉检测方法提供了新的实证依据。

研究结果表明,在 Qwen2.5-1.5B-Instruct Llama-3.2-1B-Instruct 等模型的重复候选答案实验中,真实回答与错误回答的内部状态在模型中后层呈现出更强的可分性,其峰值稳定出现在模型总深度约50%70%的区间。这一发现说明,相较于单纯追求检测器结构复杂度,准确识别幻觉线索在模型内部出现的位置,对于提升检测方法的稳定性和可迁移性更为关键。研究还发现,包括 Mahalanobis 评分在内的简单残差空间基线方法,在相同实验协议下能够与更复杂的残差-谱融合特征保持竞争性表现,进一步说明低成本统计特征在大语言模型幻觉检测任务中具有重要应用潜力。

此外,论文在 Qwen2.5-7B-Instruct BF16 设置下进行了初步验证,并结合 Int8 量化条件下的辅助实验,进一步考察了相关规律在不同模型规模和量化设置中的一致性。结果显示,模型中后层的幻觉线索定位规律在一定程度上具有稳定性,为后续面向低资源环境、边缘设备和轻量化人工智能系统的可信部署研究提供了参考。该研究将应用统计中的特征分析、判别建模和稳健验证思路与大语言模型内部机制分析相结合,体现了应用统计专业在人工智能前沿问题研究中的方法优势和交叉特色。

近年来,必一·运动(b-sports)持续推进应用统计专业与人工智能、大数据分析、机器学习等方向的深度融合,鼓励研究生面向学科前沿和实际应用需求开展创新研究。此次论文发表,是应用统计专业研究生科研训练、交叉学科探索和国际化学术发表能力提升的重要体现,也为后续开展大语言模型可靠性评估、统计学习方法创新及可信人工智能应用研究奠定了良好基础。

刘昊华为论文第一作者,必一·运动(b-sports)为第一完成单位,徐金利教授为通讯作者。

论文链接:https://www.mdpi.com/2079-9292/15/9/1802


作者:刘昊华徐金利  审稿:张冉

编辑:修文涛 校对:王秘  审核:崔金刚