信息工程学院举办“CCF进校园”系列讲座第二期暨“信息智汇讲堂”
第四期—面向交互式大模型推理的键值缓存优化设计
信息来源:信息工程学院|发布时间:2026-05-25|文:袁艺林 |图:袁艺林|编辑:曹文露 张炜
为进一步聚焦大模型前沿技术研究,提高师生在人工智能与大模型系统优化领域的学术能力,深化计算机领域高水平学术交流,5月22日上午,信息工程学院联合科研处在主校区N3A-317举办“CCF进校园”系列讲座第二期。本次讲座以“面向交互式大模型推理的键值缓存优化设计”为主题,特邀清华大学计算机领域张广艳教授作专题学术报告,信息工程学院全体教师及研究生代表参加讲座。

信息工程学院举办“CCF进校园”系列讲座
张广艳围绕交互式大模型推理关键技术展开系统讲解,深入剖析大模型推理过程中“键值缓存”的主要瓶颈与优化难点,详细介绍了键值缓存的架构设计、调度策略、内存效率提升等关键技术,结合大模型实际应用场景,介绍缓存优化在降低计算开销、提升响应速度、增强交互流畅度等方面的重要价值。此次报告内容紧跟学术前沿、理论扎实且工程指导性强,拓宽了师生在大模型系统与高效推理方向的研究视野。
交流互动环节中,与会师生围绕键值缓存实现机制、大模型工程落地、轻量化优化等问题踊跃提问。张广艳结合清华大学团队科研实践与工程经验逐一细致解答,并勉励研究生紧跟国家算力基础设施建设与大模型发展需求,强化理论研究与工程实践相结合,勇于攻克技术难题。
报告结束后,张广艳与学院图像安全与智能物联网、机器学习与智能系统相关科研团队深入交流,就大模型优化技术研究、产学研协同创新、联合人才培养等方向交换意见。