wot
添加小助手
咨询活动详情
World Of Tech 2025
参会嘉宾
2025/07/18-19 北京·粤财JW万豪酒店
何世柱
中国科学院自动化研究所 副研究员,硕士生导师

中国科学院自动化研究所副研究员,硕士生导师。主要研究方向为知识推理、大语言模型和自然语言处理,在ACL、AAAI、EMNLP等顶级国际会议和重要学术期刊上发表论文80余篇,Google Scholar总引用9200余次。先后承担多项国家与企业项目,参与撰写《知识图谱》、《知识图谱:算法与实践》两本专著,获得2018年中国中文信息学会 “钱伟长中文信息处理科学技术奖”一等奖、2019年度北京市科学技术进步奖一等奖,入选2020年中国科学院青年创新促进会会员。

演讲主题:面向大小模型协同的推理能力蒸馏与增强技术

主题介绍:
本次分享聚焦大模型与小模型协同推理中的能力迁移与增强技术,旨在解决大模型计算成本高而小模型推理能力不足的问题。
1. 探讨长思维链、思维链能力内化等大模型推理关键技术;
2. 介绍团队在推理能力蒸馏和推理能力增强两方面的最近研究成果;
3. 对未来的技术发展趋势和应用前景进行展望。

主题大纲:
1. 研究背景
2. 推理大模型关键技术:长思维链,思维链能力内化等
3. 推理能力蒸馏技术:CoT蒸馏、样例学习蒸馏、神经符号蒸馏等
4. 推理能力增强技术:神经符号协同增强、多模型协同增强、自我反思增强等
5. 未来工作展望
6. 总结

听众收益:
1. 掌握大模型推理能力向小模型高效迁移的关键技术路径;
2. 了解如何通过蒸馏与增强技术实现低成本、高性能的协同推理系统;
3. 可获得构建轻量化推理模型的最新方法,以及该领域未来发展的主要方向与实践启示。