面向大小模型协同的推理能力蒸馏与增强技术
主题介绍:\n
本次分享聚焦大模型与小模型协同推理中的能力迁移与增强技术,旨在解决大模型计算成本高而小模型推理能力不足的问题。\n
1. 探讨长思维链、思维链能力内化等大模型推理关键技术;\n
2. 介绍团队在推理能力蒸馏和推理能力增强两方面的最近研究成果;\n
3. 对未来的技术发展趋势和应用前景进行展望。\n
\n
主题大纲:\n
1. 研究背景\n
2. 推理大模型关键技术:长思维链,思维链能力内化等\n
3. 推理能力蒸馏技术:CoT蒸馏、样例学习蒸馏、神经符号蒸馏等\n
4. 推理能力增强技术:神经符号协同增强、多模型协同增强、自我反思增强等\n
5. 未来工作展望\n
6. 总结\n
\n
听众收益:\n
1. 掌握大模型推理能力向小模型高效迁移的关键技术路径;\n
2. 了解如何通过蒸馏与增强技术实现低成本、高性能的协同推理系统;\n
3. 可获得构建轻量化推理模型的最新方法,以及该领域未来发展的主要方向与实践启示。\n