wot
添加小助手
咨询活动详情
World Of Tech 2025
出品人详情
2025/07/18-19 北京·粤财JW万豪酒店
陶阳宇
腾讯TEG 机器学习平台部总监

腾讯TEG 机器学习平台部总监,大模型一站式平台负责人。研发腾讯Angel系列AI框架,支持海量数据、万卡规模GPU集群的模型训练、推理部署,服务腾讯混元大模型、广告/内容推荐、金融风控等业务场景。

专题:大模型高效推理与性能优化

伴随DeepSeek等国内外众多开源大模型的快速发展,不论是学术界还是企业界都在关注如何用好DeepSeek等大模型,因为大模型的推理效率和性能优化是制约大模型在企业大规模落地应用的关键挑战之一。本专题将深入解析大模型推理加速的核心技术,包括模型压缩、量化、剪枝、蒸馏等。此外,也将邀请嘉宾分享大模型在企业实际业务场景中的性能优化经验,探讨如何平衡模型性能和业务需求。
向乾彪
腾讯 推理架构师
腾讯混元AngelHCF的优化与落地实践
主题介绍:\n 腾讯 AngelHCF 推理加速框架针对混元 LLM 大语言模型做了深度推理优化,结合全新的 Hybrid 模型结构整体上取得了不错的推理成本优势,支撑元宝线上混元模型上万卡推理。同时,AngelHCF 支持 PD 分离部署,针对 P 和 D 的推理特性分别采用不同的切分策略,叠加框架原有的模型压缩、并行解码等优化手段,显著降低线上推理成本。结合全新的Turbos 模型结构,本次分享将从不同角度介绍腾讯混元推理加速框架 AngelHCF 所做的一些针对性优化。\n \n 主题大纲:\n 1. 混元模型 & AngelHCF 推理加速框架介绍;\n 2. AngelHCF 推理框架性能优化具体实践;\n 3. 混元全新 Turbos 模型及其对应优化;\n 4. PD 分离部署结合特定切分策略极致优化;\n 5. 总结与展望。\n \n 听众收益:\n 1. 了解混元 Turbos Hybrid 结构带来的性能收益以及针对性的推理优化手段;\n 2. 了解 PD 分离结合超大规模 MoE 模型切分策略的优化方法。\n
黄彬
网易云音乐 算法平台专家&计算引擎团队负责人
网易云音乐生成式推荐模型工程优化实践
主题介绍:\n 在数字经济与人工智能技术深度融合的今天,推荐系统已成为平台提升用户体验、增强用户粘性的核心技术引擎。传统推荐系统以判别式推荐​​为主导,但受限于被动响应用户历史行为,难以挖掘潜在需求与长尾内容和冷启动困境。随着Transformer等生成式模型的突破,​​生成式推荐​​通过建模用户历史序列与目标token的联合概率分布 ,并利用自注意力机制解析长序列行为,能更加精准的发掘用户兴趣。\n 本次分享将重点介绍网易云音乐推荐范式从判断式到生成式的范式跃迁,以及如何解决生成式模型在大规模部署应用中面临的诸多问题,并总结出一些性能优化的方法论。\n \n 主题大纲:\n 1. 网易云音乐从判别式推荐到生成式推荐的越迁;\n 2. 生成式推荐模型的落地痛点;\n 3. 性能优化与落地实践总结,包括:减少跨机数据通信;提升计算访存比;异构硬件计算等。\n \n 听众收益:\n 1. 了解生成式模型在推荐场景的应用落地;\n 2. 了解生成式模型的性能优化方法。\n
神秘嘉宾
敬请期待
神秘嘉宾
敬请期待