WOT全球人工智能技术峰会-51CTO.COM

出品人

围绕大模型的智能风控体系

主题介绍：\n 随着大模型技术的发展，风控体系正在从传统基于规则、特征、机器学习、深度学习、大模型的审核方式，向更加智能、自动化的方向演进。传统风控手段在处理复杂场景、隐晦违规表达、多模态内容等方面存在局限性。大模型的引入使审核转向深度语义理解和多模态分析，大幅提升了系统对文本、图像、视频等多模态数据的解析能力，实现更加精准、高效的审核。本次演讲将基于风控核心业务场景，如广告内容审核、风险检测等，深入探讨大模型如何开展内容识别（控风险）、提升审核效率（提效率）、增强审核可解释性（促体验），并剖析大模型在训练、推理、部署、决策优化等全方面面临的技术挑战和解决方案。\n \n 主题大纲：\n 1. 围绕大模型对文本、图像、视频多种模态深度语义理解能力，建设风控自研大模型基座，提升风控体系对复杂风险场景的理解能力，构建精准的风险检测能力；\n 2. 基于大模型的强大学习能力，对不同模态的内容进行深度学习，增强对违规文本、隐晦表达、图像风险元素、视频场景理解的识别能力，提高审核覆盖面；\n 3. 利用大模型提升审核效率，优化人工审核流程，辅助人工快速审核，增强审核结果的可解释性，推动审核向智能化、自动化升级；\n 4. 探索大模型在风控应用中的训练方法、推理部署优化、决策链路改进，提高模型的稳定性、时效性和可控性，降低误判率，提升整体风控体系的可靠性，为大模型相似场景应用提供解决思路；\n 5. 探讨大模型在风控领域的发展方向与实践路径，包括模型轻量化、跨模态融合、风险识别能力增强、可控性优化等，推动风控审核技术的持续升级。\n \n 听众收益：\n 1. 了解大模型在风控审核中的应用价值和发展趋势；\n 2. 了解大模型在风控审核中的技术挑战和优化方向；\n 3. 了解大模型在内容识别、风险检测上的发展路径与实践经验。\n

尹宇阳

腾讯高级算法研究员

多模态大模型动态训练与推理优化的协同实践

主题介绍：\n 本次分享将集中于大模型与多模态技术演进及强化学习问题的探讨，系统性地回顾其演进路径，并深入探讨以下关键方向：\n 1. 课程学习（Curriculum Learning）：从静态数据采样到动态难度调整，如何通过渐进式训练策略提升模型收敛效率；\n 2. 针对思维优化如何缓解“过度思考”（Overthinking）问题进行分析，探索推理步骤与模型性能的平衡；\n 3. 推理加速MTP；\n 4. 模型效果提升Infer Scaling的实践；\n 5. 强化学习结合大模型GRPO。\n \n 主题大纲：\n 1. 系统性地回顾大模型和多模态大模型演进路径、训练方法；\n 2. 课程学习（Curriculum Learning）：从静态数据采样到动态难度调整，如何通过渐进式训练策略提升模型收敛效率；\n 3. 思维优化如何缓解“过度思考”（Overthinking）问题分析，探索推理步骤与模型性能的平衡；\n 4. 强化学习结合大模型GRPO；\n 5. 推理加速MTP；\n 6. 模型效果提升Infer Scaling的实践。\n \n 听众收益：\n 了解强化学习发展路径以及后续问题，多模态大模型发展及现有问题。

付超

美图算法专家

多模态大模型在美图视频混剪系统中的应用实践

主题介绍：\n 本次分享将深入探讨多模态大模型如何革新视频混剪的创作方式以及在美图视频混剪中的应用。\n 多模态大模型凭借其强大的理解能力，精准分析视频内容、快速提炼核心玩法与卖点，自动生成创意脚本。通过将脚本与视频高光时刻精准匹配，并添加特效，实现高效、亮眼的自动化混剪。这不仅大大提升了创作效率，还为内容生产带来了全新的可能性。\n \n 主题大纲：\n 1. 传统视频混剪的挑战与多模态大模型的新范式；\n 2. 多模态大模型如何理解视频内容；\n 3. 从理解到创意脚本的生成；\n 4. 脚本与画面智能匹配；\n 5. 多模态大模型的训练和效果优化；\n 6. 多模态大模型的未来发展和应用展望。\n 听众收益：\n 学习和了解视频混剪的流程，以及多模态模型在美图视频混剪中的实践经验。\n

李永彬

潞晨科技北京公司总经理

Open-Sora: 以百万元成本训练商用级AI视频生成模型

主题介绍：\n 最新发布的Open-Sora 2.0模型，仅用百万元人民币成本，成功训练出达到商业级质量的百亿参数视频生成大模型。本次分享将让听众了解AI视频生成模型的社区动态与OpenSora的前沿技术细节，可动手微调部署进行开发或生产个性化的视频素材。\n \n 主题大纲：\n 1. AI视频生成模型\n 2. Open Sora\n 3. Open Sora技术详解\n 4. 性能表现\n 5. 未来规划\n

关于我们