wot
添加小助手
咨询活动详情
World Of Tech 2025
出品人详情
2025/07/18-19 北京·粤财JW万豪酒店
刘挺
美图 高级技术总监

美图智能部高级技术总监,技术负责人,负责业务包括美图内容中台和数据中台的建设,内容理解、推荐、搜索在美图业务的智能化应用,同时专注于大模型在各业务场景中的应用解决方案,带领团队完成多个AIGC项目的产品落地。

专题:多模态大模型技术与应用

当今时代,多模态、更自然地交互体验成为了大模型技术产品化并为更多人所接受的关键。本专题将着重探讨多模态大模型技术从“单一感知”迈向“多模态认知”的技术创新和应用。邀请嘉宾以多模态大模型技术为核心,分享如何突破感知、认知和决策的交互问题,实现更智能、更自然的交互体验。
宫兆汉
快手 商业化内容算法技术负责人
围绕大模型的智能风控体系
主题介绍:
随着大模型技术的发展,风控体系正在从传统基于规则、特征、机器学习、深度学习、大模型的审核方式,向更加智能、自动化的方向演进。传统风控手段在处理复杂场景、隐晦违规表达、多模态内容等方面存在局限性。大模型的引入使审核转向深度语义理解和多模态分析,大幅提升了系统对文本、图像、视频等多模态数据的解析能力,实现更加精准、高效的审核。 本次演讲将基于风控核心业务场景,如广告内容审核、风险检测等,深入探讨大模型如何开展内容识别(控风险)、提升审核效率(提效率)、增强审核可解释性(促体验),并剖析大模型在训练、推理、部署、决策优化等全方面面临的技术挑战和解决方案。

主题大纲:
1. 围绕大模型对文本、图像、视频多种模态深度语义理解能力,建设风控自研大模型基座,提升风控体系对复杂风险场景的理解能力,构建精准的风险检测能力;
2. 基于大模型的强大学习能力,对不同模态的内容进行深度学习,增强对违规文本、隐晦表达、图像风险元素、视频场景理解的识别能力,提高审核覆盖面;
3. 利用大模型提升审核效率,优化人工审核流程,辅助人工快速审核,增强审核结果的可解释性,推动审核向智能化、自动化升级;
4. 探索大模型在风控应用中的训练方法、推理部署优化、决策链路改进,提高模型的稳定性、时效性和可控性,降低误判率,提升整体风控体系的可靠性,为大模型相似场景应用提供解决思路;
5. 探讨大模型在风控领域的发展方向与实践路径,包括模型轻量化、跨模态融合、风险识别能力增强、可控性优化等,推动风控审核技术的持续升级。

听众收益:
1. 了解大模型在风控审核中的应用价值和发展趋势;
2. 了解大模型在风控审核中的技术挑战和优化方向;
3. 了解大模型在内容识别、风险检测上的发展路径与实践经验。
尹宇阳
腾讯 高级算法研究员
多模态大模型动态训练与推理优化的协同实践
主题介绍:
本次分享将集中于大模型与多模态技术演进及强化学习问题的探讨,系统性地回顾其演进路径,并深入探讨以下关键方向:
1. 课程学习(Curriculum Learning):从静态数据采样到动态难度调整,如何通过渐进式训练策略提升模型收敛效率;
2. 针对思维优化如何缓解“过度思考”(Overthinking)问题进行分析,探索推理步骤与模型性能的平衡;
3. 推理加速MTP;
4. 模型效果提升Infer Scaling的实践;
5. 强化学习结合大模型GRPO。

主题大纲:
1. 系统性地回顾大模型和多模态大模型演进路径、训练方法;
2. 课程学习(Curriculum Learning):从静态数据采样到动态难度调整,如何通过渐进式训练策略提升模型收敛效率;
3. 思维优化如何缓解“过度思考”(Overthinking)问题分析,探索推理步骤与模型性能的平衡;
4. 强化学习结合大模型GRPO;
5. 推理加速MTP;
6. 模型效果提升Infer Scaling的实践。

听众收益:
了解强化学习发展路径以及后续问题,多模态大模型发展及现有问题。
付超
美图 算法专家
多模态大模型在美图视频混剪系统中的应用实践
主题介绍:
本次分享将深入探讨多模态大模型如何革新视频混剪的创作方式以及在美图视频混剪中的应用。
多模态大模型凭借其强大的理解能力,精准分析视频内容、快速提炼核心玩法与卖点,自动生成创意脚本。通过将脚本与视频高光时刻精准匹配,并添加特效,实现高效、亮眼的自动化混剪。这不仅大大提升了创作效率,还为内容生产带来了全新的可能性。

主题大纲:
1. 传统视频混剪的挑战与多模态大模型的新范式;
2. 多模态大模型如何理解视频内容;
3. 从理解到创意脚本的生成;
4. 脚本与画面智能匹配;
5. 多模态大模型的训练和效果优化;
6. 多模态大模型的未来发展和应用展望。
听众收益:
学习和了解视频混剪的流程,以及多模态模型在美图视频混剪中的实践经验。
李永彬
潞晨科技 北京公司总经理
Open-Sora: 以百万元成本训练商用级AI视频生成模型
主题介绍:
最新发布的Open-Sora 2.0模型,仅用百万元人民币成本,成功训练出达到商业级质量的百亿参数视频生成大模型。本次分享将让听众了解AI视频生成模型的社区动态与OpenSora的前沿技术细节,可动手微调部署进行开发或生产个性化的视频素材。

主题大纲:
1. AI视频生成模型
2. Open Sora
3. Open Sora技术详解
4. 性能表现
5. 未来规划