World Of Tech 2023
参会嘉宾
2023/11/24-25 深圳·前海JEN酒店
李彬
美图 资深SRE工程师

现任美图资深SRE工程师,主要负责公司的多个业务线,包括美颜相机、宜肤、美图设计室和实验室Mtlab等的业务运维工作。对多云环境有着丰富的经验和深入的理解,熟悉并实际操作过阿里云、腾讯云、华为云、火山云、AWS、Azure、GCP等主流云平台。在多云管理、运维自动化、系统优化等方面积累了丰富的经验,并持续探索技术的最新发展和最佳实践,致力于推动公司业务的稳定运行和技术创新。

演讲主题:美图:AIGC运维之旅的探索和挑战

JEN3厅

主题介绍:\n 1. 探索算力的多维世界:选择与应用的艺术\n 在AI的世界中,算力展现出无尽的多样性和复杂性。我们将深入探讨不同类型的GPU和NPU(例如昇腾)之间的独特差异,以及如何基于特定的算法需求,作出最佳的算力选择。\n 2. 精细化的训练与推理集群管理:巧妙平衡成本与效益\n 训练与推理集群各自蕴含着独特的管理巧思。在这一部分,我们将剖析这两者在日常交付、权限控制和成本监控等方面的管理差异,特别是在面对训练集群高昂成本的挑战时,如何实施精细化管理。\n 3. 赋能多云生态:揭示标准化管理的力量\n 标准化是实现多云管理的金钥匙。本环节将探讨如何通过实施标准化流程和协议,实现多云环境中的流畅交付和协同。\n 4. 流量的智能调度:自动化与智能化的完美融合\n 流量调度是多云环境中的核心艺术。我们将展示如何通过自动化和智能化技术,实现流量的精确调度和优化,确保资源的最大化利用和服务的最优性能。\n 5. 安全与合规:构建大模型训练集群的坚固防线\n 在大模型训练集群的运维中,安全与合规是至关重要的基石。本节将深入探讨在大模型训练过程中遇到的安全与合规问题,并分享如何通过实施有效策略,确保训练集群的安全稳固。\n \n 主题大纲:\n 1. 美图AIGC历程;\n 2. 多元算力的选择和应用;\n 3. 标准化赋能多云生态;\n 4. 多云管理和稳定性运营;\n 5. 多云流量调度 & 弹性伸缩;\n 6. 大模型安全和成本建设;\n \n 听众收益:\n 1. 通过实际案例来分享不同算力对业务的影响,帮助听众在多样性选择的时候做出更加合适的决定;\n 2. 如何在多云环境中试试标准化管理和流程,掌握多云管理的最佳实践和标准,从而更加高效和一致的管理多云环境;\n 3. 学会如何实现流量的精确调度和优化,确保业务稳定运行;\n 4. 深入了解大模型训练中可能遇到的安全风险,如何制定有效的安全策略以及开展更好的成本优化;\n