World Of Tech 2023
出品人详情
2023/06/16-17 北京·粤财JW万豪酒店
新技术
瞰未来
赵健博
快手 大数据计算与存储团队负责人

大数据领域专家,快手大数据计算与存储团队的负责人,目前负责快手大数据调度、计算、以及非结构化存储领域系统的研发与应用。

专题:大数据技术创新

贵宾会议室

对于企业来说,数据是最宝贵的资源。对于如何根据业务场景更高效地处理数据、利用数据,越来越多的数据架构团队做出了多维度的探索。本专题将重点关注创新的数据架构、大数据框架以及与AI结合的前沿大数据基础设施实践。
李劲松
阿里云 高级技术专家
Apache Paimon:Streaming LakeHouse 最新进展
目前业界主流数据湖存储格式项目都是面向 Batch 场景设计的,在数据更新处理时效性上无法满足 Streaming Lakehouse 的需求,因此 Flink 社区在一年多前内部孵化了 Flink Table Store 子项目——一个真正面向 Streaming 以及 Realtime的数据湖存储项目。2023年3月12日,Flink Table Store 项目顺利通过投票,正式进入 Apache 软件基金会 (ASF) 的孵化器,改名为 Apache Paimon (incubating)。 \n Apache Paimon (incubating) 是一项流式数据湖存储技术,可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。Paimon 采用开放的数据格式和技术理念,可以与 Apache Flink / Spark / Trino 等诸多业界主流计算引擎进行对接,共同推进 Streaming Lakehouse 架构的普及和发展。\n \n 主题大纲:\n 1. 湖存储技术的场景与特质\n 2. Paimon 的架构与核心优势\n 3. Paimon 的应用场景\n 4. Paimon 的后续探索\n 5. 总结和展望\n \n 听众收益:\n 1. 了解湖存储相关技术\n 2. 了解实时计算最新进展\n 3. 了解流式数据湖的应用场景\n
张静
快手 数据架构研发专家
数据湖在快手的生产实践
本次分享将重点介绍快手内部在HUDI数据湖技术上的生产实践。通过数据同步、数据更新和宽表拼接等典型业务场景的应用,说明如何用数据湖技术解决传统离线生产链路中的痛点,并优化效率、时效性和成本。最后介绍目前还存在的痛点和正在建设中的工作,并对未来的工作进行展望。这次分享的核心目标是突出数据湖技术在重塑离线生产方式中的关键作用。\n \n 主题大纲:\n 1. 简介:\n 快手内部数据生产链路的挑战和痛点\n 数据湖技术引入的动机和意义\n \n 2. 数据湖技术概述:\n 数据湖的基本概念和特点\n HUDI数据湖技术的优势和适用场景\n \n 3. 数据同步应用:\n 数据同步需求和挑战\n 基于 HUDI的数据同步解决方案和实践\n \n 4. 数据更新应用:\n 传统离线生产链路中的数据更新问题\n 基于HUDI实现增量数据更新的案例和经验\n \n 5. 宽表拼接应用:\n 宽表拼接在离线生产中的重要性和难点\n 基于HUDI建设大宽表的方案和实践\n \n 6. 未来展望:\n 目前的痛点\n 建设中的工作\n 未来工作\n \n 听众收益:\n 了解数据湖技术在数据同步、数据更新和宽表拼接等业务场景的经验\n 获得数据湖技术最新进展\n
喻兆靖
字节跳动 数据平台研发工程师
高性能实时入湖在字节跳动的实践
本次分享将重点介绍在字节跳动内部庞大的数据体量下,如何能够支持高性能的实时入湖,通过业务场景来阐述现有数据入湖方式存在的痛点,介绍目前字节跳动内部的对于实时入湖的优化,并说明如何使用这些优化来解决入湖时效性的问题。最后还将介绍未来整体规划以及希望达成的预期。\n \n 主题大纲:\n 1. LAS 介绍;\n 2. 实时数仓场景;\n 3. 生产落地与优化;\n 4. 未来规划\n
关于我们
About us
51CTO成立于2005年,以服务一亿数字化人才职业成长为己任。通过技术社区、技术博客和新媒体矩阵等综合产品服务体系,凝聚了2000万IT技术人员、50万位技术博主和近千家公司CTO。是中国知名的数字化人才学习平台和技术社区,并以规模大、用户多、技术门类全等特点为市场充分认可。
合作联系

媒体合作:15611889277

商务赞助:13801332155

商务邮箱:wj@51cto.com

议题提交:zhangxn@51cto.com

票务咨询

咨询电话:15611889277