2024大数据的前沿项目有哪些?
ChatBI+Agent数据分析新范式落地如何?
基于大模型的金融领域应用探索
1月17日,在DataFun策划的
首届数据与人工智能解决方案大会
上,将为您带来深度的分享,一起交流大数据、数据分析、大模型、Data+AI领域关于数据编织、数据指标、数据湖、元数据管理、Agent、RAG、ChatBI等的前沿解决方案,会议将全程直播,欢迎大家识别二维码,免费预约直播:
郑云红 阿里云 研发工程师
个人介绍:郑云红,阿里云计算有限公司研发工程师,毕业于电子科技大学,2022 年加入阿里云 Flink SQL 引擎团队,是 Fluss 存储引擎,Flink SQL 模块的核心开发和 Apache Flink Contributor。2023 年开始专注于 Fluss 存储引擎的开发,作为 Fluss 核心开发,主要聚焦于 Fluss 的日志存储、远程存储模块。
演讲题目:Fluss: 新一代流存储核心技术解析
演讲介绍:Fluss 是一款为流计算设计的下一代流存储,具备毫秒级流读流写、实时更新、CDC日志订阅、流式列裁剪、湖流一体等特性。本次议题我们将为大家介绍 Fluss 诞生的背景,Fluss 是如何解决传统流存储与 Flink SQL 构建实时数仓的诸多问题的,如双流Join大状态、数据不可查、去重成本高等痛点问题。并重点解读 Fluss 核心功能的实现原理,通过 Benchmark 结果和用户案例分析 Fluss 的主要应用场景和收益。
演讲提纲:
1. Fluss 诞生的背景
2. Fluss 的核心功能与实现原理
2.1 架构与组件
2.2 列裁剪
2.3 Delta join
2.4 湖流一体
3. Fluss 未来规划
听众收益:
1. 了解到什么是 Fluss
2. Fluss 的适用场景和能解决的问题,Fluss 与 Kafka 的区别
3. Fluss 核心功能的实现原理
落地挑战和方案重点:
1. 如何解决 Kafka 不支持更新,不支持数据探查,网络成本高的问题?
2. 如何解决 Flink 双流 join state 成本大,难运维的问题?
3. 如何高效的实现湖和流结合?
张力 快手 数据引擎架构师
个人介绍:在快手数据平台部负责Spark和Blaze向量化引擎的研发和维护,曾任职于百度、滴滴、蚂蚁集团等一线互联网公司,对大数据技术体系有较丰富的经验。
演讲题目:Spark 向量化加速引擎 Blaze 的技术实现与应用案例
演讲介绍:Blaze 是快手自研的基于向量化技术开发的一套 native 执行引擎,执行过程充分利用 native 代码和 SIMD 指令向量化计算的优势,实现在用户无感知或少感知的情况下给 Spark SQL 作业带来显著的性能提升。目前 Blaze 已经在快手内存大规模落地并取得超预期收益,随着项目开源,目前也有一些公司参与使用和共建 Blaze,本次分享将介绍 Blaze 在技术上的实现以及在生产实践中的使用案例。
演讲提纲:
1. Spark 向量化计算在业界的探索
2. Blaze 引擎的主要技术路线、相比业界主流引擎的优势
3. Blaze 引擎在生产实践中的使用案例
听众收益:
1. 了解 Spark + 向量化计算当前业界趋势。
2. 了解如何通过 Blaze 引擎落地到生产环境,对线上大数据计算进行提速。
余俊 Aloudata(大应科技)合伙人 & 技术 VP
个人介绍:余俊,Aloudata 合伙人 & 技术副总裁。拥有 18 年互联网技术和大数据平台相关架构经验。作为主架构师及核心研发主导并完成了 Alibaba B2B 首个海量分布式 KV 存储系统,作为网站架构师负责 Aliexpress 全球买全球卖交易系统的第一代架构设计。曾任蚂蚁集团大数据研发平台技术负责人。从零开始主导完成蚂蚁第一和第二代数据研发平台产品体系的建设,涵盖数据集成、研发、运维、质量基线及资产平台等完整数据研发平台产品体系,支撑蚂蚁数以千计的 ETL 研发工程师,搭建了蚂蚁面向金融行业的逻辑化智能数据研发平台,有丰富的海量数据及智能化数仓的落地实践经验。
演讲题目:数据编织的应用场景
演讲介绍:数据编织(Data Fabric)作为一种创新的数据管理架构理念,自 2019 年起 Gartner 便在其数据技术趋势报告中多次提及,并在 2024 年的数据管理技术成熟度曲线中显著提升了其成熟度,预测在未来 2-5 年内将实现广泛应用。与此同时,众多企业也开始积极探索数据编织的应用场景和落地路径,却苦于缺乏清晰可参考的实践方法论与价值评估标准。本次分享将结合 Aloudata 的真实案例,介绍数据编织的五大应用场景和相应的最佳实践。
演讲提纲:
1. 数据编织的技术机制
2. 数据编织的五大应用场景与实践案例
听众收益:
1. 了解数据编织的核心机制
2. 了解数据编织的五大落地场景
3. 参考相关行业客户实践案例
金铎 百望股份有限公司 数据咨询专家、咨询方案副总经理
个人介绍:华东江苏大数据交易所数据资产专委会专家委员,大数据与人工智能领域老兵,在金融、汽车、零售、供应链等领域具备丰富的实战经验。曾担任奔驰汽车金融首席数据治理官,京东智能供应链解决方案总监等岗位。在数据要素大市场中,聚焦在从企业级数据治理,数据资产入表到数据资产交易流通变现等主要环节。
演讲主题:数据要素流通驱动企业业务增值
演讲介绍:国家从“顶层设计到实施细则”的各项政策正在逐步激活数据要素潜能。我们将为大家介绍从数据资源化到数据资产化、数据资本化,再到数据产品变现,企业如何能实现数据的合法合规的开发、利用与价值变现。同时,分享百望云在泛零售领域的大数据与AI模型的探索应用,为企业业务增长与数字化转型赋能方案。
演讲提纲:
1. 数字经济时代下,数据要素市场与企业数字资产运营
2. 数据资源化、数据资本化与数据产品变现的价值实现
3. 从数据要素流通到数据资产运营:方案、策略与建议
4. 泛零售领域AI+大数据应用模式探索,驱动业务增长
听众收益:本次演讲将剖析数字时代下数据要素对企业发展的核心价值与战略意义,同时将系统地探讨确保数据合规合法开发、共享、交互及交易的关键要点与策略,助力企业规范数据管理。同时,重点解读企业数据资产入表的实施流程与数据要素互联互通的实现机制,旨在提升企业的运营效率、市场响应速度及数据驱动的决策能力,进而强化企业在数字经济时代的竞争力和可持续发展动力。
落地挑战与方案重点:
1. 从数据资产盘点登记、数据要素交换变现、数据驱动业务增长的端到端互联
2. 价值数据赋能业务增长的关键在于数据、场景和模型的融合
岑润哲 数势科技 数据智能产品总经理
个人介绍:岑润哲,现任数势科技数据智能产品总经理,前头部互联网公司资深量化运营负责人,多年零售与金融行业数据挖掘与用户运营策略设计经验,曾为多家大型企业搭建从目标设定、数据诊断、策略设计到优化复盘的全链路数字化运营平台。
演讲题目:数据分析 Agent 在零售和金融领域的解决方案与落地应用
演讲介绍:数据分析与洞察是企业利用大模型提升角色效率的重要场景,本次演讲我们将重点分享Data Agent 在这两个方面的先进解决方案与技术。同时,此次分享我们也将聚焦银行、零售连锁门店两个具体行业,分享最佳实践,助力企业在数字经济时代实现创新突破与降本提效。
演讲提纲:
1. 企业数据分析与洞察的难点和挑战:取数不准、分析简单、洞察不够深入、与业务决策出现断层
2. 常见解决方案的技术路线:NLP2SQL、NLP2Python、NLP2API,前两者不能完全满足,数势科技选择:NLP2API - 基于现有产品的语义层开放出独立的 API 用于扩展应用
3. 分析与洞察 AI Agent 落地最佳解决方案:
· 技术架构设计和关键点
· 如何设计数据语义层,让大模型更懂数据
· 落地中的难点以及如何解决:query改写,记忆存储和召回,任务规划穿越,时间推理不准确,提高工具调用效果等
4. 最佳实践分享:
· 茶饮品牌案例:利用数据分析 Agent 满足门店督导、单品分析等核心业务场景需求,促进企业数字化升级
· 城商行案例:利用数据分析 Agent 灵活取数用数,实现数据价值民主化
5. 未来展望:大模型 Agent + 数据分析领域解决方案的未来发展方向
听众收益:
1. 行业前瞻性知识:了解大模型+Agent技术在数据智能分析领域最前沿的解决方案和实践。
2.实际操作策略:学习如何融合AI Agent与数据语义,实现数据洞察。
3.商业转型见解:获取启发,为企业利用人工智能技术在数据分析领域的技术探索和解决方案创新方面提供方向。