2025 年 5 月 19 日至 23 日,数据库领域的三大重要国际会议之一的 ICDE 2025( 41st IEEE International Conference on Data Engineering )在香港召开。本届会议汇聚了 850 多位全站学者、工业界专家及技术从业者参与,共同探讨数据工程技术前沿和应用实践。

OceanBase 通过在技术上持续深耕于创新,总计有6篇论文入选,这一数量刷新了 OceanBase 在单届国际顶会上论文入选的历史纪录。其中 1 篇论文首次获得大会"最佳工业与应用论文亚军"(Best Industry and Application Paper Runner Up)这一重要奖项,其技术价值获得了来自学术界和产业界的双重肯定。

此外,OceanBase 在 ICDE 2025 大会现场顺利举办以“AI 时代的数据库”为主题的技术研讨会,多位数据库和 AI 领域的资深学者、行业先锋参会发言,与现场嘉宾共同分享交流 Data × AI 领域的最前沿的学术进展与创新实践。

历史性突破,OceanBase 彰显科研硬实力

在本届 ICDE 2025 中,OceanBase 共有 6 篇论文入选,包括 2 篇 OceanBase 作为第一作者单位的论文,以及 4 篇与高校合作发表的论文,创下 OceanBase 学术成果在国际顶会中单届入选论文数量历史新高。

其中, OceanBase 作为第一作者单位,与来自高德地图、康奈尔大学(Cornell University)的研究团队共同发表的论文 OceanBase Unitization: Building the Next Generation of Online Map Applications 获得了 ICDE 2025 最佳工业与应用论文亚军(Best Industry and Application Paper Runner Up) 奖项,这也是 OceanBase 首次斩获 ICDE 大奖,实现历史性的学术突破。该论文创造性地提出了单元化的分布式数据库系统架构,通过独特的架构设计与动态优化方案,在高德地图落地实践,成功支撑其数据库系统高可靠、高并发、低延迟的业务需求,为现代分布式数据库技术在超大规模在线地图应用等复杂场景的落地提供了创新性的行业样本。

图片

入选论文名单:

OceanBase Unitization: Building the Next Generation of Online Map Applications (Best Industry and Application Paper Runner Up)

Authors:Quanqing Xu (OceanBase, Ant Group), Wei Sun (AMap, Alibaba), Chuanhui Yang (OceanBase), Jinlong Liu (AMap, Alibaba), Ziyun Wei (Cornell University), Fusheng Han (OceanBase), Liang Wang (Amap, Alibaba), xiaowei zhai (AMap, Alibaba)

分布式数据库系统被广泛用于为在线地图平台提供云服务,以提供一致性、灾难恢复和高性能。而传统的单机架构系统在大规模服务扩展方面面临挑战。本文提出了 OceanBase 单元化的架构设计,这是一个将服务和操作 “单元化” 到单个机器上的分布式数据库系统,从而确保机器离线时的数据复制和无缝的服务切换。为了进一步解决区域之间的通信开销问题,OceanBase 将读写操作单元化,采用混合集中式和单元化方法,并针对在线事务处理 (OLTP) 和在线分析处理 (OLAP) 进行了动态优化。研究团队将该单元化系统在高德地图上完成部署并进行实验测试,结果表明该系统展现出很强的容灾能力,并在写密集型和读密集型基准测试中均实现了性能提升。

https://www.computer.org/csdl/proceedings-article/icde/2025/360300e183/26FZCoh4LOU

How to Answer Secure and Private SQL Queries?

Authors: Qiyao Luo (OceanBase), Quanqing Xu (OceanBase, Ant Group), Chuanhui Yang (OceanBase)

本文探讨如何综合运用安全计算与差分隐私技术,在回答数据库查询的同时确保数据的安全性与隐私性。论文对安全计算如何保护查询过程进行了详细解读,特别是通过模块化方法分解复杂查询语句,实现安全高效的计算,并分析了差分隐私的双重作用——既可以与安全计算结合,实现从计算过程到结果的完整保护,又可适当降低保护强度,以优化计算效率。

https://www.computer.org/csdl/proceedings-article/icde/2025/360300e486/26FZCFh1nMs

Hounding Data Diversity: Towards Participant Selection in Vertical Federated Learning

Authors: Xiaokai Zhou (Wuhan University); Xiao Yan (Centre for Perceptual and Interactive Intelligence); Fangcheng Fu (Peking University); Xinyan Li (Wuhan University); Hao Huang (Wuhan University); Quanqing Xu (OceanBase, Ant Group); Chuanhui Yang (OceanBase); Bo Du (Wuhan University); Tieyun Qian(Wuhan University); Jiawei Jiang (Wuhan University)

本论文针对现有纵向联邦学习中参与者选择存在高成本和多样性缺失的问题,提出了具有子模优化性质的 VFPS-SM 框架。通过采用 KNN 作为代理模型,分析其似然函数的子模性质,有效将参与方选择问题转化为子模函数最大化问题,从而优化参与方选择过程。结合 top-k 查询算法与同态加密技术,VFPS-SM 在提高效率的同时,保障了数据隐私。实验结果表明,VFPS-SM 在多个模型和数据集上显著提升了选择效率(最高达 365 倍)和训练效率(最高达 35 倍),并通过多样性选择机制提升了模型准确率(最高提升 6.0%),验证了其在实际应用中的强鲁棒性和实用价值。

https://www.computer.org/csdl/proceedings-article/icde/2025/360300c810/26FZBet83L2

Efficient Structural Clustering over Hypergraphs   

Authors: Dong Pan (Hunan University); Xu Zhou (Hunan university); Lingwei Li (Hunan University); Quanqing Xu (OceanBase, Ant Group); Chuanhui Yang (OceanBase); Chenhao Ma (The Chinese University of Hong Kong, Shenzhen); Kenli Li (Hunan University)

基于经典结构聚类模型 SCAN 在超图聚类时无法捕捉其独特结构信息的背景,论文提出专为超图设计的一种新型结构聚类模型 HSCAN,同时设计顺序索引加速关键信息提取,以及轻量级相似桶索引以降低索引成本。此外,论文还提出基于索引的高效序贯查询算法和用于处理大型超图的并行查询算法,并给出了两种索引的构建算法。实验表明,HSCAN 性能优于现有模型,且两种基于索引的查询算法比现有算法快三个数量级。

https://www.computer.org/csdl/proceedings-article/icde/2025/360300d480/26FZBLZdp1m

Query Weak Equivalence and Its Verification in Analytical Databases

Authors: Jinguo You (Kunming University of Science and Technology); Wanting Fu (Kunming University of Science and Technology); Yuxuan Wang (Kunming University of Science and Technology); Peilei He (Kunming University of Science and Technology); Kaiqi Liu (Kunming University of Science and Technology); Quanqing Xu (OceanBase, Ant Group )

论文提出“查询弱等价”概念,并引入Query Lattice,用于识别在 OLAP 等以读操作为主的场景下结果相同但非语义等价的查询,从而挖掘更多已存储查询来响应未来的未知查询,避免重复生成查询计划和执行。实验评估表明,在 TPC-H 和 TPC-H Skew 基准测试的数据集上运行时,与原始 PostgreSQL 相比,Query Lattice 的最大改进幅度达 44.95%。

https://www.computer.org/csdl/proceedings-article/icde/2025/360300b882/26FZArK5goo

Artemis: A Customizable Workload Generation Toolkit for Benchmarking Cardinality Estimation

Authors: Zirui Hu (East China Normal University); Rong Zhang (East China Normal University); Chengcheng Yang (East China Normal University); Xuan Zhou (East China Normal University); Quanqing Xu (OceanBase, Ant Group ); Chuanhui Yang (OceanBase)

基数估计对查询优化至关重要,该论文提出 Artemis,一款可定制的工作负载生成器,可生成包含数据依赖、复杂 SQL 结构和多样基数等特征的多种场景。Artemis 采用基于主键的确定性数据生成机制来描绘不同数据特征,提出基于搜索的工作负载生成方法来构建复杂度各异的查询,并通过约束优化实现更低成本的基数计算。

https://www.computer.org/csdl/proceedings-article/icde/2025/360300e628/26FZD0CCVji

学术界+工业界,共赴 Data × AI 前沿探讨

5 月 20 日,在 ICDE 2025 会议现场,OceanBase 举办了题为“AI 时代的数据库”的技术研讨会(OceanBase Technical Symposium on Database in the Al Era),多位数据库与 AI 领域的专家学者与行业先锋出席演讲,共同分享并交流 Data × AI 领域的前沿进展。

在本次研讨会中,香港中文大学系统工程系于旭教授深入 AI 与关系型数据库的前沿进展,分享了图与神经网络在 AI 时代如何使能传统关系型数据管理系统实现优化升级;香港科技大学(广州)信息枢纽院长陈雷教授基于大模型时代背景,从向量嵌入、索引和检索等角度剖析了向量数据库的动态演变;东北大学国家示范性软件学院院长杨晓春教授结合数据库与 AI 技术,深入解读了跨模态检索的技术内涵与前沿进展;金融壹账通香港分公司总经理凌霄先生立足行业实践,详细介绍了基于 DeepSeek 的 Chat BI 如何驱动 AI 与商业智能分析的融合与落地;OceanBase CTO 杨传辉先生聚焦数据底座,深入讲解了 OceanBase 在打造一体化 AI 数据底座方面的思考与实践。

图片

图片

图片

图片

图片

图片

依次是会议现场和于旭、陈雷、杨晓春、凌霄、杨传辉的演讲图

此外,OceanBase 在 ICDE 2025 会议期间还进行了论文宣讲、圆桌研讨、教程解读等多项学术分享活动,为与会者呈现了数据库最前沿的学术动态与实践路径,也为推动行业进步提供了创新性的应用思路与研究方向。

近年来,OceanBase 在国际顶会上的论文发表量逐年提升,截至目前,论文被引量已达到 198 次。ICDE 2025 的突破不仅是 OceanBase 学术影响力的里程碑,更标志着 OceanBase 作为中国的分布式数据库,在技术与工业领域再次获得国际认可。特别是基于 Data × AI,OceanBase 在 AI 技术赋能数据库(AI4DB)与 AI 一体化数据底座(DB4AI)领域不断探索创新,推动数据库技术成为智能时代的核心基础设施。

未来,OceanBase 将继续投入产学研协同创新,推进论文成果的落地应用,驱动 AI 时代企业的数字化转型,为用户提供更高效、更稳定的数据库服务。

Logo

了解最新的技术洞察和前沿趋势,参与 OceanBase 定期举办的线下活动,与行业开发者互动交流

更多推荐