5 月 17 日,“第三届 OceanBase 开发者大会”在广州四季酒店顺利举行。OceanBase CEO 杨冰在主论坛开场演讲中,分享了 OceanBase的发展历程,开源生态建设的最新进展,和面对AI新时代,OceanBase的战略布局。

杨冰表示,经过四年的开源实践,OceanBase 已经形成超过 25000 开发者的活跃社区,开源下载量超过 100 万。这些数字背后,是社区建设的开发者们对OceanBase的沉甸甸的信任和支持。

谈到 AI 时代的发展方向,杨冰表示 OceanBase 将聚焦四个关键领域:向量存储、数据融合、实时推理和弹性架构。同时,将开放更多技术场景,与全球开发者一起打造更开放的数据库生态,共同探索和创造数据库技术的新未来。


以下是开发者大会中杨冰的演讲全文:

图片

各位开发者朋友们、媒体朋友们,大家上午好,我是 OceanBase 的杨冰,非常高兴在 2025 OceanBase 开发者大会与大家相聚广州。每次站在这里,看到台下既有一路陪伴的老朋友,又有越来越多加入数据库技术探索的新朋友,我都非常感慨。这是技术人的一次狂欢,特别是数据库圈小伙伴们的一次盛宴,在这里,我们一起探索新的领域。

OceanBase 和开发者的双向奔赴

2021 年 6 月 1 号,OceanBase 正式开源。当时很多人问我,开源并不是一条容易的路,你们团队准备好了吗?社区准备好了吗?产品准备好了吗?老实说那个时候心里并没有底,只想让更多开发者参与讨论 OceanBase,并让 OceanBase 进入到更多场景中,从而更快成熟。

从一开始无人问津,到如今下载量突破 100 万次、参与共建的开发者超过 25000 名,这段历程就像一场“闯关升级”。

  • 过去两年,OceanBase 共举办了 200 多场线下活动,吸引了近 1300 多名开发者,足迹遍布十几个城市,甚至走出国门与全球开发者一起交流狂欢。
  • OceanBase 社区建设成立 7 个 SIG 小组,包括 AI、智能诊断、云原生等方向,其中,智能诊断的小组超过 1/3 以上的代码由外部开发者贡献,外部开发者人数达到 2/3。
  • 社区版集群数量从个位数跃升至 50000+,且以每周 1400+ 的速度持续增长。更有 1500 多家企业客户将 OceanBase 应用于生产系统,其中也包括核心系统。Top 10 客户在生产系统上的 CPU 核数近 12 万颗。

这些数字背后是开发者们对 OceanBase 沉甸甸的信任。中国联通的张承基老师、知乎的代晓磊老师等企业开发者深度参与到 OceanBase 的共建中,他们不仅将 OceanBase 深度应用到企业的生产业务系统,更成为 OceanBase 的技术布道者。

我认为开发者是 OceanBase 的灵魂伴侣,感谢社区里熬夜贡献代码、主动回答问题、提交漏洞的 OceanBase “守护者联盟” ,你们的意见和建议让 OceanBase 更快成长。同时也感谢行业的应用开发者们,感谢大家为 OceanBase 打磨行业最佳实践,让 OceanBase 能够成为支付、零售、智能制造、医疗、物流等核心业务场景的首选。

OceanBase 的一体化架构提供了一个更具扩展性的、面向未来的分布式底座,更适合构建现代数据架构。OceanBase 在社区建设、生态建设、内容建设以及全球化开发者社群建设方面,还有很长的路要走。接下来,我们也会着力打造一个更开放的社区,推出更易用的产品,构建面向全球开发者的社区。

AI 时代 OceanBase 的四大方向

面对近几年 AI 的快速变化,很多企业和开发者感到焦虑,但是数据软件开发的团队反而感到兴奋,因为数据的价值正在被放大。如果说过去 OceanBase 在海量数据存储、高并发的弹性扩展、高可用等层面的技术创新是一种从物理上突破存储计算瓶颈的变化,那么 AI 时代,数据库作为数据存储的软件,在存算边界的突破、知识的学习获取、应用的推理决策等方面的技术创新更像是一种底层基础设施发生化学变化的融合。

为了更好地适应 AI 时代的数据管理,OceanBase 制定了四大方向:

第一,成为“知识底座”,从一体化数据库到一体化 AI 数据底座。企业在 AI 时代的智能化转型,仅仅使用通用大模型是不够的,还需要一个更加了解企业内部运行数据和相关领域知识的内部知识库。就像当年 OceanBase 将 TP 和 AP 融合一样,如何将数据库和知识库融合,是 OceanBase 接下来要做的第一个方向。

要达成这一目标,最基础的是增强 OceanBase 的向量检索能力,进一步融合 RAG 等技术,使 OceanBase 成为一个动态的知识存储体系。因为数据随着企业运行不断更替,将企业知识数据与模型更新迭代结合起来,不断地微调和迭代,需要 OceanBase 在存储引擎以及模型的后训练、微调方面做深度融合。

第二,打破“数据次元壁”,融合多模态数据。AI 的发展让数据类型从单一结构化走向多元非结构化,如表格数字、聊天记录、评论信息、监控画面、音频记录等。但是数据价值的释放需要打破数据壁垒,将这些标量数据和向量数据跨类型融合。在此过程中,OceanBase 需要在数据存储的检索层以及查询引擎上进行技术突破。

第三,做 AI 的“靠谱参谋”,提高数据实时性与一致性。AI 很聪明,但是假如数据滞后或者错误,那么推理结果就会走偏。为了确保 AI 在推理的过程中实时获取精准数据,需要深度融合整套的推理引擎和数据存储,保障数据实时同步与一致性,让数据库成为 AI 更加靠谱的参谋。

第四,做流量的“冲浪高手”,提升数据库弹性伸缩和实时性。AI 时代,数据的训练和推理也会遇到类似双十一的波峰波谷,而弹性扩展正是 OceanBase 的强项。结合云虚拟化能力和 OceanBase 的底层能力,深度适配 AI 训练和推理场景,给数据库装上弹簧,可以在最大化挖掘数据价值的同时,获得最高的性价比。

全面拥抱 AI,It's time to change

相比于互联网时代,AI 时代的影响将更加深远,我们也强烈感受到 It's time to change。AI 不仅仅是增加一些能力,它需要创新,需要重塑。因为 AI 时代我们要搭建的不是一幢十几层的高楼大厦,而是为几百层的摩天大楼,重新架构底层的基础设施。就像从 0 到 1 重写分布式数据库一样,这种感觉又回来了,有一种强烈的被召唤的使命感,这也是我们所擅长的。

为全面拥抱 AI,去年年底我们开始探索沉淀,今年 4 月份我发布 OceanBase 内部全员信,宣布由 OceanBase  CTO 杨传辉亲自带队成立 AI  攻坚小组,引进更多新鲜人才,全面拥抱 AI。当 SQL 和 AI 发生化学反应, 我们要抓住这个机遇,站稳脚跟,攀登新的高峰。

上述四大方向,具体如何实施、什么是最佳实践、什么是最佳组合,我们希望开放更多的场景和大家一起探索和试验。在筹备大会的过程中,一个业务前端 Leader 的话给了我们启发:真正的爆款并不是基于一个固定的底座能力做设计,而是具有一定的前瞻性,需要提前半年预判底层的 AI 模型、推理引擎及其迭代方向和技术趋势。由于这样的启发,今年的大会在场外设置了大量的细节分享,不仅带来 OceanBase 的技术精华,也邀请了阿里巴巴集团和蚂蚁集团的一线团队,分享 Infra 层与应用层的 AI 实践经验。

未来我们将在社区开放更多的技术场景,希望与广大的开发者一起,共同探索和创造数据库的新世界!谢谢大家!

Logo

了解最新的技术洞察和前沿趋势,参与 OceanBase 定期举办的线下活动,与行业开发者互动交流

更多推荐