7月初,经过前期的持续的关注 + 一段集中时间学习,分别拿到了国产数据库TiDB和OceanBase的两个认证(如下),对国产数据库的两个拳头产品有了进一步的理解。

TiDB的PCTA认证
image.png
image.png

OB的OBCA认证
image.png

至于为啥要了解和考试这款数据库,原因很简单:

  1. 为了公司数字化转型,“降本增效”;
  2. 更深入的了解国产数据库,做选型准备;
  3. TiDB和OB作为众多国产数据库中的拳头产品,自然要了解一番;

今年在墨天轮上发了2篇有关国产数据库发展现状、趋势和对比分析的推文,如下:

  1. 《2021年5月国产数据库排行榜:“百舸争流”的各家国产数据库,你应该如何选?》
  2. 《2020年国产数据库“元年”,争做一只迎风起飞的“飞猪”》

再之前写的几篇推文,链接如下,大家可点击如下链接参阅:
3. 【干货篇】在国内外数据库百家争鸣的时代,DBA们该何去何从?
4. 年末总结_聊一聊数据库行业的“继往开来”
5. 认知篇】_认知国产数据库大咖级新秀GaussDB

今天,还是想再聊一聊拿到TiDB和OceanBase两个认证后,对国产数据库的一些思考。

目前具有权威的国产数据库排名榜是由墨天轮社区发起,该社区数据库排行榜致力于为大家呈现最新的国产数据库排名、各家数据库产品的动态发展趋势和综合竞争力。

国内数据库排名的两个目的:

一是为了弥补DB_ENGINES中国产库较少的尴尬处境;
二是为了供大家在国产数据库选型中有所侧重点。

今年初1月份写文章时《2020年国产数据库“元年”,争做一只迎风起飞的“飞猪”》,墨天轮社区当时收录了106种国产数据库,类型涵盖了关系型、宽列存储性、键值性、时序性、云原生性、分布式性共计6大类的数据库类型。

到了2021年的5月份,墨天轮社区更新了 2021年5月国产数据库排行榜,收录共计131个国产数据库参与排名,类型涵盖了关系型、宽列存储性、键值性、时序性、云原生性、分布式性共计6大类的数据库类型。对各家国产数据库的介绍,大家可详见文章《2021 :国产数据库名录和产品信息一览》
image.png

在7月份的开头,墨天轮已经更新了7月国产数据库流行度排行榜(https://www.modb.pro/dbRank)。
截止目前,收录参与国产数据库排名的数据库产品已达136个。类型涵盖也有5月份的6种扩增为7月份的8种,覆盖了关系型、文档、宽列存储、键值、图形、时序、云原生、分布式性共计8大类的数据库类型(见下图)。关系型数据库和非关系型数据库占比分别是 64%  和 36%;关系型数据库仍然占据主导地位。
image.png

由此可见,国产数据库厂家开始注重自己的社区排名,更为用心的打造自己的产品品牌;
也反映了墨天轮社区的国产数据库排名榜越来越受到国内企业的借鉴和认可。

这是好事。

依据各家数据库的研发背景,简单归纳下国产数据库的种类。

国产数据库可被分为4大派系:

1.学院派:基于学术研究,很早就涉及国产数据库的技术研发,赶上时代红利,这两年也是开始重点发力,抢夺市场份额,代表有南大通用Gbase、武汉达梦DM、人大金仓kingbase
2.互联网派:技术基本都是基于自身的业务压力主动或者被动的研究/改进数据库,特点很明显:钱多,技术能力强,经过自身业务的验证;在满足自身业务需求的背景下,也想开疆扩土,争夺数据库市场,加入到企业数据化转型队伍中,代表有腾讯云TDSQL、阿里OceanBase和polarDB;
3.创业派:创业派是一群技术大牛们,把握住了时代脉搏,从技术层面探究计算机三大基础研究(操作系统、中间件、数据库)中最难啃的数据库技术,据说每个技术人员心中都有一个改变世界的梦想,都想对这个时间make a difference,所以技术人的情怀,代表有TiDB、SequoiaDB、HotDB、ArkDB、星环 KunDB、青云 RadonDB;
4.企业派:个人看来,企业派的出发点和创业派类似,经历和互联网派类似;有钱+有情怀,实力和发展前景同样不容小觑,代表有华为GaussDB和OpenGaussDB、中兴通讯GoldenDB、亚信AntDB。

面对百舸争流的这么多的国产数据库,我们会很自然的提出两个问题:
1.数据库产品如何选型?
2.作为一枚DBA应该怎么学?

第一个问题,之前的文章《2021年5月国产数据库排行榜:“百舸争流”的各家国产数据库,你应该如何选?》一文中已写过,这里再赘述下:

个人认为:

  1. 采用“增益思维”,以实用为主,化繁为简(剃刀原则)、展望未来;
  2. 真正能满足业务需求的数据库产品和架构设计是一个最重要的选型指导原则。
    一句话:适合业务需求和发展的才是最好选择。
    把问题再拆解下,如果把数据库当成一个产品来看(make a company as a product)。

希望数据库具有什么样的特性/标签?

我们来给“钟意”的数据库产品标画个像,先想象一下自己心中的数据库应该是个什么样子,具有什么特点:

1.开源、国产、云原生
2.高可用性、强一致性
3.MPP、HTAP、线性扩展
4.兼容性高(主流sql标准92,2003)
5.技术和架构能够持续迭代升
6.市场成熟度高
7.产品生态活跃

根据如上原则,再结合实际业务需求,相信大家在进行数据库选型时心中就有了方向感。

接着回答第二个问题:作为一枚DBA应该怎么办?
如下的一些产品特性需要满足,毕竟要先清晰知晓自己想要一个什么样的数据库产品及周边衍生。

1.数据库产品是否稳定;					
2.支持高可用性;
3.支持强一致性;                                				
4.支持水平扩展;
5.支持跨数据中心多活;											
6.充分的市场验证;
7. 数据库生态工具完善(备份恢复、迁移、升级、监控、报表);
8. 技术能力和团队的培养(是否可以帮助企业成长),学习途径方便、多样性(社区、论坛、metaLink);

心中有了一杆秤,接下来就是发挥大家的动手能力了,多练手。正如前文所述的“增益思维”(行不行,先走两步;考虑太多,则畏首畏尾)。

至于选哪个产品入手,怎么练?

这里有一些建议:

  1. 一通则万通
    如果你时间充足,数据库理论扎实,尤其精通Oracle,那么你会很容易的上手国内的任何一款数据库产品和架构;毕竟老大哥的市场占有率、产品稳定性、成熟的衍生生态在那里;且国内的很多数据库产品都在或多或少的参荐Oracle的架构设计和最新产品特性。
    这里吹一下Oracle的彩虹屁(特性),你会发现很多国产数据库也是有其特性影子。
    看一下Oracle新推出的自治数据库版本19c提供了更多的自治能力和新功能。Oracle Database 19c新特性摘要如下:
    1. 自动索引(Auto-Indexing)自动化索引功能在帮助用户简化开发、运维的同时,数据库性能最高可提升60%;
    2. 实时自动统计信息收集在数据库发生变化时,可自动收集统计数据供SQL优化器使用,极大减轻人工SQL调优压力;
    3. Active Data Guard备库DML重定向备端可做DML操作, 实现数据中心应用级双活,简化应用部署难度,同时最大化架构可用性和硬件利用率;
    4. 自动SQL隔离可将开发人员性能不好的SQL进行资源隔离,保障系统正常运行,提升数据库可用性;
    5. 物联网(IoT)流处理功能专为插入快速激增的IoT数据打造,让IoT更易用、更好用。
    6. Oracle区块链本地解决方案,帮助企业轻松搭建区块链网络。
    7. 20c提供了更多的自治能力,包括原生持久内存(PMEM)数据库、自动机器学习、为安全交易而打造的原生区块链表,以及性能更加强大的二进制JSON数据类型。

俗话说:欲得其中,先求其上;Oracle就是那个值得先行掌握的“上”。
Oracle的原理和操作熟练后,你会发现MySQL、PG、国产关系型数据库等众多关系型数据库变得很容易掌握。

2. 重点突破某一单品
有些同学说,我刚开始入手学习国产数据库,该怎么搞?
建议重点突破,先深入理解某款国产数据库产品。选型哪款国产数据库产品,可以参考墨天轮社区国产数据库排名(https://www.modb.pro/dbRank),不知道如何选时就选top10中的某一款:TiDB、OB、PolarDB、TDSQL、openGaussDB等任一款均可。

针对其设计原理、架构设计、解决了哪些问题、有什么优缺点、动手搭建一遍、跑一跑性能测试、功能点测一测后,基本算是完成第一阶段;即先深入理解一款国产数据库产品后,据此再学习其他国产数据库产品和衍生生态会容易很多,会发现一些通用的设计思路,只是实现底层不同而已。

个人在之前的文章中分享过在技术分享中几乎每次都会讲到toB和toC的两个观点,简述如下:

  1. toB 市场的认同成为国内数据库成败的关键
    产品只有被市场所认可,得到各行业的验证,尤其是金融、电信、交通运输行业的认可和考验;才能有更多的案例来帮助完善产品功能和性能,马太效应才会出现良性导向。
  2. toC 注重极致的用户体验才能让国内数据库升天更趋完善
    国产数据库的真正使用者是具体到每一个的DBA,这些人对产品的使用体验、学习途径、发声方式、用户反馈,直接映射了一个产品的热点和讨论度。持续不断的发声、完善、提升学习者的使用体验,才能把产品逐渐打磨完善;正如Oracle产品,虽然去O的声音一直有,但官方的MOS、技术论坛确是各大国产数据在构建自己的生态链时应该学习和借鉴的。

欣慰的是:
toC的用户体验已经被国产数据库供应商重视,从产品本身开源、官方文档、到版本下载、到技术培训,都在重点发力,营造各自的产品生态圈,开始关注用户粘性,这是很值得肯定和推荐的行为,属于共赢范畴,互为得益。

这也是文章开头,个人通过国产数据库TiDB和OceanBase的两个认证的原因,也促使开始研究两个国产数据库拳头产品。

最后,祝愿国内的各大数据库产品供应商把握住时代脉搏,“善于在危机中育先机、于变局中开新局”。

文章结束。

以下是个人微信公众号,欢迎关注:
image.png

Logo

了解最新的技术洞察和前沿趋势,参与 OceanBase 定期举办的线下活动,与行业开发者互动交流

更多推荐