淘宝双 11 交易额惊人,幕后数据库 OceanBase 强大之处揭秘

2024-10-16
来源:网络整理

今年的淘宝双11交易额达到了惊人的571亿。这些辉煌数据的背后,其实是对淘宝数据库的一次极大考验。更值得一提的是,支付宝在今年双11期间的峰值支付率突破了每分钟285万笔交易,创下了新纪录。如此高的并发负载事务量让我们对幕后的数据库技术感到好奇。到底有哪些优势呢?

相信大家看完这篇文章就明白了。

在2014中国大数据技术大会第二天下午的大数据生态论坛上,阿里巴巴高级技术专家蒋志勇做了详细介绍。演讲主题为“支持支付宝交易的分布式数据库系统”。

蒋志勇表示,它是一个分布式关系数据库,也是第一个应用于金融核心系统的非商业数据库。与传统商业解决方案相比,它提供了许多互联网企业迫切需要的功能:基于PC服务器,可在线横向扩展;没有共享存储;性价比高于商业数据库。

江志勇还对比了互联网领域和传统业务对数据库不同特性的要求:

交易(ACID):互联网=传统商业;

可用性:互联网=传统业务绩效:

互联网>>传统业务;

性价比:互联网>>传统业务;

可扩展性:互联网>>传统业务。

为了保证数据的完整性,除了采用灰度升级之外,阿里巴巴还会对数据进行验证:磁盘读写,每条记录都是64位;网络传输,每个网络数据包有64位;每个文件有多个(3~6),每个文件有64位;修改增量多副本,64位累加;重做日志,每个条目都有一个与之对应的内存;每个表的每一列都有 64 位。

支付宝核心数据库的一些信息:

1、是阿里巴巴自主研发的支持海量数据的高性能分布式数据库系统。

2、与传统关系数据库相比,最大的亮点是它的自动扩展性。不仅可以扩展到一个数据中心,甚至可以扩展到同一个城市。未来可以成为跨地区多个数据中心的全球数据库。当然,还有一些特性,比如强一致性,可以自动容忍一台服务器甚至整个数据中心的故障,而不丢失任何一条记录。值得强调的是,支付宝之所以选择交易而不开源,正是因为它是唯一能够做到数据完全不丢失的。

3、内部会自动将数据划分为更小的分片,每台机器服务多个分片。当某台服务器的分片成为热点时,会自动触发迁移操作,将负载较高的分片移走。迁移高性能服务器,避免“木桶效应”。这也是一个优点。无论双十一之前热点如何变化,热点数据都可以快速均衡到整个集群,而不是因为一两台服务器压垮整个集群。

4、是真正的分布式关系数据库,不仅支持分布式,还支持SQL、事务、并发控制等关系数据库特性。用户和用户之间没有区别。

5.事务引擎是为内存设计的。其特点是速度快,避免了传统数据库的写放大问题。通过这种方式,锁等待本质上就会减少。此外,他还提出并率先实施了提前解锁、排队等优化思路。这些想法后来被应用到集团的数据库中,成为阿里巴巴应对双十一热点问题的标准方案。

6和6的区别在于主备同步有丢失数据的风险,而强一致性是通过选举协议实现的。无论是服务器还是整个​​数据中心故障,都可以自动恢复,不会丢失任何数据。这种方法是云存储系统的共同点和底层原理。

支付系统数据库设计_支付数据管理_数据支付系统

分享