丝析发解丨理想的数据库架构是怎样的


云和恩墨
云和恩墨 2024-01-25 16:07:17 66048
分类专栏: 资讯

从数据库角度看,大多企业关键业务的特点是:主要操作是交易型(OLTP),也要执行一些分析型(OLAP)操作。对于这样的应用,最理想的数据库架构是什么?是SQL Server/MySQL/PostgreSQL这样单机数据库?还是Oracle RAC这样的基于共享存储的集群?或者是OceanBase、TiDB这样的share nothing分布式集群?

在我看来,理想的数据库架构是:基于共享存储的集群 + 全闪分布式存储 + 算子下推。为什么?

1、为什么不是share nothing的分布式数据库

分布式数据库的优点是:横向可扩展(scale-out)能力很强、总体聚合性能高、处理分析型负载的能力强。

缺点是:

(1)相对于集中式数据库来说,分布式数据库平均单节点事务处理能力比较低,主要原因是分布式事务处理流程更复杂;
(2)分布式数据库的架构更加复杂,运维成本比较高,精通分布式数据库的专家比较少,故障排查,性能调优等,都比较困难;
(3)分布式数据库对复杂的SQL语句支持不好,例如:触发器、存储过程、JOIN等等,企业应用往往更喜欢使用复杂的SQL语句;
(4)分布式数据库自己管硬盘,少了一层存储抽象,也丢失了很多能力。专业存储都支持快照、克隆、高速的远程复制等,让备份更方便。专业存储支持EC,比三副本每TB成本更低;

(5)存算一体架构,存储和计算强绑定,配比是固定的,无法单独对存储扩容,也不能单独扩容计算能力。

2、为什么不是单机版数据库?

相对于基于共享存储的数据库集群,对单机版数据库定期做冷备份,故障时用冷备数据来恢复业务,故障恢复时间比较长,可用性不高。

另外,PostgreSQL 和 MySQL 的高可用方案复杂,管理成本比较高。

3、为什么是全闪分布式存储,而不是全闪阵列?

全闪阵列是专用硬件,成本比较高,也有单一厂商锁定问题。一般来说,分布式存储也是软件定义存储(SDS),标准化服务器,价格透明,也没有被单一硬件厂商锁定的问题。

全闪阵列一般分为高端、低端等不同系列,高端阵列价格很高,低端阵列可扩展性比较差,

4、为什么需要算子下推?

多数企业应用,并不是只有单纯的交易型操作,也有一些分析型操作。基于共享存储的集群数据库不擅长完成大规模分析型任务,外部存储系统与运行数据库的主机之间带宽有限,如果能够把这些分析型任务拆分之后下发到分布式存储节点上去执行,存储节点把执行结果返回给主机,在主机和存储节点之间,不再需要很高的网络带宽。这将会大大提升执行效率,缩短执行时间。

图片

作者简介

 

黄岩,云和恩墨分布式存储软件总架构师,十余年存储研发经验,在NAS和备份领域有深入钻研,曾担任某NAS产品性能SE,负责产品性能调优工作,该产品在2011年打破了SPESsfs性能测试世界纪录。

「墨读时刻」特别节目黄岩人物专访即将上线,听一位存储老兵讲述摸爬滚打的这些年和对未来自研存储的洞察,敬请期待... ...

图片
图片

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:https://www.xckfsq.com/news/show.html?id=35791
赞同 6
评论 0 条
云和恩墨L3
粉丝 0 发表 25 + 关注 私信
上周热门
银河麒麟添加网络打印机时,出现“client-error-not-possible”错误提示  1448
银河麒麟打印带有图像的文档时出错  1365
银河麒麟添加打印机时,出现“server-error-internal-error”  1151
统信桌面专业版【如何查询系统安装时间】  1073
统信操作系统各版本介绍  1070
统信桌面专业版【全盘安装UOS系统】介绍  1028
麒麟系统也能完整体验微信啦!  984
统信【启动盘制作工具】使用介绍  627
统信桌面专业版【一个U盘做多个系统启动盘】的方法  575
信刻全自动档案蓝光光盘检测一体机  484
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
信创开放社区邀请他人注册的具体步骤如下 15
如何玩转信创开放社区—从小白进阶到专家 15
方德桌面操作系统 14
我有15积分有什么用? 13
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8

添加我为好友,拉您入交流群!

请使用微信扫一扫!