GaussDB数据库表设计规范


风晓
风晓 2024-01-14 10:38:43 53659 赞同 0 反对 0
分类: 资源 标签: 国产数据库
GaussDB数据库表设计规范

1、必须指定表分布(DISTRIBUTE BY),表分布策略选择的原则如下:目前提供REPLICATION和HASH两种表分布策略。REPLICATION分布会在每个节点保留一份相同的完整的数据表。HASH分布会根据所提供的分布键值将表数据分布到多个节点中。

    1)对于系统配置表、数据字典表等数据规模小于2000w且插入更新十分低频的表,要求建议采用REPLICATION分布。

图片须知:慎用REPLICATION分布,该分布表会造成空间膨胀、DML性能下降等负面影响。

    2)对于数据量较大,更新频率较高的表,必须进行数据分片,要求采用HASH分布策略,分布键必须建议是主键中的一个或多个字段。

2、合理设计分布键,既考虑查询开发的便利性,又要考虑数据的均匀存储,避免数据倾斜和读热点。Hash表的分布键选取至关重要,如果分布键选择不当,可能会导致数据倾斜,从而导致查询时,I/O负载集中在部分DN上,影响整体查询性能。因此,在确定Hash表的分布策略之后,需要对表数据进行倾斜性检查,以确保数据的均匀分布。

    1)应使用取值较为离散的字段作为分布键,以便数据能够均匀分布到各个DN中。

    2)在满足条件1情况下,存在常量过滤的字段不建议成为分布键,否则会使得所有的查询任务都会分发到唯一固定的DN上。

    3)在满足条件1和2原则下,尽量选择查询中的关联条件作为分布键,这样可保证JOIN任务的相关数据分布在相同的DN上,减少DN间数据的流动代价。

图片说明:尽量避免数据shuffle。shuffle,是指在物理上,数据从一个节点,传输到另一个节点。shuffle占用了大量宝贵的网络资源,减小不必要的数据shuffle,可以减少网络压力,使数据的处理本地化,提高集群的性能和可支持的并发度。通过对关联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。

    4)由于数据库规格要求HASH分布表的主键必须包含其分布列,因此在选择分布列时,也可以考虑选择表的主键作为分布键。

分布键使用的列长度不易超过128,过长会带来较高的计算开销。

表1 常见的分布键及效果

分布键值

分布键分布均匀性

用户 ID,应用程序中有许多用户。

状态代码,只有几个可用的状态代码。

项目创建日期,四舍五入至最近的时间段(例如,天、小时或分钟)。

设备 ID,每个设备以相对类似的间隔访问数据.

3、分布键使用的列长度不易超过128,过长会带来较高的计算开销。

4、分布键值一旦插入不允许更新(UPDATE),如需更新需删除后插入。

5、视图不允许嵌套。一方面,如果视图编写时使用了通配符,当被调用的视图新增或删除列时,视图将发生错误。另一方面,视图嵌套可能因无法使用索引而执行效率低下,尽量使用带有索引的基表而不是视图上做关联操作。

6、分布键不建议超过3列,列数过多将带来较高的计算开销。

7、视图定义中尽量避免排序操作。ORDER BY子句在顶层视图上无效,如果必须对输出数据排序,请考虑在调用视图中使用ORDER BY。

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!

评价 0 条
风晓L1
粉丝 1 资源 2038 + 关注 私信
最近热门资源
桌面通用(全架构)【在双系统环境下隐藏Windows启动菜单】操作指南  2049
银河麒麟桌面操作系统V10(SP1)2203-如何进行远程桌面互访?  1990
银河麒麟桌面操作系统【保留数据盘重装系统】  1800
麒麟系统各种原因开不了机解决(合集)  1575
桌面通用(全架构)【rpm包转成deb包】操作方法  930
银河麒麟桌面操作系统 V10-SP1 双系统安装 efi 分区问题  914
统信系统安装(合集)  852
统信桌面专业版【手动分区安装UOS系统】介绍  844
统启动异常几种类型(initramfs 模式)  687
最近下载排行榜
桌面通用(全架构)【在双系统环境下隐藏Windows启动菜单】操作指南 0
银河麒麟桌面操作系统V10(SP1)2203-如何进行远程桌面互访? 0
银河麒麟桌面操作系统【保留数据盘重装系统】 0
麒麟系统各种原因开不了机解决(合集) 0
桌面通用(全架构)【rpm包转成deb包】操作方法 0
银河麒麟桌面操作系统 V10-SP1 双系统安装 efi 分区问题 0
统信系统安装(合集) 0
统信桌面专业版【手动分区安装UOS系统】介绍 0
统启动异常几种类型(initramfs 模式) 0
作者收入月榜
1

prtyaa 收益393.72元

2

zlj141319 收益220.97元

3

1843880570 收益214.2元

4

IT-feng 收益213.03元

5

风晓 收益208.24元

6

777 收益172.82元

7

Fhawking 收益106.6元

8

信创来了 收益105.89元

9

克里斯蒂亚诺诺 收益91.08元

10

技术-小陈 收益79.5元

请使用微信扫码

加入交流群

请使用微信扫一扫!