详解瀚高数据库PDR性能诊断报告

prtyaa 2024-01-12 14:53:47  53289 赞同 0 反对 0

分类：资源标签：国产数据库

详解瀚高数据库PDR性能诊断报告

一、pdr功能介绍

通常国产数据库运维是一个难点，特别是DBA人员对数据库进行性能分析时，使用一些工具等手段会大大降低分析难度。

瀚高数据库（以下简称HGDB）提供性能监控与诊断工具pdr, 实现了周期性的收集、处理、持久化和维护性能统计数据，主要用于数据库性能问题的诊断与解决，可以用来作为一段时期内数据库性能调整的参考。另外，pdr可以生成简单明了、信息丰富和分类清晰的HTML格式性能诊断报告，让DBA人员阅读起来非常方便。

二、pdr实现原理

HGDB的Postmaster负责fork出postgres进程，用于相应用户的查询请求，同时还fork出若干辅助进程，用于支持HGDB的运行。

pdr也是在postmaster启动时，注册的一个后台工作者进程。后台工作者进程hgPdr会使用SPI接口，对HGDB内核进行直接访问，实现统计信息的采集和存储。采集数据的过程类似于PgStat，不同之处在于，hg_pdr不会反馈采集信息给HGDB。

pdr启动后，首先初始化SPI接口，用于统计信息的采集和保存。所有信息保存在一个_pg_pdr模式中。_pg_pdr模式一共有四个表，分别保存等待事件信息、SQL执行信息、Database基本信息以及Table基本信息。

默认情况下，每隔一个小时，pdr会采集一次信息，将这些信息存入hg_pdr_模式的四个表里。每一条信息都带有一个快照id，用以识别采集的数据属于哪个时间段。这些数据，Database基本信息和Table基本信息，来自于HGDB自带的PgStat进程，pdr直接从共享内存中将这部分数据读取出来，并存入_pg_pdr_的表中。SQL执行信息来自pg_stat_statements插件，这部分信息也是保存在共享内存中的，可以通过相关函数直接读出。等待事件目前使用了pg_wait_sampling插件，对pg_stat_activity视图进行高频采样，将等待事件进行保存。_pg_pdr_中保存的统计信息，默认保留7天，超过7天的信息会被清理，以节约存储空间。

HGDB还提供一个pdr_report工具，用于生成性能分析报告。pdr_report工具会连接HGDB，将用户指定的时间段内的数据库信息取出，再结合报告模板，生成一份HTML格式的报告。

当使用pdr_report工具时，用户需要指定生成的数据库名，快照id的起止范围，生成报告的文件名。pdr_report工具会根据这些信息，从数据库中把用户指定的信息读取出来，填写到pdr_report.html模板中，最终生成pdr报告。

模板文件存放在share目录下，模板文件的样式可以进行修改，不会影响到报告的生成。

三、使用pdr

1、启用pdr

HGDB初始化完成后，实际上已经包含了pdr功能，我们只需要通过配置postgresql.conf来启用：

shared_preload_libraries= 'worker_pg_pdr,pg_stat_statements,pg_wait_sampling'

完成修改后，重启数据库，pdr功能启用成功。让我们查看一下后台进程情况：

ps -ef |grep postgres

2、配置pdr

通过修改postgresql.conf中pdr相关参数，可以对pdr进行配置。

pg_pdr.naptime = 60      # 快照的产生间隔，单位为分钟，默认为60分钟产生一次快照。naptime=0时，代表不启用PDR功能。pg_pdr.naplife = 7       # 快照的保存时间，单位为天，默认保存最近7天的快照。超过naplife的快照，会自动删除。pg_pdr.napdb = 'highgo'  # 用于保存PDR快照数据表的数据库，默认设置为highgo数据库。