Centos7.3 安装Greenplum 6.20.4 实操版


prtyaa
prtyaa 2024-01-10 16:08:19 64936 赞同 0 反对 0
分类: 资源
目录 一、前期准备 1、确定服务器 2、修改主节点hosts 3、为所有主机创建gp用户 4、修改系统内核/etc/sysctl.conf文件(所有节点) 5、 修改系统资源限制(所有节点) 6、查看防火墙和selinux,关闭selinux防火墙如果无用也关闭(获取开发指定端口)

二、Greenplum安装

1、安装greenplum(每个节点都需要安装)

方法一(推荐)

方法二

2、配置greenplum环境变量

3、配置免密登录

4、创建数据存储区域

5、校验你的硬件以及网络性能

6、创建Greenplum Database配置文件

7、初始化数据库

8、Greenplum数据库操作

1)集群操作

2)数据库登录退出

一、前期准备1、确定服务器我这里一共使用3台服务器,其中一台作为master,另外两台作为segment

IP

主机名

角色

10.170.1.1

h_xx01

master

10.170.1.2

h_xx02

segment

10.170.1.3

h_xx03

segment

注:这里的主机名为后续gp数据库之间通信的关键,所以如果你的服务器echo $HOSTNAME为空,那么需要你自己添加,方法网上有很多,这里不赘述了。

2、修改主节点hosts注:只需要修改master节点即可

vi /etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

10.170.1.1 h_xx01

10.170.1.2 h_xx02

10.170.1.3 h_xx033、为所有主机创建gp用户我这里使用的用户名为gpadmin

groupadd gpadmin useradd gpadmin -r -m -g gpadmin passwd gpadmin New password: Retype new password: 4、修改系统内核/etc/sysctl.conf文件(所有节点)

vi /etc/sysctl.conf

kernel.shmall = 197951838 #控制可以使用的共享内存的总页数 kernel.shmmax = 810810728448 #定义单个共享内存段的大值,建议值为多于物理内存的一半,可取的大值为物理内存值 -1byte kernel.shmmni = 4096 #默认值4096 vm.overcommit_memory = 2 #说明在后kernel.sem = 500 2048000 200 40960kernel.sysrq = 1 #设置为1表示开启sysrp功能kernel.core_uses_pid = 1kernel.msgmnb = 65536kernel.msgmax = 65536kernel.msgmni = 2048net.ipv4.tcp_max_syn_backlog = 4096 #所能接受SYN同步包的大客户端数量net.ipv4.conf.all.arp_filter = 1net.ipv4.ip_local_port_range = 1025 65535net.core.netdev_max_backlog = 10000net.ipv4.tcp_tw_recycle = 1 #表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭

保存后执行sysctl -p,让以上修改生效

说明:

vm.overcommit_memory可选值:0,1,2。

0,:表示内核将检查是否有足够的可用内存供应用进程使用;如果有足够的可用内存,内存申请允许;否 则,内存申请失败,并把错误返回给应用进程。

1:表示内核允许分配所有的物理内存,而不管当前的内存状态如何。

2: 表示内核允许分配超过所有物理内存和交换空间总和的内存

kernel.shmall参考值:

当内存为 12G 时, kernel.shmall = 3145728

当内存为 16G 时, kernel.shmall = 4194304

当内次为 32G 时, kernel.shmall = 8388608

当内存为 64G 时, kernel.shmall = 16777216

当内存为 128G 时, kernel.shmall = 33554432

kernel.sem 参数说明:

500 信号集容纳大信号数量

2048000 所有信号的大数量

200 调用单个信号集中大信号数量

40960 信号集的大值

kernel.msgmni:表示系统内大消息队列个数 kernel.msgmnb:表示单个消息队列的大容量 kernel.msgmax:表示消息队列中单个消息的大容量

net.core.netdev_max_backlog 表示当每个网络接口 接受数据包的速率比内核处理这些包的速率快时,允许发送到队列的数据包的大数目

5、 修改系统资源限制(所有节点)vi /etc/security/limits.conf

* soft nofile 524288 * hard nofile 524288 * soft nproc 131072 * hard nproc 1310726、查看防火墙和selinux,关闭selinux防火墙如果无用也关闭(获取开发指定端口)二、Greenplum安装1、安装greenplum(每个节点都需要安装)方法一(推荐)gp数据库在安装是需要以下依赖包 apr apr-util openssh openssh-clients openssh-server因此在安装数据库前使用yum方式安装依赖包yum -y install apr apr-util openssh openssh-clients openssh-server再安装数据库rpm -ivh –prefix=/greenplum/gp open-source-greenplum-db-6.20.4-rhel7-x86_64.rpm说明:–prefix=/greenplum/gp 为指定的安装路径,可自己修改方法二这种方式无需考虑依赖包的情况,但是实际安装时会发现装了很多无用的依赖包sudo yum -y install greenplum-db-6.20.4-rhel7-x86_64.rpm –installroot=/greenplum/gp说明:–installroot=/greenplum/gp 指定安装路径2、配置greenplum环境变量 注:这一步可以省略,但是在执行gp的相关命令前要source greenplum_path.sh

在这里我配置的方式比较偷懒,使用root用户直接在 /etc/profile文件末添加

vi /etc/profile 在末尾添加source /greenplum/gp/greenplum-db-6.20.4/greenplum_path.sh3、配置免密登录在master服务器上使用gpadmin用户执行source /greenplum/gp/greenplum-db-6.20.4/greenplum_path.shssh-keygen -t rsa -b 4096

-bash-4.4$ ssh-keygen -t rsa -b 4096Generating public/private rsa key pair.Enter file in which to save the key (/greenplum/.ssh/id_rsa): 回车Enter passphrase (empty for no passphrase): 回车Enter same passphrase again: 回车直接回车即可,如果输入密码还需要使用密码才可以打开key使用ssh-copy-id命令添加gpadmin用户的公共密钥到集群中其余子节点的authorized_hosts SSH文件执行命令ssh-copy-id 主机名根据提示输入yes,然后输入gpadmin设置的密码创建文件,记录所有节点主机名使用gpadmin创建免密互通主机名文件hostfile_exkeys(文件名自己随便起),该文件中记录所有记得主机名执行如下命令为gpadmin用户配置免密SSHsource /greenplum/gp/greenplum-db-6.20.4/greenplum_path.shgpssh-exkeys -f hostfile_exkeys 当你看到[INFO] completed successfully 表示完成

进行免密操作测试gpssh -f hostfile_exkeys -e ‘pwd’假如安装成功,您应该可以没有密码打断的登录到所有的子节点,所有子节点都应该展示他们的路径,并且目录是gpadmin用户拥有的权限4、创建数据存储区域为主节点上创建数据存储区域,简单理解为创建一个目录用于存储主节点数据mkdir /greenplum/gp/data_master为子节点创建数据存储区域创建一个文件segfile(文件名自定义),文件中记录所有从节点服务器的主机名使用gpssh工具在所有从主机上创建主数据和镜像数据目录:source /greenplum/gp/greenplum-db-6.20.4/greenplum_path.shgpssh -f segfile -e ‘mkdir -p /greenplum/gp/primary’gpssh -f segfile -e ‘mkdir -p /greenplum/gp/mirror’gpssh -f segfile -e ‘chown -R gpadmin:gpadmin /greenplum/gp/primary’gpssh -f segfile -e ‘chown -R gpadmin:gpadmin /greenplum/gp/mirror’上面命令中的路径和目录可依据需要自己随便取,但是在gp配置文件中,使用的目录名是primary和mirror5、校验你的硬件以及网络性能Greenplum提供了一个管理工具叫做gpcheckperf,它可以被用来测试以下性能:

校验网络性能

gpcheckperf -f segfile -r N -d /tmp > subnet1.out校验磁盘I/O性能和内存带宽

gpcheckperf -f segfile -r ds -D -d /greenplum/gp/primary

gpcheckperf -f segfile -r ds -D -d /greenplum/gp/mirror这个工具可能会花费好一会来进行测试,因为它将在节点间复制大量的文件,当它结束时,你将会看见磁盘读写的总结果

====================== RESULT 2022-05-31T16:19:35.393088====================

disk write avg time (sec): 1080.70 disk write tot bytes: 540826861568 disk write tot bandwidth (MB/s): 477.46 disk write min bandwidth (MB/s): 233.77 [h_xx02] disk write max bandwidth (MB/s): 243.69 [h_xx03] — per host bandwidth — disk write bandwidth (MB/s): 233.77 [h_xx02] disk write bandwidth (MB/s): 243.69 [h_xx03]

disk read avg time (sec): 421.41 disk read tot bytes: 540826861568 disk read tot bandwidth (MB/s): 1223.95 disk read min bandwidth (MB/s): 608.91 [h_xx02] disk read max bandwidth (MB/s): 615.04 [h_xx03] — per host bandwidth — disk read bandwidth (MB/s): 608.91 [h_xx02] disk read bandwidth (MB/s): 615.04 [h_xx03]

stream tot bandwidth (MB/s): 20407.00 stream min bandwidth (MB/s): 10011.20 [h_xx02] stream max bandwidth (MB/s): 10395.80 [h_xx03] — per host bandwidth — stream bandwidth (MB/s): 10395.80 [h_xx02] stream bandwidth (MB/s): 10011.20 [h_xx03]

6、创建Greenplum Database配置文件在$GPHOME/docs/cli_help/gpconfigs/目录下有一个名为gpinitsystem_config的文件,这个配置文件告诉gpinitsystem 工具你想如何配置greenplum数据库复制 gpinitsystem_config 文件 For example:cp gpinitsystem_config 你的路径设置所有必须的参数以及可选参数PORT_BASE=40000declare -a DATA_DIRECTORY=(/data/primary) #可写多个,用空格分隔MASTER_HOSTNAME=masterMASTER_DIRECTORY=/data/masterMASTER_PORT=5432MIRROR_PORT_BASE=50000declare -a MIRROR_DATA_DIRECTORY=(/data/mirror) #可写多个,用空格分隔DATABASE_NAME=gpdb7、初始化数据库使用gpinitsystem命令来进行数据库的初始化gpinitsystem -c gpinitsystem_config -h segfile这个工具将会验证你的设置信息,并且确保它能够连接到每一个节点,访问你在配置文件中指定的数据目录。假如所有的预查都成功了,那么工具将会提示你确认你的配置,如下:=> Continue with Greenplum creation? Yy/Nn输入y并回车开始初始化在成功设置的后,工具将会启动你的greenplum数据库系统,你应该会看见=> Greenplum Database instance successfully created.8、Greenplum数据库操作1)集群操作停止和启动集群gpstop#停止gpstart –a #启动gpstop –ra #重启gpstate -e #查看mirror的状态gpstate -f #查看standby master的状态gpstate -s #查看整个GP群集的状态gpstate -i #查看GP的版本gpstate –help #帮助文档,可以查看gpstate更多用法2)数据库登录退出登录数据库$ psql -d gpdb -p 20001 -U gpadmin退出数据库gpdb=# \q文章知识点与官方知识档案匹配,可进一步学习

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!

评价 0 条
prtyaaL0
粉丝 1 资源 1949 + 关注 私信
最近热门资源
银河麒麟桌面操作系统V10SP1-2403-update1版本中,通过“麒麟管家-设备管理-硬件信息-硬盘”查看硬盘类型时,显示的是HDD(机械硬盘),而实际上该笔记本的硬盘类型为SSD  81
以openkylin为例编译安装内核  76
分享解决宏碁电脑关机时自动重启的方法  73
统信uosboot区分未挂载导致更新备份失败  63
分享如何解决报错:归档 xxx.deb 对成员 control.tar.zst 使用了未知的压缩,放弃操作  63
统信uos安装mysql的实例参考  60
格之格打印机dp3300系列国产系统uos打印机驱动选择  57
在银河麒麟高级服务器操作系统V10SP3中,需要将默认shell类型修改为csh。  51
MySQL国产平替最佳选择---万里数据库(GreatDB)  45
最近下载排行榜
银河麒麟桌面操作系统V10SP1-2403-update1版本中,通过“麒麟管家-设备管理-硬件信息-硬盘”查看硬盘类型时,显示的是HDD(机械硬盘),而实际上该笔记本的硬盘类型为SSD 0
以openkylin为例编译安装内核 0
分享解决宏碁电脑关机时自动重启的方法 0
统信uosboot区分未挂载导致更新备份失败 0
分享如何解决报错:归档 xxx.deb 对成员 control.tar.zst 使用了未知的压缩,放弃操作 0
统信uos安装mysql的实例参考 0
格之格打印机dp3300系列国产系统uos打印机驱动选择 0
在银河麒麟高级服务器操作系统V10SP3中,需要将默认shell类型修改为csh。 0
MySQL国产平替最佳选择---万里数据库(GreatDB) 0
作者收入月榜
1

prtyaa 收益400.83元

2

zlj141319 收益237.91元

3

哆啦漫漫喵 收益231.52元

4

IT-feng 收益219.92元

5

1843880570 收益214.2元

6

风晓 收益208.24元

7

777 收益173.17元

8

Fhawking 收益106.6元

9

信创来了 收益106.03元

10

克里斯蒂亚诺诺 收益91.08元

请使用微信扫码

添加我为好友,拉您入交流群!

请使用微信扫一扫!