(一)集群健康度检查
在深入查看一个 Kafka生产集群环境的各个组件之前,运维人员有必要在全局对集群的健康度检查高屋建领般地做一个详尽的“顶层设计”。
所有 broker 的执行状态,包括运行状态、所属版本、底层日志路径磁盘使用情况、所在机器的物理负载情况、系统日志是否有严重错误等
ZooKeeper 运行状态,包括版本、底层文件系统使用情况 (特别是快照所在磁盘空间使用)、所在机器物理负载情况等。
集群中所有主题(topic)分布以及分区状态,包括所有 topic 的分区情况以及每个分区leader副本的存活情况等。
客户端应用(clientsapplication)运行状态,包括客户端应用负载分析、有无消费者(consumer端)消费滞后、有无生产者(producer端)超时等。
版本匹配性,全面了解集群中所有 clients端应用程序API版本与 broker端版本的适配性。
集群中定时作业的运行状态,全面了解当前集群中有哪些大的定时作业(如preferredleader选举)或当前正在手动执行哪些耗时作业(如分区重分配)。
(二)
(三)
(四)下面总结一下调优TPS的一些参数清单和要点
(五)
(六)
(七)
如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!
添加我为好友,拉您入交流群!
请使用微信扫一扫!