Linux 中监控 GPU 使用率:图形界面与命令行工具


知道创宇
知道创宇 2024-10-11 10:05:24 3513 赞同 0 反对 0
分类: 资源 标签: 运维
在Linux系统中,像htop或top这样的系统监控工具虽然强大,但无法显示GPU的使用情况。要在Linux系统上实时监控GPU的温度、显存占用等关键数据,我们需要借助一些专门的工具。
 

方法 1:使用 Mission Center 图形界面工具

Mission Center 是一款出色的 Linux 系统任务管理器。如果你使用的是桌面版 Linux 发行版,可以使用它来监控 NVIDIA、AMD 和 Intel 的 GPU 资源占用。

对于 Intel GPU,可能无法获取部分详细信息。

1首先,按照你的 Linux 系统,安装并配置 Flatpak,然后从 Flathub 平台下载安装 Mission Center。

复制复制复制复制复制
复制
flatpak install flathub io.missioncenter.MissionCenter

2安装完成后,打开 Mission Center,切换到「GPU」选项卡。在这里,你可以看到显卡型号、GPU 利用率、时钟速度、功耗、显存占用、显存速度及温度等信息。

使用 Mission Center 查看 GPU 使用信息
使用 Mission Center 查看 GPU 使用信息

方法 2:使用命令行工具监控 GPU

对于使用 Linux Server 或喜欢命令行工具的用户,以下是一些针对不同 GPU 厂商的命令行监控工具。

2.1 nvidia-smi 命令

如果你使用的是 NVIDIA 显卡,可以通过nvidia-smi命令查看 GPU 的详细信息:

复制复制复制复制
复制
nvidia-smi -l 2

此命令通常会随 NVIDIA 驱动程序自动安装,参数-l 2表示每 2 秒更新一次数据,你可以根据需要调整刷新频率。

使用 nvidia-smi 命令监控 GPU 使用率
使用 nvidia-smi 命令监控 GPU 使用率

该命令输出的关键信息包括:

指标 描述 示例值
GPU 显卡型号 NVIDIA GeForce RTX 4090
Fan 风扇状态 30%
Temp 温度(摄氏度) 27
Perf 性能状态(P0 最高,P12 最低) P8
Persistence-M 持久模式(ON 表示开启,OFF 表示关闭) ON
Pwr: Usage/Cap 功耗(使用中/总功耗) 28W / 450W
Disp.A 显示器连接状态(On 表示连接,Off 表示未连接) Off
Memory-Usage 显存使用情况(使用中/总显存) 1510MiB / 24564 MiB
Volatile Uncorr. ECC ECC(Off 表示未开启,On 表示开启) Off
GPU-Util Compute M. GPU 计算利用率(%) 0%

2.2 nvtop 命令

nvtop 是一款类似 htop 的命令行工具,专门用于监控 GPU 及加速器任务。它是 Mission Center 的后台组件,名字来源于「Neat Videocard TOP」,支持多种 GPU 厂商,并通过直观界面展示相关数据。以下是它支持的厂商和驱动:

  • AMD:Linux amdgpu 驱动
  • 苹果:有限支持 M1 和 M2
  • 华为:Ascend
  • 英特尔:Linux i915 或 Xe 驱动
  • NVIDIA:Linux 专有驱动
  • 高通 Adreno:Linux MSM 驱动

1根据你的发行版安装 nvtop:

复制复制复制
复制
# 对于 Debian 和 Ubuntu
sudo apt install nvtop 

# Fedora 39 及更高版本
sudo dnf install nvtop 

# CentOS Stream、Rocky Linux 和 AlmaLinux
sudo dnf install -y epel-release
sudo dnf install nvtop

# Arch Linux
sudo pacman -S nvtop

2安装完成后,运行nvtop,即可查看和管理 GPU 的状态及进程。

使用 nvtop 命令监控 GPU 占用
使用 nvtop 命令监控 GPU 占用

2.3 gpustat 命令

gpustat 是一个基于 Python 的命令行工具,能够快速查询和监控 NVIDIA GPU 的状态。

1在安装 gpustat 之前,请确保系统已经安装 Python 包管理工具 pip

2通过 PyPI 安装 pip:

复制复制
复制

pip install gpustat

3安装完成后,运行gpustat命令,就会列出所有 NVIDIA GPU 的使用情况,包括 GPU 温度、利用率、显存占用以及当前运行的进程等信息。

使用 gpustat 命令查看 GPU 使用情况
使用 gpustat 命令查看 GPU 使用情况

无论你使用的是 NVIDIA、AMD 还是 Intel GPU,监控 GPU 使用率都是维护系统性能的关键任务。我个人比较推荐使用 nvtop,它界面直观且功能强大。当然,你也可以选择 nvidia-smi,或者桌面用户使用 Mission Center 进行图形化监控。

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!

评价 0 条
知道创宇L2
粉丝 0 资源 5 + 关注 私信
最近热门资源
分享如何在银河麒麟高级服务器操作系统V10SP3中需要启用内核审计功能。  176
分享免费开源高速下载器  171
一图对比分析IPv4与IPv6  167
统信uos家庭版与专业版的选择  166
分享如何查看网卡中断的数量  163
解决银河麒麟无法添加惠普打印机,提示'client-error-not-possible'.”错误  162
winrar绿色无广告版分享  154
通过shell脚本在统信UOS/麒麟系统中安装nginx  145
分享在麒麟系统中关闭占用端口的进程的办法  142
统信UOS常见问题小总结  142
最近下载排行榜
分享如何在银河麒麟高级服务器操作系统V10SP3中需要启用内核审计功能。 0
分享免费开源高速下载器 0
一图对比分析IPv4与IPv6 0
统信uos家庭版与专业版的选择 0
分享如何查看网卡中断的数量 0
解决银河麒麟无法添加惠普打印机,提示'client-error-not-possible'.”错误 0
winrar绿色无广告版分享 0
通过shell脚本在统信UOS/麒麟系统中安装nginx 0
分享在麒麟系统中关闭占用端口的进程的办法 0
统信UOS常见问题小总结 0
作者收入月榜
1

prtyaa 收益395.97元

2

zlj141319 收益228.47元

3

IT-feng 收益214.92元

4

1843880570 收益214.2元

5

风晓 收益208.24元

6

777 收益173.02元

7

哆啦漫漫喵 收益131.6元

8

Fhawking 收益106.6元

9

信创来了 收益105.97元

10

克里斯蒂亚诺诺 收益91.08元

请使用微信扫码

加入交流群

请使用微信扫一扫!