写给程序员的机器学习入门 (八补充) - 使用 GPU 训练模型（一）

风晓 2023-12-31 10:02:01  50956 赞同 0 反对 0

分类：资源

在之前的文章中我训练模型都是使用的 CPU，因为家中黄脸婆不允许我浪费钱买电脑😭。终于的，附近一个废品回收站的朋友转让给我一台破烂旧电脑，所以我现在可以体验使用 GPU 训练模型了🥳。

显卡要求

pytorch, tensorflow 等主流的框架的 GPU 支持都基于 CUDA 框架，而目前提供 CUDA 支持的显卡只有 nvidia，这次我捡到的破烂是 GTX 1650 4GB 所以满足最低要求了。简单描述下目前各种显卡的支持程度：

Intel 核显：死心叭
APU：没法用
Nvidia Geforce
- 2GB 可以用来跑一些入门例子
- 4GB 可以跑一些简单模型
- 6GB 可以跑一些中级模型
- 8GB 可以跑一些高级模型
- 10GB以上可以跑最前沿的模型
Radeon：要折腾，试试 ROCm

如果真的要玩机器学习推荐购买 RTX 系列，因为有 tensor 核心和 16 位浮点数支持，训练速度会快很多，并且使用 16 位浮点数可以让显存占用少一半。虽然在过几个星期就可以看到 3000 系列的显卡了，可惜没钱买🤒。此外，明年如果出支持机器学习的民用国产显卡必定会大力支持😡。

安装显卡驱动

Windows 的话会通过 Windows Update 自动安装， pytorch 会自动检测出显卡，不需要做任何工作。Linux 需要安装 Nvidia 官方的闭源驱动 (开源的 Nouveau 驱动不支持 CUDA)，如果是 Ubuntu 那么在安装系统的时候打个勾就可以自动安装，如果没打可以参考这篇文章，其他 Linux 系统如果源没有提供可以去 Nvidia 官方下载驱动。

安装以后可以执行以下代码看看 pytorch 是否可以检测出显卡：

>>> import torch

# 判读是否有 GPU 支持
>>> torch.cuda.is_available()
True

# 判断插了几张可用的显卡
>>> torch.cuda.device_count()
1

# 获取第一张显卡的名称
>>> torch.cuda.get_device_name(0)
'GeForce GTX 1650'

如果输出类似以上的结果，那么就代表没有问题了。

在 pytorch 中使用 GPU

pytorch 默认会把 tensor 对象的数据保存在内存上，计算会由 CPU 执行，如果我们想使用 GPU，可以调用 tensor 对象的 cuda 方法把对象的数据复制到显存上，复制以后的 tensor 对象运算会使用 GPU。注意在内存上的 tensor 对象和在显存上的 tensor 对象之间无法进行运算。

# 创建一个 tensor，默认会保存在内存上，由 CPU 进行计算
>>> a = torch.tensor([1,2,3])
>>> a
tensor([1, 2, 3])

# 把 tensor 复制到显存上，针对此 tensor 的计算将会使用 GPU
>>> b = a.cuda()
>>> b
tensor([1, 2, 3], device='cuda:0')

如果你想编写同时兼容 GPU 和 CPU 的代码可以使用以下写法，如果有支持的 GPU 则会使用 GPU，如果没有则会使用 CPU：

# 创建一个 device 对象，如果显卡可用则指向显卡，否则指向 CPU
>>> device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 创建一个 tensor 并复制到指定 device
>>> a = torch.tensor([1,2,3])
>>> b = a.to(device)
>>> a
tensor([1, 2, 3])
>>> b
tensor([1, 2, 3], device='cuda:0')

如果你插了多张显卡，以上的写法只会使用第一张，你可以通过 "cuda:序号" 来指定不同的显卡来实现分布式计算。

>>> device1 = torch.device("cuda:0")
>>> device1
device(type='cuda', index=0)

>>> device2 = torch.device("cuda:1")
>>> device2
device(type='cuda', index=1)

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等，可点击“私信”按钮向作者进行反馈；如作者无回复可进行平台仲裁，我们会在第一时间进行处理！

评价 0 条

相关资源

写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（二） 2023-12-31 53478 浏览
接上一篇写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（一）
写给程序员的机器学习入门 (一) - 从基础说起（一） 2023-12-31 50682 浏览
目前的机器学习入门大多要不门槛比较高，要不过于着重使用而忽视基础原理，所以我决定开一个新的系列针对程序员讲讲机器学习。这个系列会从机器学习的基础原理开始一直讲到如何应用，看懂这个系列需要一定的编程知识（主要会使用 python 语言），但不需要过多的数学知识，并且对于涉及到的数学知识会作出简单的介绍。
写给程序员的机器学习入门 (五) - 递归模型 RNN，LSTM 与 GRU （二） 2023-12-31 51298 浏览
接上一篇写给程序员的机器学习入门 (五) - 递归模型 RNN，LSTM 与 GRU （一）
写给程序员的机器学习入门 (三) - 线性模型，激活函数与多层线性模型（二） 2023-12-31 51431 浏览
接上一篇写给程序员的机器学习入门 (三) - 线性模型，激活函数与多层线性模型（一）
写给程序员的机器学习入门 (一) - 从基础说起（二） 2023-12-31 51331 浏览
接上一篇写给程序员的机器学习入门 (一) - 从基础说起（一）
写给程序员的机器学习入门 (五) - 递归模型 RNN，LSTM 与 GRU （一） 2023-12-31 51392 浏览
递归模型的应用场景在前面的文章中我们看到的多层线性模型能处理的输入数量是固定的，如果一个模型能接收两个输入那么你就不能给它传一个或者三个。而有时候我们需要根据数量不一定的输入来预测输出，例如文本就是数量不一定的输入，“这部片非常好看” 有 7 个字，“这部片很无聊” 有 6 个字，如果我们想根据文本判断是正面评价还是负面评价，那么就需要使用支持不定长度 (即可以接收 6 个又可以接收 7 个) 输入的模型。时序性的数据数量也是不一定的，例如一个运动中的球，从某个时间点开始的第 0 秒在位置 1，第 1 秒在位置 3，第 2 秒在位置 5，那么正确的模型应该可以预测出第 3 秒在位置 7，如下图所示。当然，时序性的数据可以固定一个窗口（例如最近的 5 条数据）来处理，这样输入数量就是一定的，但灵活性就降低了，窗口设置过小可能会导致没有足够的信息用于预测输出，过大则会影响性能。
写给程序员的机器学习入门 (四) - 训练过程中常用的技巧（一） 2023-12-31 51507 浏览
这篇将会着重介绍使用 pytorch 进行机器学习训练过程中的一些常见技巧，掌握它们可以让你事半功倍。使用的代码大部分会基于上一篇最后一个例子，即根据码农条件预测工资🙀。
写给程序员的机器学习入门 (三) - 线性模型，激活函数与多层线性模型（一） 2023-12-31 50786 浏览
生物神经元与人工神经元在了解神经元网络之前，我们先简单的看看生物学上的神经元是什么样子的，下图摘自维基百科：
写给程序员的机器学习入门 (二) - pytorch 与矩阵计算入门（一） 2023-12-31 50442 浏览
pytorch 是目前世界上最流行的两个机器学习框架的其中之一，与 tensoflow 并峙双雄。它提供了很多方便的功能，例如根据损失自动微分计算应该怎样调整参数，提供了一系列的数学函数封装，还提供了一系列现成的模型，以及把模型组合起来进行训练的框架。pytorch 的前身是 torch，基于 lua，而 pytorch 基于 python，虽然它基于 python 但底层完全由 c++ 编写，支持自动并列化计算和使用 GPU 加速运算，所以它的性能非常好。
写给程序员的机器学习入门 (四) - 训练过程中常用的技巧（二） 2023-12-31 49064 浏览
接上一篇写给程序员的机器学习入门 (四) - 训练过程中常用的技巧（一）

写给程序员的机器学习入门 (八 补充) - 使用 GPU 训练模型 （一）

显卡要求

安装显卡驱动

在 pytorch 中使用 GPU

相关资源

关注我们

写给程序员的机器学习入门 (八补充) - 使用 GPU 训练模型（一）