PyTorch 默认 GPU|极客笔记

PyTorch 默认 GPU

在机器学习和深度学习领域，PyTorch 是一个备受推崇的开源深度学习框架。PyTorch 提供了易于使用的接口和灵活的功能，使得训练和部署深度学习模型变得更加简单。在使用 PyTorch 进行深度学习任务时，通常需要使用 GPU 来加速计算，以提高模型训练的速度和效率。在本文中，我们将详细解释 PyTorch 如何默认使用 GPU 进行计算以及如何检查和确认 PyTorch 是否在 GPU 上运行。

为什么使用 GPU

GPU（图形处理单位）是一种专门用于图形处理的处理器。由于其并行计算的特性，GPU 也被广泛应用于深度学习领域。与传统的 CPU 相比，GPU 在进行大规模矩阵运算时具有更高的计算性能。深度学习模型通常涉及大量的矩阵运算，因此使用 GPU 可以显著加快模型训练和推理的速度。

PyTorch 默认情况下会使用 GPU 来加速计算，但在有些情况下，需要手动指定 PyTorch 在 GPU 上执行计算。

检查是否可以使用 GPU

在使用 PyTorch 之前，首先需要确保系统上已经安装了 NVIDIA 的 CUDA（Compute Unified Device Architecture）工具包。CUDA 是 NVIDIA 提供的一种并行计算平台和编程模型，它可以让深度学习框架利用 GPU 进行加速计算。

使用 PyTorch 默认的 GPU

在大多数情况下，PyTorch 可以通过以下简单的方法自动选择 GPU 来运行：

import torch

# 检查系统中是否有可用的 GPU
if torch.cuda.is_available():
    device = torch.device("cuda")
    print('Using GPU:', torch.cuda.get_device_name(0))
else:
    device = torch.device("cpu")
    print('Using CPU')

在上面的代码中，我们首先检查系统中是否有可用的 GPU。如果存在 GPU，则将 PyTorch 的设备设置为 CUDA 并输出所使用的 GPU 设备名称；如果没有 GPU，则将设备设置为 CPU。

接下来，我们可以使用 to() 方法将 PyTorch 的张量或模型移动到所选的设备：

# 创建一个随机张量
x = torch.randn(3, 3)

# 将张量移动到所选的设备
x = x.to(device)

此时，PyTorch 将根据系统中的 GPU 自动选择 GPU 进行计算。

手动指定 GPU

有时候，我们可能希望手动指定 PyTorch 在特定的 GPU 上执行计算。这在同时运行多个 PyTorch 任务时尤为重要。

import torch

# 检查系统中是否有可用的 GPU
if torch.cuda.is_available():
    device = torch.device("cuda:0")  # 选择第一个 GPU
    print('Using GPU:', torch.cuda.get_device_name(0))
else:
    device = torch.device("cpu")
    print('Using CPU')

# 创建一个随机张量
x = torch.randn(3, 3)

# 将张量移动到指定的设备
x = x.to(device)

在上面的代码中，我们通过指定 cuda:0 来选择系统中的第一个 GPU。如果系统中有多个 GPU，可以使用 cuda:1、cuda:2 等来选择其他 GPU。

检查 PyTorch 是否在 GPU 上运行

在运行 PyTorch 代码时，有时我们需要确保 PyTorch 正确地在 GPU 上进行计算。可以通过以下方法来检查 PyTorch 是否在 GPU 上运行：

import torch

# 检查当前张量的设备
print('Tensor device:', x.device)

# 检查 PyTorch 当前使用的设备
print('PyTorch device:', torch.cuda.current_device())

在上面的代码中，我们可以通过 device 属性来查看张量 x 当前所在的设备，通过 torch.cuda.current_device() 来查看 PyTorch 当前使用的设备。

性能对比

接下来，我们将利用一个简单的示例来比较在 CPU 和 GPU 上运行同一个操作的性能差异。我们将分别计算在 CPU 和 GPU 上执行 10000 次矩阵相乘所需的时间，并进行性能对比。

import time
import torch

# 创建两个大小为 1000x1000 的随机矩阵
a = torch.randn(1000, 1000)
b = torch.randn(1000, 1000)

# 在 CPU 上执行矩阵相乘并计时
start = time.time()
c_cpu = torch.matmul(a, b)
end = time.time()
print('Matrix multiplication on CPU:', end - start, 's')

# 将矩阵移动到 GPU 上执行矩阵相乘并计时
a = a.to("cuda")
b = b.to("cuda")
start = time.time()
c_gpu = torch.matmul(a, b)
end = time.time()
print('Matrix multiplication on GPU:', end - start, 's')

在上面的代码中，我们首先创建了两个大小为 1000×1000 的随机矩阵 a 和 b。然后在 CPU 上执行矩阵相乘并计时，接着将矩阵移动到 GPU 上执行矩阵相乘并计时。最后比较在 CPU 和 GPU 上执行矩阵相乘所需的时间。

通过运行上述代码，我们可以看到在 GPU 上执行矩阵相乘比在 CPU 上执行矩阵相乘要快得多。这清楚地展示了使用 GPU 可以显著提高深度学习模型的训练和推理速度。

总结

在本文中，我们详细解释了如何在 PyTorch 中默认使用 GPU 进行计算。我们介绍了如何检查系统中是否有可用的 GPU，以及如何使用 PyTorch 默认的 GPU。此外，我们还讨论了手动指定 GPU 和检查 PyTorch 是否在 GPU 上运行的方法。最后，通过一个简单的示例对比了在 CPU 和 GPU 上执行矩阵相乘的性能差异。

使用 GPU 可以显著加速深度学习模型的训练和推理过程，因此建议在进行深度学习任务时优先考虑使用 GPU。