【CUDA 12】Ubuntu 22.04へのインストール手順と問題解決

はじめに

Ubuntu 22.04 LTS環境でCUDA 12をインストールしようとした際に、NVIDIAドライバーの競合やPATH設定の問題、安装方法の選択に迷う方も多いのではないでしょうか。本記事では、Ubuntu 22.04にCUDA Toolkit 12を正しくインストールする手順と、代表的なトラブルシューティング方法について解説します。

結論

Ubuntu 22.04にCUDA 12をインストールするには、NVIDIA公式リポジトリを追加してインストールする方法が最も推奨されます。インストール後は環境変数の設定と_drv__.confファイルの構成が必要です。

前提条件

安装を開始する前に、以下の條件を満たしていることを確認してください:

  • Ubuntu 22.04 LTSがクリーンインストールされている
  • NVIDIAGPUが搭載されている
  • 管理者権限(sudo)を持っている
  • インターネットに接続されている

具体的な安装手順

ステップ1:システムのアップデート

まず、システムパッケージを最新状態にアップデートします。

sudo apt update
sudo apt upgrade -y

ステップ2:NVIDIAドライバーの確認とインストール

既存のNVIDIAドライバーがインストールされているか確認します。

nvidia-smi

このコマンドでGPU情報が表示されない場合は、ドライバーのインストールが必要です。Ubuntuの「追加ドライバー」アプリ,或者は以下コマンドでインストールできます。

sudo ubuntu-drivers autoinstall

または、NVIDIA公式リポジトリからドライバーをインストールする場合は以下を実行します。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
sudo apt update
sudo apt install nvidia-driver-535

※バージョン番号は適宜实际情况に合わせて変更してください。

ステップ3:CUDA Toolkit 12のリポジトリ追加

NVIDIA公式リポジトリを追加します。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/cuda/12.1.0/cuda-repo-ubuntu2204-12-1-local_12.1.0-470.57.02-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-1-local_12.1.0-470.57.02-1_amd64.deb
sudo apt update
sudo apt install cuda-toolkit-12-1

※バージョン(12.1.0)はニーズに合わせて変更可能です。CUDA 12.0の場合は соответствующий debファイルをダウンロードしてください。

ステップ4:環境変数の設定

CUDAを使用するためにPATHとライブラリパスを設定します。~/.bashrcまたは~/.profileの末尾に追加します。

export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH

設定を反映させます。

source ~/.bashrc

ステップ5:インストール確認

nvcc(CUDAコンパイラー)が正しく動作するか確認します。

nvcc --version

以下のようにバージョン情報が表示されれば成功です。

nvcc: NVIDIA (R) CUDA compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Wed_Feb_22_11:19:34_PST_2023
Cuda compilation tools, release 12.1, V12.1.66
Build cuda_12.1.r12.1/compiler.32688072_0

トラブルシューティング

問題1:nvccコマンドが見つからない

症状:「nvcc: command not found」というエラーが発生する

解決方法:環境変数が正しく設定されているか確認します。

echo $PATH | grep cuda
which nvcc
/usr/local/cuda/bin/nvcc --version

Pathが通っていない場合は、手動でPathを追加してください。

問題2:NVIDIAドライバーとの競合

症状:CUDAをインストールしようととすると、既存のNVIDIAドライバーが競合するという警告が表示される

解決方法:事前にインストールされているNVIDIA関係をクリーンインストールするのが効果的です。

sudo apt --purge remove "*nvidia*"
sudo apt autoremove
sudo reboot

再起動後、NVIDIAドライバーを再インストールします。

問題3:CUDAサンプルビルドエラー

症状:CUDAサンプルコードをビルドしようとするとエラーが発生する

解決方法:必要な依存パッケージをインストールします。

sudo apt install build-essential cmake git

問題4:libcuda.soが見つからない

症状:「libcuda.so.1: cannot open shared object file」というエラー

解決方法:/etc/ld.so.conf.d/にCUDAライブラリのパスを追加します。

echo "/usr/local/cuda/lib64" | sudo tee /etc/ld.so.conf.d/cuda.conf
sudo ldconfig

補足・注意点

  • バージョン選択:CUDA 12.0と12.1では若干の違いがあります。使用するGPUやTensorFlow/PyTorchなどのフレームワークに合わせてバージョンを選択してください。
  • 驱动兼容性:NVIDIA driverバージョンとCUDAバージョンの互換性を確認してください。NVIDIA公式ドキュメントで互換性マトリクスを提供しています。
  • WSL2环境:WindowsでWSL2を使用している場合は、Linux用のインストール手順とは異なり、NVIDIA提供的WSL2用 CUDA Toolkitを使用する必要があります。
  • Docker使用:DockerでCUDAを使用する場合、nvidia-docker2またはNVIDIA Container Toolkitのインストールが必要です。
  • CUDAとDeep Learning:TensorFlowやPyTorchを使用する場合は、Python環境とCUDA/cuDNNのバージョン整合が重要です。

参考元

おすすめ環境

🔧 快適な開発環境のために

本記事の手順をスムーズに進めるために、以下のスペックを推奨します。

この記事は役に立ちましたか?