基本は公式の以下URLを参照。
また先日リリースされましたTensorFlow 2.1.0よりデフォルトのpipパッケージ内にGPUサポートも含まれるようになったようです。以前のように「pip install tensorflow-gpu」とする必要はなくなりました。
その他の点についてメモ代わりに補足しておきます。
必要要件(Software requirements)に「NVIDIA® GPU drivers」「CUPTI」とありますが、これらは「CUDA® Toolkit」インストール時に付属していました。必要なバージョンはTensorFlowのバージョンに依存しますので各々で要確認してください(TensorFlow2.1.0ではCUDA 10.1と公式に書いてあります)。
cuDNN SDKのインストールに関しては、以下のファイルたちをCUDA Toolkitをインストールしたディレクトリーにコピーしましょう(v10.1の場合)。
- <installpath>\cuda\bin\cudnn64_7.6.5.32.dll → C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin
- <installpath>\cuda\ include\cudnn.h → C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include
- <installpath>\cuda\lib\x64\cudnn.lib → C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64
またインストール時に<CUDA_PATH>のシステム環境変数は自動で通っていました。別途、環境変数の<Path>に以下を追加しましょう。
- C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin
- C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\libnvvp
- C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\CUPTI\libx64
公式手順はこちら。
最後にもう一つ補足情報として、構築したGPU環境でお試しにmnistを学習させてみたらGPUメモリがオーバーフローしてJupyter Notebookのカーネルが死亡しました。下記URLを参考にメモリの使用制限をしたら学習できました(TensorFlowのバージョンによって手順が異なるようなので注意)。
その他の参考記事はこちら。