机器学习环境安装
由于机器学习所用的服务器一般是多人公用,所以很多地方涉及到低权限用户无法操作的问题,因此来记录一下。
安装Anaconda
Anaconda就相当于预装了很多环境,所以用来垫基础,这是清华的源
https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
在其中的bin中有pip,可以将其目录添加到path中
export PATH=$PATH:/home/user/anaconda3/bin
source ~/.bashrc
CUDA
chmod +x 然后./运行
只安装toolkit
export PATH=$HOME/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/cuda-10.0/lib64/
source ~/.bashrc
使用cuda-toolkit 看 安没安好
CUDNN
https://developer.nvidia.com/rdp/cudnn-download
cp cuda/include/cudnn.h include/
cp cuda/lib64/libcudnn* lib64/
chmod a+r include/cudnn.h lib64/libcudnn*
cat include/cuann.h | grep CUDNN_MAJOR -A5
tensorflow
pip install tensorflow-gpu.
安装的是python3的版本
错误汇总
-
failed to allocate 200.06M (209780736 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY: out of memory
限定使用的GPU
import os os.environ['CUDA_VISIBLE_DEVICES']='1'
-
用不了pip时的替代
python2.7 -m pip install 可替换pip install。
sudo python和用户python 不是一个python的问题
which python 查看使用的是哪个python,发现sudo which python和which python不是一个,导致了安装的环境不能正常使用的问题。
因此,将sudo的 python指向的位置改为了自己python的位置,使用软链接
sudo cp /usr/bin/python /usr/bin/python_bak
sudo rm /usr/bin/python
sudo ln -s /data/xxx/anaconda3/bin/python /usr/bin/python
另:如何将用户放入sudo组:
修改/etc/sudoers