本文描述申请GPU服务器完成后,如何访问GPU服务器。文档版本:V0.6.20240304
前置重要事项(仔细阅读!)
- 【非常重要!】请按照下列规则存放自己的数据,否则将导致数据丢失 !!!
- 【注意!】数据、模型和代码文件放在:
/root/data
目录下,可以在此目录下创建子文件夹。 - 【注意!】 服务器的存储仅供运行程序,产生模型等临时存储使用,请运行完成程序后及时将模型和代码等下载到本地进行备份(可以使用共享实例进行下载)。
- 【注意!】 服务器的存储不提供可靠性保证,不排除可能会因为断电、损坏等原因造成的数据损失!请及时下载重要的数据和结果!不要在服务器上长期存储数据!
- 运行环境放在
/opt/conda/envs
目录下,使用conda create
命令的时候也会自动安装到该目录下。 - 除了上述目录外,释放服务器、断电、重启将重置服务器,其余地方的数据都将全部丢失且无法找回!!!
- 【注意!】数据、模型和代码文件放在:
- 【非常重要】严禁向其他人发送服务器连接客户端的任何部分,严禁透露自己的SK连接码给别人!否则将导致服务器被攻击,可能导致数据丢失、硬件损坏等不可预料的情况!!!
- 服务器环境统一采用conda进行管理,如果连接服务器后
conda
命令无反应,请先执行:source /opt/conda/bin/activate
以激活conda命令。
由于 anaconda 的 base 环境不在
/opt/conda/envs/
目录下,因此请不要直接使用 base 环境,请使用conda create
命令自行创建虚拟环境(或点击查看文档“深度学习环境安装”进行安装)。由于用户的环境和数据均存储在分布式存储上,因此在加载环境/读取数据时速度相对本地较慢(受限于网络带宽),所以请耐心等待。
连接服务器
连接服务器不在需要使用特定的客户端,具体连接方式申请服务器后见”申请/释放服务器页面“
温馨提示
关于环境安装的问题,可查看文档:深度学习环境安装
请尽量使用
Screen
来运行自己的程序,否则当网络波动出现ssh断开时,正在执行的程序会中断!如果有
VS code
或Pycharm Professional
等软件使用ssh远程开发也是可以的,但是代码运行过程中受网络波动影响也可能发生程序中断的情况。如需安装其他软件,使用
apt-get install
命令即可,也可以根据软件官网提示进行安装,但是重新分配服务器也会重置所有软件,所以如果有特别常用且不方便频繁安装的软件请联系管理员处理。