组内服务器使用指南
VPN 连接
- 地址:
https://vpn.ia.ac.cn
- 用户名:
xushuang
- 密码:
xushuang@2019
- 操作: 安装提示的插件后,即可正常使用SSH。
服务器 140
- 主环境:
- SSH:
ssh liguoqi@172.18.30.140
- 密码:
liguoqi811
- SSH:
- 操作: 在
/data1
磁盘创建自己的Docker容器,确保端口不与他人冲突。
服务器 133
- 主环境:
- SSH:
ssh ligq@172.18.30.133
- 密码:
ligq123's#1
- SSH:
- 操作: 在
/raid/ligq
磁盘映射自己的Docker容器,确保端口不与他人冲突。
Docker 创建与管理
- 确认显卡: 确保是NVIDIA显卡。
- NVIDIA Docker 教程: NVIDIA 官方文档
- 普通用户加入Docker组: CSDN博客教程
- Docker 操作指令:
- 查看运行中的Docker:
docker ps
- 查看所有Docker:
docker ps -a
- 删除指定容器:
docker rm -f [containerid]
- 查看运行中的Docker:
Docker 容器创建
- 创建教程: CSDN博客教程
- 注意: 需要将共享内存设置得更大,参考 这个教程
- 示例指令:
sudo docker run -p 8011:22 --ipc=host -v /data/sqy:/sqy --gpus 'all,"capabilities=compute,utility"' -it nvidia/cuda:11.6.0-devel-ubuntu20.04 /bin/bash
Docker 容器管理
- 启动:
docker start [id]
- 进入:
docker exec -it [id] /bin/bash
- 删除:
docker rm [id]
(谨慎操作,防止误删) - 停止:
docker stop [id]
- 重命名:
docker rename [原容器名] [新容器名]
服务器Docker ID
- 服务器 133:
3454d3fe60fe
- 服务器 140:
920f6903c855
注意事项
- 如果出现硬盘损坏导致Docker无法启动的问题,尝试重新启动Docker。如果是端口冲突导致的问题,删除本地的
known_host
。
创建过程:
-
sudo docker run -p 8024:22 --ipc=host -v /data/cyb:/cyb --gpus 'all,"capabilities=compute,utility"' -it nvidia/cuda:11.6.0-devel-ubuntu20.04 /bin/bash
-
我的docker id:
b11a13895df1
-
进入docker:
nvidia-docker exec -it b11a13895df1 /bin/bash
-
输入
vim /etc/ssh/sshd_config
,打开ssh配置文件,修改以下内容,以允许root账户通过密码登录: -
/etc/init.d/ssh restart
-
exit
-
sudo docker port b11a13895df1 22
注意: 为什么不显示映射端口号呢?原因是docker没有启动!!
1 | (base) liguoqi@cxhpc:/data$ docker port b11a13895df1 22 |
- docker,启动!:
docker start b11a13895df1
- 进入docker路径:
docker exec -it b11a13895df1 /bin/bash
-
- ssh,启动!:
/etc/init.d/ssh start
- ssh,启动!:
注意:vim中#
的内容表示注释
- cp -r /data/sqy/LAVIS /data/cyb
- cp -r /data/sqy/opt-2.7b /data/cyb