Loading...

组内服务器使用指南

VPN 连接

  • 地址: https://vpn.ia.ac.cn
  • 用户名: xushuang
  • 密码: xushuang@2019
  • 操作: 安装提示的插件后,即可正常使用SSH。

服务器 140

  • 主环境:
    • SSH: ssh liguoqi@172.18.30.140
    • 密码: liguoqi811
  • 操作: 在/data1磁盘创建自己的Docker容器,确保端口不与他人冲突。

服务器 133

  • 主环境:
    • SSH: ssh ligq@172.18.30.133
    • 密码: ligq123's#1
  • 操作: 在/raid/ligq磁盘映射自己的Docker容器,确保端口不与他人冲突。

Docker 创建与管理

  • 确认显卡: 确保是NVIDIA显卡。
  • NVIDIA Docker 教程: NVIDIA 官方文档
  • 普通用户加入Docker组: CSDN博客教程
  • Docker 操作指令:
    • 查看运行中的Docker: docker ps
    • 查看所有Docker: docker ps -a
    • 删除指定容器: docker rm -f [containerid]

Docker 容器创建

  • 创建教程: CSDN博客教程
  • 注意: 需要将共享内存设置得更大,参考 这个教程
  • 示例指令: sudo docker run -p 8011:22 --ipc=host -v /data/sqy:/sqy --gpus 'all,"capabilities=compute,utility"' -it nvidia/cuda:11.6.0-devel-ubuntu20.04 /bin/bash

Docker 容器管理

  • 启动: docker start [id]
  • 进入: docker exec -it [id] /bin/bash
  • 删除: docker rm [id] (谨慎操作,防止误删)
  • 停止: docker stop [id]
  • 重命名: docker rename [原容器名] [新容器名]

服务器Docker ID

  • 服务器 133: 3454d3fe60fe
  • 服务器 140: 920f6903c855

注意事项

  • 如果出现硬盘损坏导致Docker无法启动的问题,尝试重新启动Docker。如果是端口冲突导致的问题,删除本地的known_host


创建过程:

  • sudo docker run -p 8024:22 --ipc=host -v /data/cyb:/cyb --gpus 'all,"capabilities=compute,utility"' -it nvidia/cuda:11.6.0-devel-ubuntu20.04 /bin/bash

  • 我的docker id:b11a13895df1

  • 进入docker:nvidia-docker exec -it b11a13895df1 /bin/bash

  • 输入vim /etc/ssh/sshd_config,打开ssh配置文件,修改以下内容,以允许root账户通过密码登录:

  • /etc/init.d/ssh restart

  • exit

  • sudo docker port b11a13895df1 22

注意: 为什么不显示映射端口号呢?原因是docker没有启动!!

1
2
3
(base) liguoqi@cxhpc:/data$ docker port b11a13895df1 22
0.0.0.0:8024
[::]:8024
  • docker,启动!:docker start b11a13895df1
  • 进入docker路径: docker exec -it b11a13895df1 /bin/bash
    • ssh,启动!: /etc/init.d/ssh start

注意:vim中#的内容表示注释

  • cp -r /data/sqy/LAVIS /data/cyb
  • cp -r /data/sqy/opt-2.7b /data/cyb