GitLocalDoc
服务器(CentOS 7.7)管理、深度学习环境搭建、配置及使用
Install / Use
/learn @kangzhiheng/GitLocalDocREADME
服务器(CentOS 7.7)管理、深度学习环境搭建、配置及使用

Author | kangzhiheng :-: | :-: E-mail | kangzhiheng@sjtu.edu.cn
谨以此文献给在交大的那段时光~
本文大约27320字,根据需求选择阅读,本文链接:https://github.com/kangzhiheng/GitLocalDoc
本文主要介绍了自己使用服务器进行管理和科研的一点心得。
本文主要介绍如何搭建和配置深度学习环境、Matlab环境,普通用户可以自由切换多版本CUDA、cuDNN版本,自由组合创建不同版本的Tensorflow、PyTorch等深度学习环境。
注意:标题右上角带有"*"标记的,意为这一部分内容需要管理员操作。
Table of Contents
- 安装计划
- 第一章:服务器情况简介
- 第二章:深度学习必备基础环境安装
- 显卡、NVIDIA驱动、CUDA、cuDNN和Tensorflow、Pytorch之间的对应关系
- NVIDIA驱动安装(CentOS、Ubuntu)*
- CUDA安装*
- CUDA文件下载
- 下载<a href="https://developer.nvidia.com/cuda-90-download-archive" rel="nofollow">CUDA 9.0</a>
- 下载<a href="https://developer.nvidia.com/cuda-91-download-archive-new" rel="nofollow">CUDA 9.1</a>
- 下载<a href="https://developer.nvidia.com/cuda-92-download-archive" rel="nofollow">CUDA 9.2</a>
- 下载<a href="https://developer.nvidia.com/cuda-10.0-download-archive" rel="nofollow">CUDA 10.0</a>
- 下载<a href="https://developer.nvidia.com/cuda-10.1-download-archive-base" rel="nofollow">CUDA 10.1 update2</a>
- 下载<a href="https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=runfilelocal" rel="nofollow">CUDA 10.2</a>
- 安装CUDA
- 卸载CUDA
- 查看当前CUDA版本的符号链接
- CUDA环境变量配置
- 验证CUDA安装
- 查看CUDA当前版本
- CUDA文件下载
- cuDNN安装*
- Anaconda3安装
- pip安装
- OpenCV安装
- GCC多版本切换*
- MatLab R2020a安装*
- 第三章:深度学习环境搭建
- 第四章:在服务器上利用GPU跑程序的简化步骤
- 第五章:服务器管理*
- 第六章:问题汇总
- 参考
安装计划
- [ ] 服务器系统
- [x] NVIDIA驱动安装
- [x] CUDA安装:9.0、9.1、9.2、10.0、10.1、10.2
- [x] cuDNN安装:7.0.5、7.4、7.6
- [x] SSH远程登录及文件传输
- [x] Aanconda安装
- [x] OpenCV安装(pip)
- [ ] Opencv源码编译
- [ ] GCC安装:4.8.5、7.3.1
- [ ] MatLab安装
- [x] Anaconda安装
- [x] Tensorflow各个版本的安装
- [x] PyTorch各个版本的安装
- [ ] Torch各个版本的安装
- [ ] Caffe安装
- [ ] 使用 Environment Module 管理不同版本的软件
第一章:服务器情况简介
查看系统硬件设备信息
运行
sudo dmidecode | more
查看服务器硬件设备信息,包括BIOS信息(BIOS Information)、服务器信息(System Information)、CPU信息(Processor Information)、缓存信息(Cache Information)、内存信息(Physical Memory Array)、电源信息(System Power Supply)、**内存设备(Memory Device)**等。
服务器型号为Dell R730,有两个显卡插槽,原机无显卡。2018年7月,在服务器上安装了一块GPU,型号为GTX 1080(lspci | grep -i nvidia),显存8G。
查看系统CPU
查看CPU的统计信息
lscpu
输出
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 6
On-line CPU(s) list: 0-5
Thread(s) per core: 1
Core(s) per socket: 6
座: 1
NUMA 节点: 1
厂商 ID: GenuineIntel
CPU 系列: 6
型号: 79
型号名称: Intel(R) Xeon(R) CPU E5-2603 v4 @ 1.70GHz
步进: 1
CPU MHz: 1200.085
CPU max MHz: 1700.0000
CPU min MHz: 1200.0000
BogoMIPS: 3400.03
虚拟化: VT-x
L1d 缓存: 32K
L1i 缓存: 32K
L2 缓存: 256K
L3 缓存: 15360K
NUMA 节点0 CPU: 0-5
Flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch epb cat_l3 cdp_l3 intel_pt tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm cqm rdt_a rdseed adx smap xsaveopt cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local dtherm arat pln pts
查看每个CPU信息,如每个CPU的型号,主频等。
cat /proc/cpuinfo
运行命令查看CPU型号,为Intel(R) Xeon(R) CPU E5-2603 v4 @ 1.70GHz。
查看内存
查看内存使用量和交换区使用量
free -m
查看内存详细情况
cat /proc/meminfo // 或者vmstat -s
输出
MemTotal: 40779120 kB
MemFree: 323944 kB
MemAvailable: 38162436 kB
Buffers: 1284976 kB
Cached: 36028884 kB
SwapCached: 0 kB
Active: 19560888 kB
Inactive: 18538364 kB
Active(anon): 1214532 kB
Inactive(anon): 270932 kB
Active(file): 18346356 kB
Inactive(file): 18267432 kB
Unevictable: 0 kB
Mlocked: 0 kB
SwapTotal: 0 kB
SwapFree: 0 kB
Dirty: 0 kB
Writeback: 0 kB
AnonPages: 785432 kB
Mapped: 139012 kB
Shmem: 700072 kB
Slab: 1861424 kB
SReclaimable: 1663764 kB
SUnreclaim: 197660 kB
KernelStack: 9504 kB
PageTables: 17908 kB
NFS_Unst
Related Skills
node-connect
353.3kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
111.7kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
353.3kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
353.3kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
Security Score
Audited on Apr 7, 2026
