jinbooooom/ai-infra-hpc

hpc 教程，包含集合通信(mpi、nccl)、cuda 编程、向量化 SIMD、RDMA 通信等

AI-Infra HPC 学习与总结

本仓库用于记录 AI-Infra 与 HPC 技术：

AI System 的底层技术
集群多机多卡互联技术
并行计算与高性能计算
训练与推理

文件夹说明

各文件夹的内容如下：

├── 01 chip		# 芯片硬件
├── 02 hpc		# 高性能计算
│   ├── 01 openmp	
│   ├── 02 simd
│   └── 05 cuda		# GPU 编程
├── 03 link		# 多机多卡互联底层通信
│   ├── 01 noc		# 片上网络
│   ├── 02 pcie		# PCI-Express(peripheral component interconnect express)
│   ├── 03 topo		# 多机多卡互联以及拓扑相关
│   ├── 05 gpuDirect 	# GPU 与 Host、GPU、IB 网卡、NVMe SSD 的底层通信
│   └── 08 infiniband 	# IB 网卡与 RDMA 通信
├── 04 storage		# 存储
├── 05 ccl 		# 集合通信
│   ├── mpi 		# MPI 的使用与教程
│   └── nccl 		# NCCL 的使用、设计
├── 06 trainAndInfer 	# 训练与推理
├── 99 industryReport 	# 行业前沿报告

CUDA 总结

互联总结

GPUDirect 总结

RDMA 总结

NCCL 总结

训练与推理总结

Languages

Cuda78.9%C9.9%C++6.1%Makefile2.8%Python1.3%Shell0.7%CMake0.3%

Contributors

MIT License

Created July 23, 2024

Updated March 9, 2026

jinbooooom/ai-infra-hpc

AI-Infra HPC 学习与总结

本仓库用于记录 AI-Infra 与 HPC 技术：

文件夹说明

CUDA 总结

互联总结

GPUDirect 总结

RDMA 总结

NCCL 总结

训练与推理总结

On this page

Languages

Contributors