GitHunt
LE

leizhenyuan/Parallel_programming_pattern

常见编程模型及其优化

去年开始从java后端开发转到了这个方向,学习到了很多sycl的知识,但是cuda的应用范围更加广泛,所以还是打算研究一下。
这个仓库主要会记录下将建的并行编程模型,如reduce,scan,matmul,conv等算法的实现以及优化,总结下常见的性能优化方案,以及性能测量工具的使用,还有就是性能预估之类(Roof line model)

Todo List

  1. 仓库框架的搭建,主要是基础的工具类
  2. Roof line model
  3. reduce
  4. scan
  5. matmul
  6. conv
  7. 常见优化总结

Languages

C++73.5%C16.4%Makefile6.2%CMake2.5%Cuda1.3%TypeScript0.0%

Contributors

Created November 28, 2023
Updated December 1, 2023
leizhenyuan/Parallel_programming_pattern | GitHunt