常见编程模型及其优化
去年开始从java后端开发转到了这个方向,学习到了很多sycl的知识,但是cuda的应用范围更加广泛,所以还是打算研究一下。
这个仓库主要会记录下将建的并行编程模型,如reduce,scan,matmul,conv等算法的实现以及优化,总结下常见的性能优化方案,以及性能测量工具的使用,还有就是性能预估之类(Roof line model)
Todo List
- 仓库框架的搭建,主要是基础的工具类
- Roof line model
- reduce
- scan
- matmul
- conv
- 常见优化总结
On this page
Languages
C++73.5%C16.4%Makefile6.2%CMake2.5%Cuda1.3%TypeScript0.0%
Contributors
Created November 28, 2023
Updated December 1, 2023