GPU SpMV:把项目当成工程作品来阅读
为什么这个项目值得单独写成白皮书
- SpMV 是典型的 内存带宽受限 问题,性能上限主要由访存效率决定。
- 真正有展示价值的不只是 kernel 本身,而是 为什么选它、什么时候选它、如何证明它值得选。
- 这个项目同时强调 CUDA 性能、RAII 资源管理、错误处理和可读文档,这让它更像工程作品,而不只是 demo。
这份白皮书会回答什么
- 这个问题为什么重要,以及 GPU SpMV 的瓶颈是什么。
- 四类 kernel 与自动选择策略分别解决了什么。
- 项目如何把性能、工程规范和可解释性结合起来。
- 哪些页面提供架构、性能、API 与引用材料,方便继续深入。
阅读路径
| 页面 | 作用 |
|---|---|
| 设计哲学 | 看这个项目优先优化什么、舍弃什么 |
| 性能分析 | 看 benchmark 应该怎么读,数据说明什么 |
| 架构概览 | 看执行流水线、数据流和模块边界 |
| API 参考 | 看对外接口与使用方式 |
| 学术参考 | 看论文、项目与延伸材料 |