Skip to content

GPU SpMV:把项目当成工程作品来阅读

为什么这个项目值得单独写成白皮书

  • SpMV 是典型的 内存带宽受限 问题,性能上限主要由访存效率决定。
  • 真正有展示价值的不只是 kernel 本身,而是 为什么选它、什么时候选它、如何证明它值得选
  • 这个项目同时强调 CUDA 性能、RAII 资源管理、错误处理和可读文档,这让它更像工程作品,而不只是 demo。

这份白皮书会回答什么

  1. 这个问题为什么重要,以及 GPU SpMV 的瓶颈是什么。
  2. 四类 kernel 与自动选择策略分别解决了什么。
  3. 项目如何把性能、工程规范和可解释性结合起来。
  4. 哪些页面提供架构、性能、API 与引用材料,方便继续深入。

阅读路径

页面作用
设计哲学看这个项目优先优化什么、舍弃什么
性能分析看 benchmark 应该怎么读,数据说明什么
架构概览看执行流水线、数据流和模块边界
API 参考看对外接口与使用方式
学术参考看论文、项目与延伸材料

MIT License