📚
渐进式学习
从基础访存模式一路学习到更高级的 GPU 内核与架构特性说明。
在一个聚焦的仓库中学习 GEMM、FlashAttention、量化与 GPU 性能优化。
从基础访存模式一路学习到更高级的 GPU 内核与架构特性说明。
从指南、示例和架构说明快速切入,而不是在重复的文档表面之间来回跳转。
指南、示例、架构说明和 API 页面互相补充,而不是简单复制 README。
| 目标 | 从这里开始 |
|---|---|
| 配置并构建项目 | /zh-CN/guide/installation |
| 运行第一个示例 | /zh-CN/guide/quick-start |
| 学习优化模式 | /zh-CN/guide/memory |
| 直接进入矩阵乘法 | /zh-CN/guide/gemm |
| 查看架构说明 | /zh-CN/api/architecture |
这个站点是仓库的精简 landing layer。你可以先选择学习路径,再进入示例、架构说明或 API 参考,而不是把它当作 README 的简单镜像。