简体中文
主题
聚焦 DAG 执行、多流调度与内存复用的精简 GPU 运行时。
以依赖图组织算子,并通过确定性的拓扑顺序执行。
独立任务可跨 CUDA stream 并发运行,依赖边通过 event 保持同步。
Pinned 与 device 分配采用池化复用,降低重复运行时的内存抖动。
仓库围绕少量内置核心算子维护长期价值,而不是扩散外部适配层。
Mini-ImagePipe 现在明确收敛为四层核心结构:
Pipeline
TaskGraph
DAGScheduler
MemoryManager