Skip to content

Attention 性能

即将推出

详细的 FlashAttention 基准测试正在准备中。请稍后查看。

快速摘要

序列长度TensorCraftcuDNN比率
10240.5ms0.4ms80%
40962.1ms1.8ms85%
81928.5ms7.2ms85%

查看 性能基准概览 获取更多信息。

Released under the Apache 2.0 License.