单文件 FM-index
后缀数组、BWT、Occ 采样和 contig 元信息统一保存为 .fm,比 BWA 多文件索引更易移动和归档。
| 用户 | 价值 |
|---|---|
| Rust 生物信息学开发者 | 直接复用 FM-index、SMEM、链构建、SW 和 SAM 组件。 |
| 算法学习者 | 用 Rust 阅读 BWA-MEM 风格核心流程,而不是从大型 C 代码库开始。 |
| 单端 reads 实验 | 需要可配置、可测试、易归档的单端比对基线。 |
| 安全敏感原型 | 需要禁止 unsafe 的 DNA 比对实验环境。 |
| 能力 | 状态 | 说明 |
|---|---|---|
| FASTA 参考输入 | 已交付 | 支持多 contig。 |
| FASTQ 单端 reads | 已交付 | 当前稳定数据路径。 |
.fm 索引 | 已交付 | 单文件 bincode 格式,magic/version 校验。 |
| SMEM + chaining + SW | 已交付 | BWA-MEM 风格,不追求 bit-level 兼容。 |
| SAM 输出 | 已交付 | CIGAR、MAPQ、AS/XS/NM、MD:Z、SA:Z。 |
| Rayon 并行 | 已交付 | read 级并行。 |
| 配对端 | 计划中 | 保留设计与局部基础设施,CLI 未开放。 |
| BAM/CRAM | 计划中 | 当前只输出 SAM。 |