更新日志
Tiny-LLM 只保留简洁、面向发布的公开更新日志。这里记录真正对外有意义的版本里程碑。
语言选择
- 简体中文 (本页)
- English
发布版本
[2.0.2] — 2026-04-27
新增
- 量化工具: 新增
quantization.h/quantization.cpp,包含 F32→F16、Q4_0、Q8_0、W8A16 工具函数 - CLI 增强: 新增
--help、--version、--info选项
变更
- KVCacheManager: 改用工厂方法
create()实现一致的Result<T>错误处理 - 代码质量: 为简单访问器添加
noexcept,修复 clang-format-18 违规
基础设施
- CI 简化,使用
Jimver/cuda-toolkitaction - 增强
.clangdLSP 配置
[2.0.1] — 2026-04-16
修复
- 严重: 测试工具中
QuantizedWeight尺度维度计算错误 - 移除注意力 kernel 中未使用的代码(
q_reg数组加载)
[2.0.0] — 2026-03-09
变更 ⚠️ 破坏性变更
- API 重新设计: KVCache
appendKV()现在无状态,需要显式调用advanceSeqLen() - CMake 现代化,支持 target 导出和架构自动检测
新增
- 包含自动格式检查的 CI 工作流
tiny_llm::tiny_llmCMake 别名 target
迁移指南: 任何直接使用 KVCache 的代码都需要在所有层完成后调用 advanceSeqLen()。