发布于 2025-02-24
AI 摘要
今日,DeepSeek“开源周”活动正式启动,首个开源项目为FlashMLA,这是一款针对Hopper GPU的高效MLA解码内核。FlashMLA专为处理可变长度序列设计,已进入生产使用阶段。该内核优化了多层注意力机制