[0.0]本字幕由TMEAI技术生成 [0.27]没有 [1.86]二月二十五日是deepseek开源周 [3.94]第二日 [4.68]deepsick宣布开源DPP第一个用于MOE模型训练和推理的开源EP通信库 [12.28]二十四日 [13.12]deepseek则开源了代码库flashMLA [16.4]这是针对hoperGPU优化的高效MLA解码内核 [20.52]针对可变长度序列做了优化 [23.28]MOE混合专家架构和MLA多头潜在注意力机制被认为是deepthick以低成本实现初表现的核心原因