相关搜索
早已悄悄“融合”。 DeepSeek V4的技术报告里,用了Kimi 提出的 Muon优化器;Kimi K2 的底层架构里,又用了DeepSeek 提出的MLA。 两家公司的论文互相引用,技术栈彼此嵌套,
当前文章:http://o7d0a7.wenxuanke.cn/xics/79fz.html
发布时间:16:05:30
文章观点支持