MiniMax发布新款开源大模型,称其性价比优于DeepSeek。6月17日,国内大模型独角兽MiniMax发布世界上榜首个开源的大规模混合架构的推理模型MiniMax-M1,这也是“MiniMaxW
MiniMax发布新款开源大模型,最强M支称其性价比优于DeepSeek 。性价下文
6月17日,开源国内大模型独角兽MiniMax发布世界上榜首个开源的推理大规模混合架构的推理模型MiniMax-M1 ,这也是模型“MiniMaxWeek”系列发布活动的首个对外发布。
据MiniMax介绍,撑最M1在面向生产力的高百杂乱场景中才能是开源模型中的最好一档 ,逾越国内的输入闭源模型 ,挨近海外的最强M支最抢先模型,一起又有业界最高的性价下文性价比。
MiniMax发表,开源M1的推理优势是支撑现在业界最高的100万上下文的输入 ,和闭源模型里边的模型GoogleGemini2.5Pro相同,是撑最DeepSeekR1的8倍 ,以及业界最长的高百8万Token推理输出 。
此次MiniMaxM1的最大优势之一体现在本钱上。依据M1大模型剖析本身的技术优势显现,MiniMaxM1选用低本钱练习,仅用512块H800GPU三周时刻 ,本钱53.47万美元(约385万元)。
MiniMax称,得益于以闪电注意力机制为主的混合架构 ,从而在核算长的上下文输入以及深度推理的时分显着高效。依据归纳,在生成长度为10万tokens的场景下