新闻资讯

小米开源“XiaomiMiMo”大模型:以7B参数超越OpenAIo1-mini

ZAKER 科技 4 月 30 日消息,"Xiaomi MiMo" 公众号今日发文宣布,小米开源首个 " 为推理而生 " 的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的 " 小米大模型 Core 团队 " 的初步尝试。

在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括:

预训练:核心是让模型见过更多推理模式数据:着重挖掘富推理语料,并合成约 200B tokens 推理数据。训练:进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。

后训练:核心是高效稳定的强化学习算法和框架算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。框架:设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。

  • 澳门最精准正版龙门游戏体验:一场视觉与感官的双重盛宴
  • 美国据悉拟借能源合作拉拢俄罗斯 以期促成俄乌和平协议
  • 摩根大通交易部门转向看涨美股 但警告反弹势头恐难持久
  • 借助AI应用,自闭症人群开始有可能真正“读懂他人”
  • 年内公募机构斥资超85亿元参与定增
  • 国际货币基金组织总裁回应贝森特:对该组织的角色存在 “一点误解”
  • 澳门王中之王:传奇赌王何鸿燊的传奇人生
  • 招商信诺人寿信息科技部总经理张琦:在AI探索中始终围绕价值优先的二八原则
  • 贝尔德仍看空特斯拉
  • 江苏宁沪高速公路公布第一季度业绩 归母净利润约12.11亿元同比减少2.88%
  • 迎驾贡酒拟每股派发现金红利1.5元
  • 美官员称与乌克兰会谈富有成效,但仍存重大分歧
  • 交易额下降,不良率上升!银行信用卡业务如何转型?
  • 马上评|启动最高层级医政调查,维护医学一方净土
  • 港理大公布多项AI+医工成果,助港建设国际医疗创新枢纽
  • 关键词: