小米再次在大模型領(lǐng)域掀起波瀾。繼上月發(fā)布三款自研大模型后,這家科技巨頭于近日深夜正式推出新一代MiMo-V2.5系列,包含四款不同定位的模型:旗艦版MiMo-V2.5-Pro、通用版MiMo-V2.5,以及專注語音合成的V2.5-TTS Series和語音識別的V2.5-ASR。其中前兩款模型將于近期面向全球開發(fā)者開源,后兩者則進(jìn)入最終測試階段。
新系列被定義為"智能體時(shí)代全棧解決方案",構(gòu)建了覆蓋推理、多模態(tài)交互與語音處理的完整技術(shù)矩陣。旗艦型號MiMo-V2.5-Pro專為復(fù)雜智能體任務(wù)設(shè)計(jì),在內(nèi)部測試中展現(xiàn)出驚人能力:配合特定運(yùn)行框架可穩(wěn)定處理近千輪工具調(diào)用的超長任務(wù),在保持邏輯連貫性的同時(shí)精準(zhǔn)捕捉上下文隱含要求。該模型在AI編程智能體基準(zhǔn)測試SWE-Bench Pro中取得57.2分,與行業(yè)頂尖模型Claude Opus 4.6僅相差0.1分;在小米自研的MiMo Coding Bench評測中,其得分從上一代的71.5分提升至73.7分,逐步縮小與頭部模型的差距。
技術(shù)團(tuán)隊(duì)披露的實(shí)戰(zhàn)案例更具說服力。在實(shí)現(xiàn)完整SysY編譯器的挑戰(zhàn)中,V2.5-Pro僅用4.3小時(shí)完成672次工具調(diào)用,在隱藏測試集取得滿分成績,而人類開發(fā)者通常需要數(shù)周時(shí)間。另一個(gè)獨(dú)立開發(fā)Web視頻編輯器的任務(wù)中,該模型通過1868次工具調(diào)用構(gòu)建出包含多軌道時(shí)間線、片段裁剪等功能的完整應(yīng)用,最終生成8192行代碼。這些突破標(biāo)志著長程任務(wù)處理能力發(fā)生質(zhì)變,為智能體落地復(fù)雜應(yīng)用場景奠定基礎(chǔ)。
通用型號MiMo-V2.5則聚焦多模態(tài)交互場景,支持視覺、聽覺與文本信息的一體化處理,上下文窗口擴(kuò)展至100萬Token。相較于Pro版本,其平均推理速度提升30%,更適合對響應(yīng)延遲敏感的實(shí)時(shí)交互場景。在評估智能體解決現(xiàn)實(shí)問題能力的Claw-eval多模態(tài)評測中,該模型取得23.8分,較前代提升50%。
成本優(yōu)化成為新系列另一大亮點(diǎn)。通過深度優(yōu)化Token利用率,V2.5-Pro在相同評測分?jǐn)?shù)下較Kimi K2.6節(jié)省42%計(jì)算資源,V2.5較Muse Spark節(jié)省50%。配套的定價(jià)體系同步調(diào)整:取消復(fù)雜計(jì)費(fèi)模式,推出"連續(xù)包月/包年"訂閱方案,并在每日零點(diǎn)至八點(diǎn)提供八折優(yōu)惠。不同版本采用差異化消耗倍率,通用版保持1倍基準(zhǔn),旗艦版設(shè)定為2倍,整體使用成本顯著下降。
這種快速迭代能力源于小米對AI的戰(zhàn)略級投入。公司創(chuàng)始人雷軍今年3月宣布,未來三年將投入超600億元用于AI技術(shù)研發(fā),為模型訓(xùn)練提供充足算力支持。大模型團(tuán)隊(duì)負(fù)責(zé)人羅福莉指出,行業(yè)正經(jīng)歷從"對話交互"到"智能體范式"的劇烈轉(zhuǎn)變,小米需要抓住移動(dòng)端智能體賽道的關(guān)鍵窗口期。
終端生態(tài)的協(xié)同效應(yīng)開始顯現(xiàn)。小米澎湃OS 3 Beta版已向部分機(jī)型推送"龍蝦"智能體Xiaomi miclaw,新增人格體系、技能體系與跨設(shè)備同步功能,支持80余項(xiàng)系統(tǒng)工具調(diào)用。這種模型能力與終端體驗(yàn)的雙向促進(jìn),正在形成獨(dú)特的競爭優(yōu)勢——更強(qiáng)大的模型支撐更智能的終端服務(wù),海量終端數(shù)據(jù)反哺模型持續(xù)優(yōu)化。隨著600億投入逐步落地,小米的"月更模式"或許將重塑行業(yè)技術(shù)迭代節(jié)奏。







