全球人工智能競賽鼓點正愈發密集,一家來自上海的AI獨角獸公司——MiniMax,用一場“技術發布周”,宣告其在基座模型、多模態技術和通用智能體Agent、視頻Agent等領域的全面突破,秀出了其在大模型領域自主創新的“肌肉”。
6月17日到23日,MiniMax先后發布了全球首個開源大規?;旌霞軜嬐评砟P蚆iniMax-M1、視頻模型Hailuo-02、MiniMax Agent、國內首個成片創作助手Hailuo Agent和音色設計Voice Design。這一系列密集發布不僅展示了其在大模型領域的技術積累,更是在全球AI進入“下半場”的關鍵節點,展示了發展AI的另一條道路。
開源MiniMax-M1,重塑成本效益
MiniMax M1的開源,被譽為是“全球首個開源大規?;旌霞軜嫷耐评砟P汀保浜诵膬r值不僅在于在多個生產力場景中比肩甚至超越頂尖閉源模型,更在于其成本效益和技術創新,為AI的規模化應用提供了新的可能。
例如,其獨有的“閃電注意力”(Lightning Attention)混合架構與創新性的CISPO算法,在實現業內最高的100萬上下文的輸入與業內最長的8萬Tokens的推理輸出的同時,可大幅提升計算效率。在最新的 Artificial Analysis Intelligence Index 榜單中,MiniMax M1位列全球開源模型第二名。
得益于CISPO算法,M1模型的整個強化學習階段僅使用了512塊英偉達H800 GPU,耗時三周,成本僅為53.5萬美元。MiniMax官方表示,這一成本“比最初的預期少了一個數量級”,展示了其技術路線在成本控制上的巨大潛力。
MiniMax-M1發布后在海外引起了開發者的廣泛探討,社交平臺X知名AI博主MinChoi評論稱,MiniMax-M1是集Manus 、Deep Research、計算機技能和可愛于一體,隨即他還展出了自己用MiniMax-M1做的10個有趣案例。美國知名科技媒體 VentureBeat 稱為“正在攪動全球模型格局”,并成為當前開源體系下極具代表性的高性價比大模型。
讓電影級AI視頻創作人人可及
MiniMax發布的新一代視頻生成模型Hailuo 02,在對物理世界規律的理解和表現上實現了突破。例如,Hailuo 02的“噪聲感知計算重分配架構”(NCR),在將模型參數和訓練數據量分別提升3倍和4倍的同時,實現了2.5倍的效率提升。在國際測評榜單Artificial Analysis視頻競技場中,Hailuo-02一經發布便躋身全球第二。
據了解,Hailuo-02一經發布,海外社交媒體上就涌出了許多使用Hailuo 02生成的高難度動作視頻,其中一個貓咪跳水的視頻在發布5 小時后引起上億人圍觀。
MiniMax透露,從2024年8月偶然提供了一個展示視頻生成模型的Demo網頁,到后續快速推出海螺視頻(Hailuo Video)產品,至今為止Hailuo已幫助來自全球200個國家的創作者生成了超過3.7億個視頻。
從“解放大腦”到“解放手腳”
如果說M1和Hailuo-02是MiniMax展示其強大的“發動機”和“眼睛”,那么同步官宣的通用智能體產品——MiniMax Agent,則是這家公司對“AI能力”的深刻思考和交付回答。這個可以完成長程復雜任務的通用智能體,能多步規劃出專家級解決方案、能靈活拆解任務需求、并能執行多個子任務從而交付最終結果。
面對“Mag7投資組合雙移動平均線策略收益率分析”這類需要大量信息搜集、篩選和驗證的開放式任務,MiniMax Agent能夠活用多種工具,進行深度網絡研究,并最終給出精準、可靠的建議。無論是“新世紀福音戰士介紹”的深度解析,還是“盧浮宮”的藝術導覽,MiniMax Agent制作的PPT排版靈活、視覺美觀,能夠將復雜的信息進行清晰的可視化呈現。據悉在MiniMax 內部,該產品已經被使用了兩個月,已成為內部超半數員工日常使用的產品。
不同語種都能駕馭的語音模型
技術發布周上還包含語音模型Speech 02上的一個功能更新:Voice Design 音色設計。
簡而言之,用戶可以通過自然語言來描述自己心中所想的音色實現對多個維度的控制,生成甚至世界上不存在的音色。通過與Speech 02語音模型在鏈路上相配合,用戶在文字轉語音中可實現“所需即所得”,以“任意語言、任意口音、任意音色”實現自定義的音色組合。
相關負責人介紹,Voice Design生成聲音,解決了語音合成模型行業的兩個挑戰:精準匹配細分場景下的多樣需求、無需復刻他人聲音即可無風險實現腦海中音色表達。該負責人認為,這將持續降低全球用戶使用AI技術的門檻,讓不同語種的人都能駕馭語音模型。
據了解,語音模型Speech-02發布于5月中旬,發布后即登頂國際語音評測榜單Artificial Analysis。MiniMax表示,Speech-01/02兩代模型已經幫助用戶生成了累計超過1.5億小時的語音,并與超30個國家的客戶實現了合作落地。
分析人士認為,從底層基礎模型優化,到開創性的線性注意力混合架構,再到CISPO和NCR等算法與架構的持續迭代,MiniMax的創新呈現出一種“環環相扣、層層遞進”的良性循環。這種創新能力證明了,通過算法和架構的深度優化,可以打破“算力—資本”的壁壘。
此外,MiniMax的開源策略更具深意。選擇開放其大語言模型的核心能力,MiniMax彰顯了中國新一代AI企業的技術自信和開放胸懷。此舉將對推動全球AI平權、為開發者提供更多選擇大有裨益。
本文鏈接:MiniMax技術發布周,秀出自主創新“肌肉”http://m.sq15.cn/show-11-22476-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。