“一本正經地胡說八道”,是許多人對當前開放式內容生成功能不滿的方面。7月25日,科大訊飛宣布基于全國產算力訓練的深度推理大模型訊飛星火X1再次升級,此次升級的重點就瞄準幻覺治理。
據科大訊飛研究院院長劉聰介紹,星火X1此次升級取得的最大突破,就是無論是對自身生成內容真實性的把控(事實性幻覺治理),還是在參考外部資料時對原文的忠實程度(忠實性幻覺治理),都有顯著改善,大大提升了大模型在行業應用中的可靠性。
“整體來看,新版本星火X1的綜合能力大幅提升,在翻譯、推理、文本生成、數學等核心能力上已能對標OpenAI o3等國際一流大模型最新版本效果,多語言能力更是擴展至130余種。”劉聰表示,與此同時,基于星火X1的語音同傳大模型也迎來全面升級,教育、醫療、企業應用、代碼、科研等行業大模型和智能體均取得新突破,在復雜行業場景任務上進一步滿足用戶核心需求。
面對大模型容易“胡說八道”的通病,科大訊飛大模型技術團隊提出了基于多路徑采樣驗證及事實性約束強化學習的“幻覺治理技術”。在該技術加持下,大模型在思考過程及回復生成階段,能實現客觀問題與標準答案的深度強對齊,大幅減少了在慢思考下的幻覺率,讓大模型回復通用常識及專業知識問題時更加可靠。
此外,在數據層面,科大訊飛還開創性地提出了基于人類專家數據的通用認知任務數據反寫技術,有效地解決了有監督微調下高質量數據獲取困難、人工標注費時費力等現實挑戰,實現了主觀語言類任務文筆和風格化的顯著提升。
星火X1的升級并非只停留在技術層面,其核心價值在于深入解決各行業的復雜場景需求,推動AI真正融入生產生活。得益于星火X1的升級,其在教育、醫療、企業應用、代碼、科研等多個行業場景的能力也“水漲船高”,應用更深入。
例如,借助星火X1的升級賦能,星火醫療大模型在全科輔助診斷、體檢報告解讀、健康咨詢、導醫導診等通用醫療任務上也實現了能力的躍升。其中,在醫生輔助診療方面,星火應用范圍不斷擴大,已覆蓋從基層全科到三甲專科、從門診到住院的完整診療鏈條。目前在四川大學華西醫院、北京安貞醫院、中國科學技術大學附屬第一醫院等多家知名醫院開展試點,效果表現持續亮眼。
此外,升級后的語音同傳技術已全面應用于訊飛雙屏翻譯機、訊飛AI錄音筆及同傳服務,并作為2025世界人工智能大會(WAIC)唯一翻譯合作伙伴,為大會提供無障礙溝通支持。
本文鏈接:瞄準幻覺治理,訊飛星火X1再升級http://m.sq15.cn/show-11-23856-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
下一篇: 第二屆全國交通智能建造學術會議在武漢召開