“為什么(AI醫(yī)療產(chǎn)品或模型)一直在發(fā)布,臨床卻總是不應(yīng)用?這是一個非常重要的問題。”
日前,在2025瑞金醫(yī)院RuiPath病理模型開源及成果發(fā)布會上,中國工程院院士、上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院(以下簡稱“瑞金醫(yī)院”)院長寧光一開場,就直指AI+醫(yī)療落地的“病灶”。
這也就有了此次發(fā)布會的主題:將模型成果開源。
不久前,瑞金醫(yī)院攜手華為,打造了瑞金RuiPath病理大模型。醫(yī)生在RuiPath的幫助下,能夠在幾秒鐘內(nèi)完成一張全視野病理切片的診斷,效率大大提升,可診斷癌癥類型覆蓋中國每年癌癥發(fā)病人數(shù)90%的19個常見癌種。
這樣的能力,他們希望能全國推廣——我國注冊病理醫(yī)生不足兩萬人,面臨著至少14萬的缺口;且大多數(shù)病理醫(yī)生集中于大城市(80%)和三甲醫(yī)院(70%),基層醫(yī)院病理診斷能力缺失。
瑞金醫(yī)院與華為決定開源RuiPath病理模型。他們希望通過開源共享共建,讓RuiPath病理模型在中國實現(xiàn)真正的臨床可及。
“AI走到今天,走向真正臨床應(yīng)用,這是我們要跨出的非常重要的一步。”寧光說。
用華為醫(yī)療衛(wèi)生軍團(tuán)總裁張偉力的話說,這是長期主義和實用主義的成果。他告訴記者,在跨出開源這一步前,華為和瑞金醫(yī)院已經(jīng)通過務(wù)實合作,攜手走過了3年。
RuiPath視覺基礎(chǔ)模型開源啟動儀式。瑞金醫(yī)院供圖
一次“精心策劃的技術(shù)革命”
文章開頭寧光院士的發(fā)問,直指行業(yè)痛點(diǎn)——AI在醫(yī)療領(lǐng)域的應(yīng)用喊了很多年,很多廠家也做了大大小小的許多模型,動輒是“超越人類水平”的標(biāo)題,甚至頂刊論文也層出不窮,但在真實的醫(yī)院場景中,真正能大規(guī)模、全流程地用到臨床的AI仍舊鳳毛麟角。
對于上述“寧光之問”,張偉力有切身的體會。
“AI時代三要素:數(shù)據(jù)、算法、算力,但是要真正將AI應(yīng)用于醫(yī)療,光有這些是不夠的。”張偉力說,AI要真正從實驗室走向臨床、在醫(yī)療等領(lǐng)域?qū)崿F(xiàn)行業(yè)化落地,首先要打破“認(rèn)知鴻溝”。
“就拿華為和瑞金醫(yī)院來講,華為公司有大量的AI科學(xué)家,但是他們不懂臨床的真實痛點(diǎn)和復(fù)雜流程;瑞金醫(yī)院大量的醫(yī)學(xué)專家,不了解AI的能力邊界和實現(xiàn)路徑。如果沒有了解和磨合,雙方就是‘雞同鴨講’,醫(yī)院需求和技術(shù)方案無法匹配。”張偉力說。
為了打破認(rèn)知鴻溝,華為和瑞金醫(yī)院“雙向奔赴”。
“我們的AI專家深入科室,理解病理醫(yī)生從切片制作、閱片、診斷到報告的全流程;醫(yī)學(xué)專家也將幾十年的臨床知識、診斷邏輯和病理診斷全流程告訴AI專家,從而將寶貴經(jīng)驗沉淀為AI可以理解的語言。”張偉力介紹說,兩股力量的團(tuán)隊“天天泡在一起”,不斷創(chuàng)新技術(shù)、改進(jìn)方案,最終設(shè)計出數(shù)據(jù)方案和算法模型。
雙方團(tuán)隊展開交流。 華為存儲 供圖
瑞金醫(yī)院病理科主任王朝夫分享說,RuiPath病理大模型結(jié)合了AI、大數(shù)據(jù)和計算病理學(xué)的最新成果,覆蓋了疾病診斷的全生命周期,貫穿病理診斷全流程。在該模型的輔助下,病理科醫(yī)生不必在顯微鏡頭下逐個尋找病灶,只需以互動方式審核AI診斷結(jié)果,幾秒鐘內(nèi)就能精準(zhǔn)識別出病理切片中的病灶區(qū)域、完成解讀,顯著提升了診斷效率和質(zhì)量。
據(jù)介紹,RuiPath病理大模型在業(yè)界12個主流公開數(shù)據(jù)集的14個下游任務(wù)測試中,有7個達(dá)到業(yè)界領(lǐng)先水平,并已具備臨床驗證能力。
“這樣的方案和模型,是真正‘從臨床中來,到臨床中去’的。”張偉力對記者說道,從3年前協(xié)助瑞金醫(yī)院開展數(shù)字化病理相關(guān)工作,到今天開源RuiPath病理模型,過程中雙方踏平了模型從開發(fā)到落地應(yīng)用最難走的一段路,“可以說這是一次精心策劃的技術(shù)革命”。
數(shù)據(jù)準(zhǔn)備,一步一個腳印
3年來,雙方在“數(shù)據(jù)準(zhǔn)備”工作上下的工夫最大。
RuiPath病理大模型的誕生,離不開高質(zhì)量數(shù)字化病理數(shù)據(jù)的“滋養(yǎng)”。然而,在數(shù)據(jù)準(zhǔn)備階段,即便是病理切片圖像數(shù)據(jù)有著豐厚“家底”的瑞金醫(yī)院,也面臨著圖像數(shù)據(jù)量大、格式不統(tǒng)一、數(shù)據(jù)標(biāo)注耗時長等問題,數(shù)據(jù)預(yù)處理工作無從下手。
“數(shù)字化是智慧化的基礎(chǔ),”瑞金醫(yī)院病理科副主任醫(yī)師笪倩分享說,“數(shù)字切片(WSI)圖像格式不統(tǒng)一卻極大地阻礙了計算病理學(xué)的發(fā)展。”
2023年起,在中華醫(yī)學(xué)會病理學(xué)分會指導(dǎo)下,華為團(tuán)隊開始在瑞金醫(yī)院應(yīng)用統(tǒng)一的數(shù)字病理格式(CSP)格式,將繁雜的病理切片圖像格式統(tǒng)一,為數(shù)據(jù)標(biāo)注和模型訓(xùn)練做好準(zhǔn)備。
不過,他們還面臨一個棘手難題:一張全視野數(shù)字切片(WSI)圖像的大小跟一部高清電影差不多(GB級)。瑞金醫(yī)院擁有上百萬張數(shù)字切片,他們面對的是PB級數(shù)據(jù)的快速訪問、標(biāo)注處理。
難題拋給了由華為“天才少年”、軟件工程師王帥帶領(lǐng)的平均年齡不足29歲的技術(shù)團(tuán)隊。
王帥說,在PB級的數(shù)字病理切片面前,傳統(tǒng)的人工標(biāo)注如同“用吸管來疏通堰塞湖”,效率太低;但如果不做好標(biāo)注和優(yōu)化,后續(xù)的訓(xùn)練和推理,就意味著巨大的算力消耗。
“這樣的AI注定只是一個奢侈品,沒有辦法普惠大眾。”王帥帶領(lǐng)團(tuán)隊決定革新數(shù)據(jù)工程手段,從高性能數(shù)據(jù)歸集開始做起。
基于華為積累的一批專項行業(yè)數(shù)據(jù)算子,技術(shù)團(tuán)隊通過靈活編排組裝這些算子,對數(shù)據(jù)進(jìn)行去重、特征提取和分級;為了深度優(yōu)化對病理圖像的處理,他們還研制了專用的神經(jīng)網(wǎng)絡(luò),實現(xiàn)對病理圖像的免切分算法,將整個病理學(xué)圖像處理時間從月級壓縮到了天級。
在與病理科醫(yī)生的通力合作下,RuiPath病理大模型前后共訓(xùn)練了103萬張數(shù)字病理切片。從統(tǒng)一格式、數(shù)據(jù)清洗,到數(shù)據(jù)標(biāo)注、模型訓(xùn)練、再到最后的模型精調(diào)、應(yīng)用編排,華為團(tuán)隊一步一個腳印,完成了對海量數(shù)字切片數(shù)據(jù)的“萃取”與“價值提煉”。
“這是一條從未有人走過的路,所以這其間對數(shù)據(jù)格式統(tǒng)一、對數(shù)據(jù)壓縮算法的優(yōu)化、對數(shù)據(jù)管理工程化的系統(tǒng)調(diào)優(yōu)等過程,都是極其復(fù)雜且艱辛的。”張偉力告訴記者,數(shù)據(jù)是訓(xùn)練病理大模型最核心的一環(huán),華為和瑞金醫(yī)院始終堅持著“長期主義”,不計成本、不計時間“死磕”數(shù)據(jù),只為得到更高質(zhì)量的訓(xùn)練數(shù)據(jù)集。
開源,讓更多人在“最后一公里”上車
如今,瑞金醫(yī)院的病理醫(yī)生在RuiPath的協(xié)助下,閱片效率大大提升,每天能完成400張切片的診斷。
病理醫(yī)生使用RuiPath病理模型閱片。華為存儲 供圖
模型在手,瑞金醫(yī)院沒有孤芳自賞。甚至在寧光看來,RuiPath還沒有達(dá)到“百分之百”。為了讓模型更廣泛應(yīng)用,也為了模型能夠更加完善,瑞金醫(yī)院與華為決定開源。
這在AI醫(yī)療行業(yè)內(nèi)不多見的——他們不僅開源RuiPath病理模型中核心的視覺基礎(chǔ)模型,還開源覆蓋肺癌、結(jié)直腸癌、甲狀腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌等7個常見癌種配套的測試數(shù)據(jù)集;同時,華為還對AI全流程工具鏈ModelEngine、行業(yè)落地實踐指南、相應(yīng)的輔助診斷任務(wù)進(jìn)行開源開放。這意味著,其他醫(yī)院或機(jī)構(gòu)下載獲得視覺基礎(chǔ)模型和測評數(shù)據(jù)集后,就能“按圖索驥”復(fù)現(xiàn)RuiPath病理模型,還能使用自有數(shù)據(jù)進(jìn)行模型增訓(xùn)。
“我很贊嘆華為的勇氣,他們說服了我們,把模型、工具、數(shù)據(jù)集等全部開源,這其實形成了一個病理模型的應(yīng)用生態(tài)。”寧光說,這將使得RuiPath病理大模型真正達(dá)到臨床可及、可用的程度,假以時日“水平可以超過任何一個病理科醫(yī)生”。
華為與瑞金醫(yī)院從合作之初就不是把這次創(chuàng)新當(dāng)做一次科學(xué)實驗來做,他們始終在“實用主義”這條道路上堅定前行。
“華為在與瑞金醫(yī)院合作開始的第一天,就錨定做出能落地應(yīng)用的模型、基層醫(yī)院用得起、能省時省力部署的模型。”張偉力說,只有降低了AI應(yīng)用的門檻,才會有更多后來者“上車”。
他舉例說,在數(shù)據(jù)優(yōu)化和模型訓(xùn)練過程中,華為做了許多工程化的開發(fā)和改造,如開發(fā)病理學(xué)圖像的免切分算法,將病理學(xué)圖像的處理時間大大縮短;對模型參數(shù)進(jìn)行蒸餾和優(yōu)化,使得最終僅用16張算力卡就完成了模型的訓(xùn)練等等。
發(fā)布會當(dāng)天現(xiàn)場一位某二級醫(yī)院負(fù)責(zé)人表示,大多數(shù)醫(yī)療機(jī)構(gòu)缺少專業(yè)AI人才,因此即便擁有病理數(shù)據(jù),也難以跨越從數(shù)據(jù)處理到AI應(yīng)用的技術(shù)鴻溝。此次瑞金醫(yī)院和華為開源的臨床級模型和工程化工具,基層醫(yī)院可以跳過數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、應(yīng)用開發(fā)等繁瑣復(fù)雜的工作,直接在臨床應(yīng)用的“最后一公里”上車,將促進(jìn)病理AI輔助診斷的廣泛應(yīng)用。
根深才能葉茂
當(dāng)瑞金RuiPath病理大模型讓人們看到了AI的巨大潛力,同時也讓人們意識到,要使AI進(jìn)入到行業(yè)生產(chǎn)、真正發(fā)揮價值,表面上看是需要積累和時間沉淀,但其中更重要的是,需要技術(shù)與專業(yè)知識的雙向奔赴。
“以醫(yī)療行業(yè)為例,醫(yī)療數(shù)據(jù)量大,但醫(yī)療行業(yè)的數(shù)字化并不適配AI大模型訓(xùn)練的數(shù)字化,醫(yī)療機(jī)構(gòu)又普遍缺乏IT和AI人才,如何將AI與醫(yī)療應(yīng)用連接在一起,需要一個橋梁。”張偉力表示,華為在今年年初專門成立“華為醫(yī)療衛(wèi)生軍團(tuán)”,正是出于這方面的考慮。
華為成立醫(yī)療衛(wèi)生軍團(tuán),本質(zhì)上就是希望有一支研發(fā)力量,能幫助醫(yī)生們將他們的知識和經(jīng)驗與先進(jìn)的AI技術(shù)結(jié)合,沉淀為即插即用的工具、模型和應(yīng)用。而這背后,源于華為一貫的長期主義和實用主義。
張偉力說,干好這件事可能需要“三年磨一劍”,也許在放射影像、慢病管理等其他場景的落地上也需要“數(shù)年磨一劍”,但只要方向正確、有價值,就值得長期堅持,“根深才能葉茂,我們會一步一個腳印,堅定不移地走下去。”
本文鏈接:AI醫(yī)療上的先行一步,腳下是對應(yīng)用的長期“死磕”http://m.sq15.cn/show-11-23240-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 暑假護(hù)眼戰(zhàn),別讓孩子視力提早“透支”
下一篇: 免疫治療會成為癌癥的“殺手锏”嗎?