News
港大醫學院開發全球首個甲狀腺癌診斷人工智能模型 準確率超九成 診前準備時間減半

2025年04月23日

香港大學李嘉誠醫學院(港大醫學院)、InnoHK醫衞大數據深析實驗室(InnoHK D24H)及倫敦衞生與熱帶醫學院的跨學科研究團隊,成功開發全球首個能同時進行甲狀腺癌分期及風險評級的人工智能(AI)模型,其準確率更突破90%。這項創新的AI模型,預計可縮減前線醫護人員診前準備約一半時間,亦能配合香港特別行政區政府推動醫療AI應用的政策。相關研究成果已發表於期刊《npj Digital Medicine》(按此瀏覽期刊文章)。

背景
甲狀腺癌為本港及全球最普遍的癌症類型之一。現時診斷標準主要採用以下兩大國際系統∶(1)美國癌症聯合委員會第八版(AJCC/TNM)分期系統,用以判斷腫瘤發展階段;(2)美國甲狀腺協會(ATA)風險評級系統,用於評估癌症復發風險等級。這兩套系統對預測患者存活率及指導臨床治療決策具有關鍵作用。然而,現行作業模式需由醫護人員手動審查多項複雜病理特徵,此操作過程既耗時又欠缺效率,有可能延誤關鍵治療時機。

研究方法及結果 
研究團隊成功開發一款AI輔助工具,該系統運用大型語言模型技術(如ChatGPT和DeepSeek),專為分析人類語言、解構臨床文件而設計,能顯著提升甲狀腺癌分期與風險評級的準確性及效率。

此模型採用四種離線開源大型語言模型,包括Mistral(由Mistral AI開發)、Llama(由Meta開發)、Gemma(由Google開發)以及Qwen(由阿里巴巴開發),用於分析醫護人員書寫沒有標準格式的臨床資料或紀錄。在模型訓練方面,研究團隊採用美國癌症基因組圖譜(TCGA)公開資料庫中50宗甲狀腺癌患者之病理報告作為訓練數據集。後續以289宗TCGA患者病理報告及35宗由內分泌外科專家編撰之模擬病例進行模型驗證。

團隊通過整合四種大型語言模型的輸出結果,成功提升AI系統的整體表現。在ATA風險評級方面,準確率介乎88.5%至100%;而在AJCC癌症分期方面,準確率亦達到92.9%至98.1%。相比傳統以人手審查文件方式,這項技術預計可以將醫護人員診前準備工作時間縮減約一半。

病例數量 ATA風險評級準確率 AJCC癌症分期準確率
50宗TCGA病例 (訓練集) 100.0% 94.1%
289宗TCGA病例 (驗證集) 95.5% 98.1%
35宗模擬病例(驗證集) 88.5% 92.9%

 

研究意義
港大醫學院公共衞生學院羅旭龢基金教授兼InnoHK D24H董事總經理胡子祺教授強調該模型表現卓越∶「我們的模型在AJCC癌症分期及ATA風險評級方面,準確率超過90%。該模型的一大優勢是具備離線功能,可以在內部病人資料系統處理,無需上傳或分享病人的敏感資料,為病人私隱提供最大的保障。」

胡教授補充說∶「鑒於近期推出的DeepSeek,我們進一步採用『零樣本提示』方式,與DeepSeek-R1、V3以及GPT-4o最新模型進行對比測試。結果顯示,我們的模型表現與這些強大的在線大型語言模型不相上下。」

港大醫學院臨床醫學學院外科學系臨床助理教授兼內分泌外科主任馮文謙醫生表示∶「除了能準確提取和解讀複雜的病理報告、手術紀錄與臨床筆記外,相比人手處理,我們的AI模型可將診前準備時間縮短近半,並同時提供國際認可的癌症分期及臨床風險評級結果。」

馮醫生續稱∶「該AI模型用途廣泛,可以應用到公私營機構,以及本地和國際醫療及研究體系。我們有信心,這個AI模型可以提升前線醫護人員的效率,改善醫療質素;讓醫生有更多時間關心病人和與病人溝通。」

港大醫學院臨床醫學學院家庭醫學及基層醫療學系名譽副教授黃競浩博士闡釋∶「政府大力推動醫療AI的應用,例如醫院管理局最近推出利用大語言模型建立的醫療報告撰寫系統便是有力證明。為配合政府的倡議,我們下一步將會用大量真實病人數據評估這個AI輔助工具的表現。一旦驗證成功,這個AI模型可以迅速應用於臨床和醫院環境,幫助醫護提升運作和治療效率。」

關於研究團隊
該項研究由港大醫學院的公共衞生學院羅旭龢基金教授兼InnoHK D24H董事總經理胡子祺教授、臨床醫學學院外科學系臨床助理教授兼內分泌外科主任馮文謙醫生,以及臨床醫學學院家庭醫學及基層醫療學系名譽副教授兼InnoHK D24H高級研究項目總監黃競浩博士領導。共同第一作者包括來自InnoHK D24H的鄧皓文博士和吳婷婷博士。可按此了解其他研究團隊成員。

鳴謝
這項研究獲香港特別行政區創新科技署轄下的 InnoHK計劃資助。

關於InnoHK醫衞大數據深析實驗室
InnoHK醫衞大數據深析實驗室(InnoHK D24H)旨在透過搜集和整理大量獨一無二的數據資源,通過深度、領先的分析技術,從而保障全球公共衞生,並利用精準醫療改善個人健康。實驗室匯聚由全球頂尖科學家組成的跨領域研究團隊,透過運用人工智能及大數據等技術,革新公眾對疾病的認識,並開發創新的治療方法。

InnoHK D24H由香港大學牽頭,除了與本地及世界各地著名學術機構協作外,亦積極與多個國際衞生機構(如世界衞生組織及中國疾病預防控制中心)攜手合作。InnoHK D24H將善用跨學科、跨領域上的共同協作,提升香港、大灣區以至全球的醫療科技發展,創造突破性的科研成果,為全球公共衞生和民眾健康帶來莫大裨益。

 

 

傳媒查詢

請聯絡香港大學李嘉誠醫學院(電郵︰medmedia@hku.hk)。

港大醫學院研究團隊開發全球首個用於甲狀腺癌診斷的AI模型,準確率超過90%,能大幅縮短診前準備時間。該研究由胡子祺教授(中)及馮文謙醫生(右三)領導。
甲狀腺癌是香港和世界上最常見的癌症之一。其精準的治療需要準確的疾病分期和風險評級,以預測患者的存活率並判斷治療方案。目前,這個過程由醫護人員人手處理大量複雜的臨床資料來完成,過程耗時。
港大醫學院開發的AI模型利用四種離線大型語言模型——Mistral、Llama、Gemma和Qwen——來分析臨床文件,以為甲狀腺癌作有效準確的分期和風險評級。
港大醫學院的研究團隊所開發的AI模型與現有強大的在線大型語言模型(DeepSeek R1和V3,以及GPT-4o)比較下,在甲狀腺癌的疾病分期和風險評級的性能表現不相上下。