【IT之家評測室】訊飛曉醫體驗評測:星火醫療大模型 X1 加持,更懂你的 AI 健康助手
當今時代,健康已成為人們生活中最為關注的核心議題之一。從日常的健康管理到疾病的早期篩查與精準治療,除了傳統的醫療服務,通過更先進的技術手段,實現高效、精準且個性化的健康管理來滿足大家對醫療健康服務的需求已經不是不可能。比如說 AI,就為這種需求的滿足帶來了前所未有的變革機遇。

而就在最近,訊飛醫療基於星火 X1 正選的星火醫療大模型 X1,就讓我們看到了通過 AI 為每個人帶來個性化健康管理和醫療諮詢服務的可能。
我們知道,當前生成式 AI 行業正在從 AI 訓練向大規模推理和應用轉型,DeepSeek 今年以來的火熱出圈就是很好的例證。而大規模推理模型和健康醫療領域的結合,自然也很令人期待。

具體來說,大家現在打開訊飛曉醫 App,就能看到曉醫已經正式上線了「星火醫療大模型 X1」,該模型進一步提升了多步循證推理能力,為用戶提供更加個性化、更專業、更實用的健康諮詢服務。

訊飛曉醫,是科大訊飛推出的首款面向居民提供的 AI 健康助手應用,它依託訊飛星火醫療大模型億級高質量權威醫學知識數據庫,可以為大家提供症狀自查、藥物查詢、報告解讀和個性化健康檔案管理等一系列醫療健康服務。
那麼,有了星火醫療大模型 X1 加持的訊飛曉醫如今體驗如何呢,今天大家不妨就和IT之家一同來通過實際體驗瞭解一下。
一、深度分析能力測試
對於普通消費者來說,當我們使用 AI 來輔助健康管理和諮詢醫療相關的信息時,最看重的自然就是 AI 模型的專業性,也就是它給我們的信息是否專業、可信。其次,集成這樣的 AI 能力的產品應該好用、實用,能夠真正給我們帶來切實可行的醫療建議。
不僅如此,我們還需要 AI 能夠更懂我們,瞭解我們長線的健康狀況,從而能針對我們每個人提供個性化的服務。
這些應該是我們評判一段大模型在健康醫療方面服務能力時需要重點關注的點。
接下來,我們不妨通過一些問題來進行測試,看看他們在面對一些醫療和健康問題時會有怎樣的表現。
測試前需要說明的是,小編會分別在開啟和關閉星火醫療大模型 X1(以下簡稱「大模型 X1」)的情況下進行測試,從而讓大家可以更直觀地感受到大模型 X1 能夠對訊飛曉醫尋醫問診體驗帶來的變化。
首先,小編問了一個問題:血栓患者吃利伐沙班的藥一年了,能長期吃嗎?對身體有什麼影響?
在開啟星火醫療大模型 X1 的情況下,訊飛曉醫回答這個問題耗時 15 秒,在回答時展現出詳細的思考過程,先查看了我提交的病史檔案,然後分析利伐沙班藥物藥理,接著結合藥理和我的病史和用藥史先後分析了藥物相互作用的問題和長期用藥的問題,整個邏輯鏈條是比較通順的。

而給出的回答條理也很清晰,先後給出了利伐沙班的適應症和療程、長期使用的風險監測等信息,我在問題中沒有提到藥物相互作用的考慮,它也主動給出了相關參考建議。不僅如此,訊飛曉醫還針對我的個體情況給出了針對性的血栓治療建議,考慮到了我病史中高血脂和脂肪肝的風險因素。此外,還主動給出了日常管理建議。

可以看到,訊飛曉醫給出的回答在專業性和實用性上都很強,同時讓人驚豔的是它完整全面的邏輯思考,將我問題中提到的和沒提到的因素都考慮到了,並給出了相應的醫學建議。
另外值得一提的是,通過這個問題,訊飛曉醫識別到我可能患有血栓,還主動建議我添加到既往病史中以完善健康檔案,這一點很細節。

然後小編把大模型 X1 關閉,同樣的問題再問一遍。
這一次,訊飛曉醫並沒有展現出細緻的思考推理過程,而是結合我的檔案和 2 篇醫學知識,給出了兩個方面的參考信息,首先是利伐沙班可以長期服用的特定情況,這個過程並沒有特別針對我個體的情況細緻分析,其次,曉醫列出了長期服用利伐沙班對身體可能產生的影響,總體來說都是偏知識性的回答,儘管答案都是正確的,也具有不錯的參考價值,但整體實用性、個性化方面確實不如開啟大模型 X1 時的回答。

接下來,小編問了第二個問題:我幾天來偶爾出現頭暈,但沒有伴隨旋轉感、噁心、嘔吐、視力模糊或走路不穩等其他症狀,請問如何緩解頭暈症狀?
這一次我們先不開啟大模型 X1,可以看到曉醫主要是參考了丁香醫生的一篇醫學知識,提示頭暈可能是由低血壓、貧血、耳內平衡器官等問題造成,同時結合我描述的病症給出了生活調理、物理治療和藥物治療三方面的改善建議。可以說具有一定的參考價值。

然後,小編開啟大模型 X1。這一次,訊飛曉醫結合我的病史、手術史等情況做了詳細分析,在回答中考慮到了小編高血脂、脂肪肝可能間接帶來的頭暈症狀。在緩解性建議中,也是結合我自身的情況給出了針對性的建議,比如提醒我少吃高油脂、動物內臟等食物,控制血脂。

此外曉醫給給出了醫學監測和干預的建議以及藥物緩解的建議,特別是就醫指征中提示若出現頭痛、言語不清徐排出腦血管問題,還建議完善頸動脈超聲排查血管狹窄,心電圖檢查排查心率失常,這些建議都是非常具體可操作且很明確的,實用性很高,通常情況下,我們去醫院,一般也會先做這些檢查以逐步排除病因。

然後,小編又詢問了一個問題:手部腳腕部出現極癢疹子,越撓越癢,5,6 天后漸老化,但會留下一個小硬包,已有半個月了,什麼原因?怎麼辦?

在開啟大模型 X1 的情況下,你可以看到訊飛曉醫在思考中是如何根據小編的病史情況和問題中描述的症狀一步步排除各種因素,分析可能導致手部出現疹子的原因的,整個過程思路很是清晰,而在處理建議方面,也考慮了各種適合或者不適合的處理方式。

最後給出的回答中,首先列出了對小編這個個體情況來說最可能導致起疹的誘因,處理方案中,也列出了急性止癢、外用藥物、生活方式干預等三種類別下各自具體可操作的建議,還提示需要警惕的情況。另外訊飛曉醫還針對我的高血脂和脂肪肝給出了需要特別注意的事項,以及藥理上避免自行使用強效激素或偏方的建議。
關閉大模型 X1 再問一遍,這次訊飛曉醫追問了一些關於病症的一些細節症狀,包括起疹的詳細部位、大小形狀、是否做過相關檢查等問題,小編需要一一做回答。

經過多輪問診解答後,訊飛曉醫也給出了準確的病因分析和處置建議,整體看起來和開啟大模型 X1 時直接給出的分析結果也差不多,只是在回答中涉及的知識的全面性上相比開啟大模型 X1 有所不足。

整體來說,如果說開啟星火醫療大模型 X1 之前的訊飛曉醫是一個知識淵博的人在根據現有的資料為你答疑解惑,那麼開啟大模型 X1 之後的訊飛曉醫則更像是一個真實的私人醫生在根據對你的瞭解來分析病症、給出健康管理的建議。
小編在體驗的過程中,基本沒遇到大模型醫療幻覺的問題,在回答覆雜問題時,他也能像真實的醫生那樣逐步解釋循證,因此在面對一些複雜問題時也展現出很高的邏輯正確性、專業性和可解釋性。同時它還能讀取你的健康檔案,給出獨屬於你自己的、不是適用於所有人的答案,這一點也讓訊飛曉醫的實用性和可信賴性大大增強。
二、多模態解讀報告單、醫學影像能力測試
除了上面這些大家日常生活中可能會經常遇到的有關健康管理、尋醫問診的問題,還有一些痛點場景也很值得一說,就是很多人在體檢之後拿到報告單,面對一些異常指標里的各種專業術語往往會不知所措,這時候就迫切需要一位專業的健康助手來答疑解惑。
那麼 AI 是否能很好地擔任這一角色呢,IT之家也做了一波測試。
首先,小編在訊飛曉醫中上傳了一張 PDF 體檢報告單,然後訊飛曉醫就可以直接幫我進行報告解讀。
解讀完成後,可以看到訊飛曉醫給出的解讀內容非常豐富,先是在總體評估中準確判斷出報告中純在的各項異常指標,然後又針對每一項異常指標進行醫學原理解讀和就醫指導,在就醫指導中又根據異常項目的嚴重情況區分了「立即就診」、「定期複查」、「日常關注」三個類別,由於這部分內容很詳細,小編截取其中片段供大家參考,不難發現呈現的方式很直觀、細緻,甚至指明了複查科室。


不僅如此,訊飛曉醫還列出了根據這份報告的異常指標,給出了報告主體在日常生活中需要關注飲食和運動方面的建議。整體來說非常專業、詳盡。

另外,訊飛曉醫還直接提供了找醫院的選項,點開後能夠看到我所在地附近可以去的醫院,小編看了一下,都是本地評價比較好的醫院。

用訊飛曉醫測試完之後,IT之家也很好奇,目前另外兩個比較熱門的大模型 DeepSeek 和 GPT-o1 會有怎樣的表現呢?於是又把同樣的問題拋給 DeepSeek 和 GPT-o1,來進行一波對比。
首先是 DeepSeek,它給出的解讀結果要簡單不少,不過核心的異常指標也都提煉了出來,也有對應的健康管理建議,整體上專業性上還是不如訊飛曉醫。

GPT-o1 方面,結果和 DeepSeek 比較類似,異常項目判斷的是比較全的,也有簡單的應對建議,但整體來說還是訊飛曉醫更專業和詳盡。

很多時候我們拿到的報告單可能不止一份,而且彼此是有關聯的,這時候訊飛曉醫能不能同時解讀兩張報告單並進行分析呢?小編也做了測試。
測試時,小編將一份血液常規報告單連同當時做的腹部 B 超影像一起交給訊飛曉醫進行解讀。可以看到,訊飛曉醫不僅清楚列出了血液檢測中的異常項目,也識別出腹部 B 超報告中存在中度脂肪肝、膽囊多髮結石的問題。訊飛曉醫還列出了 4 條應對建議,每一條都是針對異常項目的,其中還包括針對我個人的脂肪肝病史給出了專門的建議,很實用,可以讓我們更有方向地瞭解報告內容,便於進一步就醫問診。

接著,小編也用 DeepSeek 做了測試,同樣的問題給 DeepSeek,可以看到 DeepSeek 將正常項目和異常項目混在一起,看起來不夠清晰直觀,也不能結合本人的病史檔案進行分析,整體來說屬於比較機械的解讀,雖然沒有錯誤,但實用性稍低一些。

再看 GPT-o1,這次 GPT-o1 給出的解讀能直接找出報告中的異常項目,相對來說實用性比 DeepSeek 要好一些,也有針對異常項目的應對建議,和 DeepSeek 相比屬於是差不多的水平。

接下來,小編在自己最近一次血常規檢測中找到兩項異常指標,讓訊飛曉醫分析一下這兩項指標異常意味著什麼。

在訊飛曉醫的回答中,對這兩項異常指標都做了比較專業的解讀,結合小編報告單中醫生給出的解釋,訊飛曉醫的回答都是正確的,這說明訊飛曉醫確實具有出色的專業性。

DeepSeek 方面,給出的回答也是比較專業且全面的,同時也有針對性的應對建議。

最後,小編上傳了兩年間不同時間拍攝的兩張甲狀腺彩超報告單照片,考驗大模型能否根據多報告單進行時序對比解讀。
訊飛曉醫面對這兩張照片,直接幫我將報告單中的照片的相關醫學指標整理成了一份圖表,指標情況的變化一目瞭然,這一點好評。當然,它給出的判斷分析也是準確的,甲狀腺左葉低回聲結節有所增大,但惡性風險較低,同時給出了定期複查的建議,以及提醒關注血脂和脂肪肝的情況。


DeepSeek 的回答雖然不那麼直觀,但整體上也是沒問題的。

整體來說可以看到,在多模態解讀報告單、醫學影像方面,訊飛曉醫的表現依然是非常專業且實用的,並且給出的建議也能夠根據用戶自己的健康檔案做到個性化、有針對性。DeepSeek 在這方面有著相似的專業性和實用性,但在部分場景下的回答還是略微不夠清晰明了,並且也不能根據用戶以往病史進行個性化分析。但總體來說,訊飛曉醫和 DeepSeek 的表現都是明顯優於 GPT-o1 的。
當然,除了對報告單、醫學影像的解讀,作為一款專門針對醫療場景的健康助手應用,訊飛曉醫還是利用 AI 大模型能力圍繞醫療場景做了一些更細化、更獨特的功能體驗。比如在拍一拍中,你可以通過拍藥盒來讓訊飛曉醫來給你用藥建議。
這裏小編用自己之前起蕁麻疹時醫生開的兩種藥來對其進行測試,同時拍下兩個藥盒,當小編說出胳膊起疹時,「訊飛曉醫」初步判斷為蕁麻疹,然後給出了蕁麻疹的相關科普以及用藥建議,在用藥建議中能看到這兩個藥可以一起吃,這和醫生開出來的結果也是一樣的。

再比如訊飛曉醫還有個性化的健康空間,這裏彙總了你上傳的所有病曆、報告單、使用的藥物和體檢報告等信息,同時你還可以在這裏完善你的健康史、包括既往病史、個人吸煙和飲酒情況以及家族病史等,這些都會成為你向訊飛曉醫諮詢時重要的參考信息。

不僅如此,訊飛曉醫還會根據你填寫的健康史信息主動幫你生成一份飲食建議,比如小編有高脂血症、脂肪肝,它就幫我生成了對應的健康飲食計劃,早餐、午餐、晚餐適合吃什麼都安排得好好的。當然,除了飲食計劃,訊飛曉醫還可以給你提供對應的運動建議,包括適合的運動、運動中需要注意的事項等等。

你還可以為你的家庭成員建立健康檔案,所有的這些功能也都適用於家庭成員。這些都是 DeepSeek 等通用類大模型產品所無法提供的,可見,訊飛曉醫確實是更適合普通用戶的 AI 健康助手。

結語
通過上面的一系列體驗和測試,相信大家已經能夠發現,在引入星火醫療大模型 X1 後,訊飛曉醫首先是和自己相比,在面對健康醫療問題時整個應對的專業性、邏輯性和完善性都有了質的提升,這也是推理模型為訊飛曉醫帶來的新能力。
而對比 DeepSeek、GPT-o1 這樣的明星推理大模型產品,訊飛曉醫在健康醫療領域也展現出了足夠強的競爭力,和 DeepSeek 相比在很多細節回答上表現更優,對比 GPT-o1 則有比較明顯的優勢。
同時小編要著重強調的是,得益於構建個人數字健康空間的能力,訊飛曉醫能夠結合你和家人的健康檔案提供針對性的健康建議,從而讓訊飛曉醫的個性化和實用性大大增強。
而像 DeepSeek / GPT-o1 等由於是通用模型,給出的回答自然也是面向所有用戶的,缺乏針對性,不僅如此,在更多的醫療細節場景需求上也不太能滿足,比如主動幫你製定健康飲食、運動計劃等等。
升級後的訊飛曉醫使用久了,你會覺得他好像就是一個懂你的私人健康管家,能掌握你的健康狀況,幫你解決醫療上的一些問題,並給出可行的建議。普通人平時有個頭疼腦熱的小毛病,如果只想要網上搜一搜瞭解身體狀況的時候,不妨用更實用更可靠的健康 AI 助手訊飛曉醫。當然,同時也需要說明的是,目前 AI 給出的信息終究也只起到輔助參考的作用,它能夠為我們應對健康問題時提供便利,但訊飛曉醫不能代替醫生,醫生的臨床經驗還是至關重要哦,建議大家以醫生的建議為準。
廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。