數字化、大數據以及人工智能如何引領醫學變革
數字醫療正在變革我們對疾病的認識,圖片來源forbes。
2016年,世界超算大會(International Supercomputing Conference)公布了全球超級計算機排名,中國“神威•太湖之光”首次超越天河二號,成為世界第一的超級計算機,此次中國入圍的超級計算機也首次超越美國,一時間這則振奮人心的新聞在朋友圈被刷屏。
人們追求越來越快的計算速度的背后,是我們日益增長的數據。面對如此復雜、龐大以及非結構化的數據,如果沒有超級計算機來進行處理,我們很快會被淹沒在毫無意義的信息汪洋之中。
2012年,在奧巴馬的國情咨文中,大數據被重點提及,吸引了人們的高度關注。盡管大數據的擁躉很多,但對于它的概念,不同的人會有不同的理解。如下為2012年美國國會對大數據的定義:大數據是指多維度、復雜多樣的數據,需要先進的技術進行獲取、存儲、分布、管理以及分析。
大數據很快就進入應用領域,很多公司都在擁抱它帶來的數字或信息變革。在數學、物理、生物以及工程等領域,大數據扮演的角色愈發重要。在我們日常生活中,也會產生大量的數據,例如通過手機、智能手環以及其他可穿戴設備,每天都會產生大量的數據。通過對這些數據的分析,未來我們可預測健康或疾病,它將在醫療領域發揮重要作用。
大數據如何變革醫療
根據美國麥肯錫的一份報告顯示“技術的發展正在變革我們的理解以及疾病的治療”。2011年,美國醫療健康數據高達150eb,這一數字很快就會達到zb級別甚至yb級別。醫療數據正在快速地積累。
在傳統的醫生問診環節中,醫生在每一個患者面前的時間可能僅僅只有10分鐘左右,但傳感器以及移動健康APP能忠實地監控你過去一個月或一整年的健康信息,通過分析這部分大數據,醫生很快就能做出趨向于正確的決策。這種基于綜合數據獲得的判斷,準確率要遠高于人類醫生。美國食品與藥品監督管理局(FDA)也向這一領域開綠燈,批準對人體血糖進行監控等相關設備。
盡管每年制藥公司在醫藥研發領域投入巨資,但擺在眼前的是,他們仍無法充分了解我們的疾病以及獲取足夠多的有價值的信息,如果他們能夠獲取患者的DNA、蛋白質、代謝途徑甚至細胞、組織、器官以及整個人體系統的信息,那么進行個性化治療將會變得容易許多。當然獲取這些數據的前提是,尊重患者的隱私。在未來,患者會攜帶好自己的醫療或健康大數據,參與到制藥公司的藥物研發中來,屆時藥物的研發將會越來越個性化。
通過大數據分析,能夠幫助我們更早地發現疾病,并通過已有的數據,分析或預測未來疾病的發展狀況。麥肯錫的一份報告顯示,通過大數據分析,可每年為美國節約3000億美元的醫療支出。
大數據將如何變革個人的生活
大數據不僅可用于疾病診斷和個性化治療,還可應用于日常生活的不同場景,提升個人生活質量以及健康。傳統的可穿戴設備,只是獲得數據,而在未來通過智能手環或APP,可以為我們提供個性化的運動方案。例如,智能手機運動APP不僅能夠記錄我們每日行走的路程,同時還可以根據我們身體的健康信息,攝入的卡路里來提示我們每天應該要完成多少運動量才能保持健康。這會是可穿戴設備一個質的提升,可穿戴設備會是未來醫療數據采集的一個重要途徑。
一款智能的、具有顛覆性的菜譜同樣也會帶來健康的變革
個人健康指數的上升,意味著我們可以將更少的錢花費在醫療上,這可能是大數據帶來的福祉。以健康飲食為例,菜譜APP一直是家庭男女們的最愛,未來當菜譜APP與可穿戴設備結合起來,可根據時令、年齡、性別來提供吃什么食物的建議。它不僅能實時定位我們的地理位置,幫助我們尋找物美價廉的餐廳,同時也能推薦不同餐廳特色的營養菜譜。當我們在可穿戴設備上輸入當前的健康指數,如BMI指數、腰臀比、血壓、膽固醇指數等數據時,菜譜APP就可為我們提供有價值的、健康的膳食建議。例如,對一個膽固醇高的人,菜譜APP不會向他們推薦動物內臟,如含心、肝等食物,對于糖尿病患者,它也不會向他們推薦含糖量高的食物。它還可以根據身體特征來提供飲食建議,如果近期你的運動量比較大,在后臺一直默默工作的菜譜APP根據你的運動量,會為你推薦一些熱量比較高的食物,從而讓你保持活力。
不過目前,通過現有的可穿戴設備或者移動APP,我們仍難以從中找出個人健康與疾病之間的關聯,因為數據分析難以準確構建這些錯綜復雜的關系。例如,谷歌有一款隱形眼鏡,可通過檢測眼睛中的淚水,判斷身體的血糖等指標,但這一技術目前尚未成熟,仍然屬于“華而不實”的技術應用,仍有許多技術鴻溝需要逾越。
連接數據與健康間的鴻溝
數據與健康二者之間有何關系,首先擺在眼前的是:數據計算。傳統的計算方法難以處理如此龐大和復雜的數據,這些數據既有實驗室產生的數據,也有患者的影像數據以及電子病歷數據(electronic patient records ),如何從這些錯綜復雜的數據中挖掘與健康之間的關聯,將會是一個難上加難的問題。這也是本文前面提及為什么人們在追求越來越快的計算速度的原因。
作為互聯網搜索引擎的巨頭,谷歌和微軟積累了龐大的數據,未來我們不僅可以在搜索引擎上獲取信息,同時也能夠更加精準地尋找到健康信息。利用醫療大數據來診斷疾病,IBM的沃森顯然走到了這個領域的前沿。自2011年 Jeopardy!節目出現之后,IBM就將醫療視為未來一個主要發展的方向,目前,IBM已投入10億美元,將研發團隊1/3的成員納入到這個研究組項目中。
實際上,沃森是一個智能的系統,使用自然語言、機器學習以及實時計算將龐大的、非機構化的數據進行處理,它可以通過經驗和指示進行學習,類似人類那樣進行思考。研究者通過大量的電子病歷數據,甚至是教材中的知識輸入,使其成為一個超級疾病診斷工具。
雖然在這一領域,還有微軟的Cortana,蘋果的Siri以及谷歌的Google Now,但認知計算仍只是初步發展階段,IBM也是目前唯一一家使用大規模認知計算的公司。由于它們在預測以及疾病診斷上比人類更加具有優勢,因此該應用會是醫療大數據未來一個非常具有前景的方向。
上海醫療大數據布局:從樣本、隊列研究到深度挖掘
上海正在建設具有全球影響力的創新中心,在醫療大數據方面自然也有布局。2013年,上海發布“推進大數據研究與發展三年行動計劃”。該計劃指出,“在健康信息網已有數據的基礎上,匯聚整合醫療、藥品、氣象和社交網絡等大數據資源。”從而形成智能臨床診斷模式,自助就醫模式等服務模式創新,為“醫療資源配置、流行病跟蹤與分析、臨床診療精細決策、疫情監測及處置”等方面提供幫助。
這些行動落實在具體項目上,可歸結如下。2006年,上海醫聯工程就已正式啟動,該項目是國內第一個大型跨醫院區域醫療信息中心,擁有統一的技術標準,覆蓋了上海市34家三級醫院以及18個行政區。項目由上海瑞金醫院、上海市第六人民醫院,兒童醫院等單位牽頭,圍繞高血壓、糖尿病、腫瘤、兒童呼吸系統疾病等常見疾病開展大數據研究,并依托交大-耶魯生物統計聯合中心進行醫學生物信息挖掘和分析。目前已建成了國內生物樣本量最大的醫療健康信息庫,擁有9.1億個處方醫囑,診療事件擁有2.1億,醫學影像138Tb,檢驗報告9000萬份。生物樣本庫以及醫學診斷和影像資料是數據驅動醫學變革的關鍵。
另一個大型項目是泰州隊列研究,該項目由復旦大學等單位牽頭,于2006年北京香山會議上,由陳竺、沈曉明聯合發布,旨在通過宏觀醫學與微觀醫學的整合,大規模前瞻性隊列研究,源源不斷地產生有價值的醫療數據。
在醫療數據分析以及深度挖掘上,上海產研院正在籌劃建立一個以醫生和患者臨床治療體驗為驅動,以生物醫學大數據分析、知識庫體系決策為主導、個性化用藥為出口的一體化臨床轉化服務平臺。未來該平臺會利用深度學習、生物信息數據分析以及信息挖掘技術,處理醫療大數據。這既是精準醫學的一部分,也是數據驅動醫療變革的一次創新。
不過我們必須承認,目前包括IBM在內的數字醫療項目,雖然雄心勃勃,但我們仍很難將大數據變成一個大發現,我們還將面對數據的權屬、隱私、保護以及公開等問題。隨著IBM的沃森機器人的崛起以及法律制度的健全,相信不久的將來,我們定會連接起醫療信息與疾病之間的鴻溝。
文章轉載自微信公眾號“三思派”(ID: Science-Pie)





























