近年,AI在生物信息數據分析、蛋白質結構解析、藥物早期發現和疾病分子分型等領域得到了廣泛應用,加速了新藥研發進程,拓展了疾病診療方案。隨著新技術的興起,AI在新藥研發和疾病診療應用研究中有哪些進展?面臨的挑戰有哪些?未來發展方向如何?
5月26日,上海市藥物研發協同創新中心與浦東國際人才發展中心共同舉辦第47期 Science Café 活動。本期活動特別邀請了復旦大學藥學院付偉教授、上海交通大學醫學院附屬仁濟醫院泌尿科陳銳副主任醫師和斯微生物高級總監陳庚博士,與大家共同交流與探討人工智能在生物醫藥領域的新應用。
嘉賓精彩報告總覽
● AIDD和CADD賦能新藥發現
· AIDD與新藥研發融合現狀
· CIDD與新藥研發融合現狀
● 人工智能在前列腺癌診療中的應用
· 前列腺癌診療研究現狀
· AI在前列腺癌中的應用現狀
· ChatGPT能否替代醫生診療
● 人工智能在mRNA疫苗研發中的應用
· AI在mRNA疫苗研發中的應用糖心vlog在線觀看
· mRAN疫苗優勢
· mRNA疫苗研發面臨序列優化的挑戰
· AI在mRNA序列優化中的應用
· AI在mRNA個性化腫瘤疫苗開發中的應用
· SmartNeo分析平臺
01 AIDD和CADD賦能新藥發現
付偉教授從藥物設計領域詳細解讀了AIDD與CIDD的發展歷程、研發現狀和各自優勢,并分享了團隊在AIDD與CIDD領域的探索。
傳統新藥研發存在大型數據利用率低、周期長和研發成本高等問題,與傳統的藥物研發相比,人工智能輔助藥物設計(Artificial Intelligence for Drug Discovery,AIDD)和計算機藥物輔助設計(Computer Aided Drug Design,CADD)優勢明顯,可對抗傳統藥物開發的低效和不確定性問題,提高藥物開發效率,降低研發成本,加快藥物研發進程。
AIDD與新藥研發融合現狀
AI技術應用貫穿了新藥研發全鏈條,包括從靶點發現、化合物合成和篩選等藥物早期發現階段,晶型預測、藥理作用評估、制劑研發等臨床前研究,臨床患者招募和臨床設計優化等臨床研究階段,以及藥物重定向和批量生產等審評上市階段,均有AI技術的參與,AI可為藥物研發節約大量時間和費用。目前,AI制藥還處于爬坡階段,主要集中在早期發現和臨床前階段的項目開發,治療領域多為心血管疾病和抗腫瘤藥領域,分子類型包括化藥小分子和生物大分子,化藥小分子占比更多,創新程度仍以me-too/me-better藥物占主導。
? AIDD三個要素
AIDD包括ABC三個要素,即算法(Algorithm)、算力(Computing power)和大數據(Big data)。隨著計算機的不斷發展,計算資源基本能夠滿足AIDD的需求,而算法也在不斷開發優化,越來越完善,但大數據仍然制約著AIDD的發展,究其原因是數據來源及獲取困難,很多AI制藥公司的數據涉及商業機密很難共享。
? AI競爭格局及資本市場情況
從初創公司數量來看,AI制藥初創企業持續增加。截止2019年,美國AI制藥公司數量全球居首,中國排名第五。目前,國內初創公司數量已從2019年的五家增長到了十幾家,這些公司業務貫穿了藥物研發的全鏈條,涉及各個研究領域。
從資本市場情況來看,2020年后,全球AI資本市場進入了融資爆發期,2018年至2021年,融資金額年增長率為110%,2021年全球AI制藥投融資規模達到了32.8億美元,同比提高了2.5倍。我國AI制藥起步相對海外略有滯后,2015年起開始出現少量融資事件,2020年是我國AI制藥領域轉折性的一年,融資項目數量實現翻倍,融資總額同比增長約7倍。2021年資本市場規模達到了61億元。
? ChatGPT等AI技術在新藥研發領域中的應用
ChatGPT是一個基于機器學習和神經網絡的自然語言處理模型。ChatGPT的思維方式主要基于大數據和算法進行推理和學習,而人類大腦是通過神經連接和腦區之間的協調來實現的思維和認知。近幾年,基于ChatGPT輔助藥物開發的產品很多,主要包括:華為開發的盤古,盤古是藥物分子模型的藥性預測的準確率比傳統的方法高20%;微軟開發的BioGPT,它是基于PubMed超過1500萬篇摘要的龐大語料庫上進行了預訓練,在PubMedQA的檢測中,模型預測的準確率高達81%;此外,Profluent開發了具有蛋白設計功能的ProGen軟件,可設計新型有功能的蛋白。
CIDD與新藥研發融合現狀
? CADD的基本流程
CADD是研究化學小分子與生物大分子相互作用模式,進而進行基于結構的藥物設計發現活性小分子的過程。從小分子化合物數據庫和蛋白質數據庫篩選出藥物分子和靶標蛋白,使其相互作用形成復合物,通過X-Ray、NMR、電鏡等技術手段對復合物的結構進行測定和量子化學、分子力學,分子動力學計算,對小分子化合物和蛋白質的結構不斷的優化與設計,得到一個小分子和蛋白復合物的三維結構,再經過活性構效關系和藥代/藥效動力學構效關系的循環測試,最終得到了臨床前候選化合物。
? 傳統CADD應用場景和局限性
傳統CADD的應用場景包括了蛋白質結構預測、小分子結構構建、小分子-蛋白相互作用、自由能計算、基于結構的藥物設計(SBDD)、藥效團,基于性質的藥物設計(PBDD)、ADME/T、蛋白質的構象、蛋白質結構和功能的關系等。傳統CADD貫穿了藥物早期發現的各個環節,但由于傳統CADD是基于靜態結構進行藥物分子設計,而藥物和靶點相互作用是一個動態過程,存在著構象的變化,CADD沒有考慮到小分子和蛋白質形成復合物的構象變化,即對蛋白質的柔性考慮不足,因此,CADD預測的準確性受到一定限制。
? 團隊探索CADD技術在新藥研發中應用
為解決CADD的局限性問題,付教授團隊開發了動態虛擬篩選技術,通過分子動力學模擬,研究蛋白質的動態構象變化,采用一系列計算的技術,包括活性位點探測和聚類分析,通過建立多個藥效團模型進行先導化合物的發現。該動態虛擬篩選技術方法已開展了多種藥物的設計與發現,包括靶向A-GPCR的藥物設計與發現,在中樞神經疾病領域開展鎮痛藥物的設計與發現;靶向核受體的藥物設計與發現,開展抗炎免疫疾病領域藥物研發;以及在遞藥系統分子設計與機制研究以及尿酸酶生物藥領域開展研究。
G蛋白偶聯受體約占藥物靶標45%,人體味覺、視覺、嗅覺等感官和痛覺都與該受體有關,團隊利用CADD技術從96個化合物中篩選發現了20多個活性化合物,基于這些化合物做了一系列的改造,對接中樞神經系統中多巴胺受體和5-羥色胺受體的各個亞型,發現其中部分活性分子的骨架是抗腫瘤藥物的分子結構,但它也是5-羥色胺-2A(5-HT2A)的結合劑,且具有多靶點和拮抗特征。在這些研究基礎上,團隊開發了5-HT1AR激動劑,采用了動態虛擬篩選的技術,通過大規模動力學模擬,構建多重藥效團模型,設計發現出了一系列活性分子,經過45個化合物分子進行活性測試,最終篩出了10個全新結構化合物分子,功能活性可達7 nmol量級,經過優化,發現了具有抗精神分裂和抗抑郁藥效的新結構候選藥物分子。另外,團隊還利用CADD技術開發了強效鎮痛藥物,發現了300多個高活性分子,其中PCC分子的活性是嗎啡的50-100倍,且具有很強的癌痛鎮痛療效,可作為廣譜的鎮痛藥物,該類激動劑已獲得7項專利授權。截止目前,在GPCR領域團隊發表了有四十多篇左右文章,授權了有13項專利,1項專利已進入到美國市場。
未來展望:AIDD和CADD優勢互補
AIDD是一個大規模的訓練模型,更依賴于算法和算力,對藥物分子活性結構的考慮不足,而CADD更傾向于藥物構效關系的分析,運用藥效團和基于片段藥物設計的概念,AIDD和CADD各有優勢,付教授團隊即采用了CADD和AIDD融合的新藥研發思路,在AIDD基于圖的分子表征方法的基礎上,融入CADD基于藥效團及活性片段的分子生成的理念,進行藥物分子設計,應用于中樞神經系統領域鎮痛藥物的開發。付教授表示,未來AIDD和CADD的發展方向是互相融合優勢互補,方可更好地賦能新藥開發。
02 人工智能在前列腺癌診療中的應用
陳銳醫生從前列腺癌診療研究現狀出發,介紹了前列腺癌診療面臨的挑戰,并分享了AI在前列腺癌影像診斷、病理診斷、構建患者分子分型中的應用以及團隊通過人工智能模型分析多模態體檢數據輔助早期診斷的相關研究。
前列腺癌診療研究現狀
? 前列腺癌流行病學數據
前列腺癌是全球男性發病率第二的惡性腫瘤。雖然過去我國前列腺癌發病率不高,但近年來其發病率逐年增長,已從排名第十三位躍遷至第六位,年增長率為13%。隨著我國腫瘤篩查的普及和老齡化趨勢的加劇,前列腺癌將成為影響老年男性健康主要疾病。
? 前列腺癌診療面臨的挑戰
目前,我國前列腺癌的診療已經走在世界前列,陳醫生所在的團隊的微創手術技術已經處于國際一流水平,達芬奇機器人、國產機器人等技術不斷更新迭代,手術治療效果越來越好。
但是,前列腺癌診療仍然面臨著兩個難題:第一是早期診斷。首先,早期的前列腺癌缺乏癥狀,許多病人直至轉移都很難發現。其次,不同病人的腫瘤差異程度不同,有些惡性程度高,進展快的腫瘤是最需要盡早診斷并及時治療,而有些腫瘤惡性程度較低,可以進行積極地主動監測。所以如何診斷出高度惡性的前列腺癌是一個具有挑戰性的問題。陳醫生團隊探索了研究診斷新方法,通過將歐美人群中研發的PSA指標“中國化”,提出符合中國病人的診斷策略,同時也研發出新型的分子診斷標志物,提高了診斷效果。第二個難題是晚期階段的治療。前列腺癌發展到晚期以后,可以選擇的治療方法非常有限,急需對耐藥的晚期前列腺癌患者進行分子分型,從而有針對性地找到合適的治療藥物。陳醫生所在團隊也致力于前列腺癌的晚期分子分型和精準治療方面,提出了相關的治療策略,療效獲得一定的改善,但距離滿意的治療效果仍有差距。
AI在前列腺癌中的應用現狀
2023年2月,由長海醫院、仁濟醫院、華東理工大學的學者組成的醫工融合團隊探討了人工智能在前列腺癌診療中的應用,結合團隊研究成果,編撰了《人工智能在前列腺癌診療中的應用》一書。目前,人工智能在前列腺癌領域最成熟的應用是前列腺癌病理診斷和影像學診斷。
? AI在前列腺癌影像診斷中的應用
很多病人的腫瘤指標PSA升高,但不一定都患有前列腺癌,盲目對所有患者進行穿刺會給沒有腫瘤的患者帶來不必要的麻煩。針對這樣的情況,影像科醫生開發了多參數磁共振,它能同時獲取多個加權圖像的信息,提示出前列腺組織可疑區域,再根據可疑區域進行穿刺活檢,被稱為“磁共振引導的靶向穿刺”,目前這種精準的方法已經在臨床得到應用。但是,經驗豐富的前列腺影像科醫生數量非常有限,通常集中在大城市、大醫院,導致了很多中小城市及小醫院無法完成獲得很好的讀片效果。目前,已經有團隊將AI應用于磁共振圖像中的腫瘤病灶識別并獲得了很好的效果,預計這一技術很快將進入臨床輔助影像科醫生和泌尿外科醫生進行前列腺穿刺的決策。
? AI在前列腺癌病理診斷中的應用
數字病理和人工智能的應用,正在不斷地改變以往的病理診斷方式。數字切片掃描儀可以將病理切片數字化,一張如大拇指般大小的病理切片,可以放大后掃描為數據量高達2-3GB的清晰全景病理掃描切片。通過讓人工智能學習人工勾畫的腫瘤區域,訓練人工智能模型,從而幫助病理科醫生篩選出其中的腫瘤區域,目前也有相對成熟的模型,可以減輕病理科醫生的負擔,也將在近幾年投入臨床使用。
? 探索AI輔助建立前列腺癌患者的分子分型
乳腺癌的分子分型已走在多種腫瘤的前列,醫生可根據患者不同的分子分型采取不同的治療方案。相比之下,前列腺癌的分子分型還處于起步階段,科研團隊嘗試利用人工智能,結合已有臨床患者的大數據,探索前列腺癌分子分型的研究。目前已經取得了初步的研究成果,未來也有望應用于臨床診療決策中。
? 人工智能分析多模態體檢數據,實現前列腺癌高風險的人群預警
隨著人口老齡化,我國前列腺癌篩查的負擔將不斷加重,如果能用常規的體檢信息作為前列腺癌篩查依據,將有望減少不必要的穿刺,減輕醫療機構負擔,降低國家醫療成本。陳醫生團隊綜合包括上海、南京、韓國首爾、中國香港等地區的多家醫院的數千人的臨床數據進行分析,運用XGBoost人工智能算法構建了具有可解釋性的診斷預測模型,這一模型可以在保證檢出率的同時,減少38%的不必要穿刺。
ChatGPT能否替代醫生診療
今年JAMA內科學雜志報道了一項研究,研究從國外的醫患咨詢網站收集問題,用這些問題測試ChatGPT的性能,結果顯示,與醫生的在線回復進行對比,研究結果顯示ChatGPT的評分甚至優于醫生的在線回復。
同期,陳醫生團隊也在國際轉化醫學期刊Translational Journal of Medicine上發表了ChatGPT在前列腺癌問診、咨詢、醫學教學中應用的研究。團隊設計了22個患者可能會詢問的與前列腺癌診療相關的問題,研究人員發現ChatGPT針對大部分問題都能給出很好的答案,尤其是前列腺癌分期、分級、常規治療方法等常規問題的回答非常準確;但針對有一定挑戰性的、需要綜合分析患者病情的問題,ChatGPT尚且不能很好地回答。
該研究共評估了ChatGPT、Perplexity、YouChat等多種主流的語言模型,研究人員發現ChatGPT是評分最高的模型,相比其他模型有更高的準確率、更好的人文關懷、更強的穩定性。陳醫生認為目前ChatGPT還不能替代醫生,但是可充分利用ChatGPT更好地輔助診療。另外,基于法律以及倫理的考量,人工智能無法承擔誤診所帶來的后果和法律責任,這也是人工智能在醫療產業中應用時需要考量的一個問題。
未來展望
未來人工智能如何幫助醫生提升疾病診療效果?設想人工智能系統可將病患的健康信息與篩查中心聯網,對病患數據進行分析,包括常規體檢信息、生活習慣以及腫瘤標志物的情況,判斷病患是否有患病風險,是否需要做穿刺病理等進一步的檢查。針對需要穿刺的患者,人工智能可輔助醫生進行圖像分析;針對需要手術的患者,人工智能可以輔助醫生開展機器人手術;術后也可利用人工智能優化隨訪方案,提高隨訪效果。最后,陳醫生表示,面臨前列腺癌診療的諸多挑戰,需要更多信息工程學、藥學領域的研究者聯手合作,共同攻克難題。
03 人工智能在mRNA疫苗研發中的應用
陳庚博士從技術層面介紹了AI在mRNA疫苗研發中的應用,包括mRNA序列的優化、個性化腫瘤疫苗的開發和用于鑒定腫瘤新生抗原的SmartNeo分析平臺的搭建。糖心vlog
AI在mRNA疫苗研發中的應用
人工智能技術在mRNA領域能發揮非常重要的作用,可應用于mRNA各相關領域。例如:在各mRNA疫苗研發管線的上游重要環節中,AI可基于生物信息學進行靶點篩選,也可優化mRNA序列。
mRAN疫苗優勢
mRNA技術具有多方面優勢,與傳統的滅活疫苗相比,mRNA疫苗研發生產的周期短,而且安全性好、易于放大生產等
mRNA疫苗研發面臨序列優化的挑戰
mRNA疫苗的研發基本都會涉及到序列優化。因為mRNA疫苗的研發通?;诳乖O計,抗原是氨基酸序列,絕大部分氨基酸都可由至少兩個密碼子編碼。一個完整的mRNA結構,通常包含5’端的帽子和非編碼區(UTR),及3’端的UTR和Poly(A)尾巴,中間是編碼抗原的編碼區。因此,mRNA每個元件都可能會影響 mRNA的翻譯效率和穩定性。把抗原轉化為mRNA序列來編碼會面臨諸多挑戰,究其原因是密碼子與氨基酸的復雜對應關系。比如人體有64個密碼子,但這些密碼子只編碼20種氨基酸,所以一個氨基酸可能對應多個密碼子,每個氨基酸選擇哪一個密碼子來編碼非常講究。以新冠的刺突蛋白為例,它有超過1200個氨基酸,如果通過密碼子去編碼刺突蛋白,編碼氨基酸序列有10的632次方種可能,究竟選擇哪一條mRNA序列好極具挑戰,人工智能技術可以幫助篩選優化mRNA序列。
AI在mRNA序列優化中的應用
已有研究表明,密碼子的選擇會影響mRNA序列的穩定性和翻譯效率。因為有些密碼子在細胞里使用頻率較高,但是有些編碼同一個氨基酸的密碼子使用頻率可能會較低,所以選擇使用頻率較高的密碼子可潛在提高mRNA翻譯成抗原的速度。但也不能單一地選擇使用頻率高的密碼子編碼氨基酸,這樣可能會造成mRNA序列的不穩定,序列設計需要綜合考慮多方面的因素。
斯微與百度合作開發了名為LinearDesign的AI算法,用于mRNA序列優化與設計,成果剛發表在Nature正刊上。這個算法是從mRNA最小自由能(MFE)和密碼子適應指數(CAI)綜合考慮,進行mRNA序列的設計與優化。理論上,mRNA的二級結構越穩定,在細胞內表達時間越長,而密碼子適應指數可反應mRNA翻譯成蛋白的速度。如果mRNA翻譯速度快且穩定,則蛋白表達量就能越高。因此,綜合考慮這兩種重要因素才有可能設計出理想的mRNA分子。這篇Nature文章中的研究結果顯示,利用LinearDesign算法優化后的新冠mRNA疫苗序列,不僅能夠提高mRNA的穩定性和蛋白表達量,而且該疫苗能夠在體內誘導更高的結合抗體、中和抗體和細胞免疫水平。同時,在測試水痘和帶狀皰疹mRNA序列中顯示,優化的mRNA序列也具有更高的穩定性和蛋白表達水平,并在體內誘導產生了更高的結合抗體。
顯然,人工智能在mRNA序列設計及優化上面能發揮非常大的作用,能夠快速設計出表達高且穩定性好的mRNA序列,極大地促進了mRNA疫苗的研發。
AI在mRNA個性化腫瘤疫苗開發中的應用
? mRNA個性化腫瘤疫苗開發流程
通常是首先獲取患者腫瘤組織樣本進行測序,鑒定腫瘤新生抗原,設計相應的mRNA疫苗,再將mRNA疫苗注射到患者體內,人體內的抗原呈遞細胞攝取這些抗原,包括DC細胞或者是B細胞,把抗原呈遞給T細胞,激活患者體內CD8細胞和CD4 T細胞,然后CD8和CD4 T細胞識別腫瘤表面呈遞出來的特異性抗原,并對這些腫瘤細胞進行相應的殺傷或消滅。
鑒定具有免疫原性的高質量新生抗原是mRNA個性化疫苗開發上游的關鍵。
目前,已有研究表明,腫瘤新生抗原產生的方式多種多樣,包括基因組層面各種突變產生的抗原,也包括RNA層面可變剪切或編輯,還有一些非經典的翻譯以及蛋白翻譯后修飾等方式,都能產生腫瘤新生抗原。并且,已有研究表明,不同種類的腫瘤,其突變負荷和腫瘤新生抗原產生的頻率都不一樣,相對其他癌種,黑色素瘤、肺癌和胃癌等瘤種的腫瘤突變頻率和新生抗原產生頻率均較高,這些患者可能更容易篩選出更多的新生抗原。另外,即使同一個癌種里面,不同個體之間腫瘤新生抗原產生的頻率也有很大差異。因此,設計一個好的個性化mRNA腫瘤疫苗,需要鑒定具有免疫原性的高質量新生抗原。
鑒定高質量新生抗原猶如大海撈針,原因在于:每個腫瘤患者的腫瘤細胞可產生成千上萬的能夠改變蛋白序列的突變,相關研究表明含有突變的肽段能夠被人體的MHC結合的比例可能只有1%左右,能夠被T細胞識別的可能只有0.5%左右,在腫瘤細胞里面能夠有效處理并進行抗原呈遞的可能只有0.3%左右,最終能夠激活患者體內T細胞免疫反應的會更少。因此,鑒定真正具有免疫原性的新型抗原需要克服多方面的困難。所以,研究人員可利用人工智能幫助鑒定與篩選高質量的新生抗原。
SmartNeo分析平臺
陳博士帶領團隊開發了一個能鑒定高質量腫瘤新生抗原的SmartNeo平臺。該平臺能夠基于患者多組學測序數據,進行數據質控,鑒定患者腫瘤組織中特有的突變,分析患者的HLA分型,獲得腫瘤組織中基因和轉錄本表達圖譜,以及突變在不同組學維度的特征等,最終基于相應的AI方法和模型,鑒定篩選出高質量抗原HLA-I型和HLA-II型新抗原,形成了一站式的分析平臺糖心vlog入口。
為了測試分析SmartNeo平臺鑒定高質量新生抗原的性能,以2020年發表在cell上的TESLA (Tumor Neoantigen Selection Alliance, 腫瘤新抗原選擇聯盟)的標準測試數據集為基準,對比近年文獻報道其他新生抗原分析平臺,研究發現SmartNeo平臺與其他平臺相比,分析速度能夠提升至少兩倍,而且能夠鑒定更多高質量的新生抗原。收集斯微國內外開展的臨床實驗結果,顯示SmartNeo平臺預測引起免疫反應的抗原比例也高于其他的文章報道。整體上,SmartNeo分析平臺相對其他平臺更具優勢。
總結
人工智能在生物醫藥領域發揮著越來越大的作用,不僅可降低研發成本,縮短研發周期;在mRNA領域的序列優化方面,AI能夠快速地鑒定篩選出表達更高、穩定性更好的序列;在mRNA個性化腫瘤疫苗研究方面, AI能夠幫助鑒定高質量的新生抗原,更高效分析測序大數據。
Science Café 沙龍
Science café 沙龍是由上海市藥物研發協同創新中心與浦東國際人才發展中心共同舉辦,集信息交流、頭腦激蕩、創意融合的跨界協調合作的平臺。一期一會,一杯咖啡,匯聚集體智慧,多角度探討生物醫藥的創新前沿話題。自2014年起,已累計舉辦40余期品牌沙龍活動。
若您有感興趣的生物醫藥創新前沿話題或有合作意向,歡迎通過以下方式與我們取得聯系,期待與您攜手共進。
聯系人:凌女士
聯系電話:58336301、15000788873
end.
文章、圖片來源:上海市藥物研發協同創新中心公眾號(改)
如有侵權,請后臺聯系小編刪除
tangxin