干貨篇:AI賦能醫(yī)藥工業(yè)發(fā)展案例

0 評(píng)論 4148 瀏覽 28 收藏 10 分鐘

編輯導(dǎo)語:醫(yī)藥工業(yè)往往研發(fā)周期長、成功率低并且研發(fā)費(fèi)用高,這也是一直是困擾制藥企業(yè)的魔咒。而AI技術(shù)日新月異的發(fā)展給很多行業(yè)帶來了變革,醫(yī)藥工業(yè)同樣也受益于AI帶來的技術(shù)紅利,解決行業(yè)痛點(diǎn),提高開發(fā)效率。本篇文章中,作者就為我們介紹了AI賦能醫(yī)藥工業(yè)發(fā)展的案例。

剛剛過去的這個(gè)周末,我受到邀請(qǐng)進(jìn)行了一次演講,演講題目是《AI賦能醫(yī)藥工業(yè)發(fā)展案例》。

這次演講中,我將我們之前所做過的2個(gè)案例給大家做了詳細(xì)的講解,出乎意料的是對(duì)醫(yī)藥方面感興趣的聽眾遠(yuǎn)遠(yuǎn)高于我的預(yù)期。

從產(chǎn)業(yè)互聯(lián)網(wǎng)的角度來考慮,未來是B端產(chǎn)品的市場(chǎng),也是傳統(tǒng)企業(yè)轉(zhuǎn)型信息化的重要時(shí)刻。我們需要結(jié)合未來的發(fā)展對(duì)以后的產(chǎn)品布局進(jìn)行深入的分析,做好頂層架構(gòu),才能擁抱以后的產(chǎn)品格局的變化。

我是醫(yī)藥行業(yè)的產(chǎn)品經(jīng)理,所以在這次演講中主要針對(duì)于醫(yī)藥工業(yè)方向進(jìn)行了主要論述。其中包含醫(yī)藥工業(yè)語言的定義及符號(hào)OCR技術(shù),知識(shí)圖譜在醫(yī)藥工業(yè)以及藥物情報(bào)領(lǐng)域的應(yīng)用等。

對(duì)于醫(yī)藥工業(yè)還有很多工作可以去做,在我的演講中也進(jìn)行了梳理,從早期藥物發(fā)現(xiàn)、上游工藝、下游工藝、生產(chǎn)質(zhì)控等多個(gè)方面,還有待于我們?nèi)ヌ剿鳌?/p>

我在這里給大家詳解一下我演講的主要內(nèi)容。

頭像和介紹就不細(xì)說了,目前為止沒有出現(xiàn)脫發(fā)的相關(guān)癥狀。

工業(yè)互聯(lián)網(wǎng)的核心在于數(shù)據(jù)采集、數(shù)據(jù)連接、數(shù)據(jù)計(jì)算與處理,俗稱端、管、云三大基石。其中“端”主要講的是設(shè)備互聯(lián),“管”主要講的是內(nèi)外互聯(lián),“云”主要強(qiáng)調(diào)的是云計(jì)算、邊緣計(jì)算等內(nèi)容。

對(duì)于藥物研發(fā),很多人會(huì)認(rèn)為藥物研發(fā)高深莫測(cè),其實(shí)這些的確離大眾比較遠(yuǎn)。產(chǎn)業(yè)互聯(lián)網(wǎng)的興起就是脫離的大眾的認(rèn)知,將技術(shù)帶入到產(chǎn)業(yè)之中。

本次的主題是醫(yī)藥工業(yè)研發(fā)案例,那自然會(huì)有很多醫(yī)藥行業(yè)的知識(shí)在其中。具體AI如何能夠?qū)︶t(yī)藥工業(yè)的環(huán)境進(jìn)行加速,手下我們必須了解都能在哪些地方加速。下圖中詳細(xì)的描述了各個(gè)應(yīng)用場(chǎng)景中的一些內(nèi)容。

對(duì)于沒有醫(yī)藥背景的伙伴,可能理解上稍微困難一些,不過可以體會(huì)如何分解具體的工業(yè)環(huán)節(jié)。

首先,我們通過工業(yè)語言的案例進(jìn)行講解。

工業(yè)語言與我們平時(shí)說話是一樣的,只是用在了工業(yè)中的一種交流方式。這種語言形式具有科學(xué)性、行業(yè)性、通用性三個(gè)基礎(chǔ)要素。

分子圖像識(shí)別案例,可以解釋為一種工業(yè)語言提取技術(shù)。通過AI技術(shù),可以將文獻(xiàn)中的分子式一次性提取出來并達(dá)到識(shí)別的效果。

這項(xiàng)技術(shù)具有諸多應(yīng)用場(chǎng)景:首先可以對(duì)分子結(jié)構(gòu)進(jìn)行檢索操作,對(duì)于專利這類具有法律效力的文件,通過我們的技術(shù)可以一次性獲得該專利的所有保護(hù)化合物的保護(hù)邊界,極大的節(jié)省了專利分析師的人力成本,提高了效率。

本項(xiàng)目算法分為三個(gè)階段:分子位置發(fā)現(xiàn),使用目標(biāo)檢測(cè)Mask?RCNN相關(guān)技術(shù)完成;原子與鍵的識(shí)別,使用open?CV相關(guān)技術(shù)完成;原子與鍵的表示,使用統(tǒng)計(jì)關(guān)系學(xué)習(xí)概率圖方式進(jìn)行。

其中,化學(xué)式的表示使用MOL文件格式。

馬爾科夫邏輯網(wǎng)絡(luò),在于通過概率的形式將推斷式進(jìn)行了軟化。這種方法其實(shí)就是一種推斷,將推斷的節(jié)點(diǎn)增加,就變?yōu)橐粋€(gè)網(wǎng)絡(luò)的形式,也就是概率圖。

第二個(gè)案例是我們?cè)诠I(yè)知識(shí)圖譜方面的項(xiàng)目,工業(yè)知識(shí)圖譜最重要的是將與工業(yè)生產(chǎn)中的知識(shí)結(jié)構(gòu)化,構(gòu)成知識(shí)圖譜的節(jié)點(diǎn)進(jìn)行推斷。

知識(shí)圖譜是當(dāng)前較為流行的AI技術(shù)體系,不過在工業(yè)中運(yùn)用時(shí),需要明確具體的使用場(chǎng)景,具體哪些環(huán)節(jié)可以用到該技術(shù)。

如下圖,在醫(yī)藥知識(shí)檢索、投資標(biāo)地、藥物重定向、臨床路徑評(píng)估等過程中,都可以利用知識(shí)圖譜的相關(guān)技術(shù)滿足這些需求。

圖譜的構(gòu)建過程大概分為如下圖闡述的幾個(gè)步驟:

通常來講,一個(gè)企業(yè)有三類數(shù)據(jù)源應(yīng)該參與圖譜的構(gòu)建過程。

  1. 企業(yè)內(nèi)部數(shù)據(jù):企業(yè)在生產(chǎn)過程中會(huì)闡述很多經(jīng)驗(yàn)性的內(nèi)容數(shù)據(jù),這些數(shù)據(jù)與業(yè)務(wù)結(jié)合緊密,可以作為構(gòu)件圖譜的數(shù)據(jù)源。
  2. 外部公開數(shù)據(jù):這類數(shù)據(jù)可能是一些知識(shí)庫的形式在互聯(lián)網(wǎng)中廣泛存在,比如與行業(yè)相關(guān)的行業(yè)資料,開源數(shù)據(jù)庫等。
  3. 外部付費(fèi)數(shù)據(jù):如果企業(yè)有資金可以購買一部分付費(fèi)數(shù)據(jù),那么這部分?jǐn)?shù)據(jù)具有非常規(guī)則的數(shù)據(jù)結(jié)構(gòu),可以納入圖譜中進(jìn)行構(gòu)建。

藥物知識(shí)圖譜可以篩選當(dāng)前上市藥物中,哪些藥物對(duì)新冠病毒有療效。諸如此類應(yīng)用場(chǎng)景,對(duì)整個(gè)醫(yī)藥工業(yè)以及全民健康具有深遠(yuǎn)的意義,謝謝大家?。?/p>

#專欄作家#

白白,公眾號(hào):白白說話(xiaob-talk)。人人都是產(chǎn)品經(jīng)理專欄作家,醫(yī)藥行業(yè)資深產(chǎn)品專家,負(fù)責(zé)人工智能行業(yè)類產(chǎn)品綜合架構(gòu)與技術(shù)開發(fā)。在行業(yè)云產(chǎn)品架構(gòu),藥物設(shè)計(jì)AI輔助、醫(yī)療知識(shí)圖譜等領(lǐng)域有深入研究。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!