應用

技術

物聯網世界 >> 物聯網新聞 >> 物聯網熱點新聞
企業(yè)注冊個人注冊登錄

Nature子刊:AI檢測毒品準確率達86%,沒見過的也能測

2021-11-18 14:23 與非網

導讀:據外媒NewScientist報道,加拿大哥倫比亞大學研究小組創(chuàng)造了一種機器學習工具——DarkNPS,可以用AI快速篩選新精神活性物質

  AI連毒品也可以檢測了!

    據外媒NewScientist報道,加拿大哥倫比亞大學研究小組創(chuàng)造了一種機器學習工具——DarkNPS,可以用AI快速篩選新精神活性物質(new psychoactive substance,NPS),這是與可卡因和海洛因類似的興奮劑藥物。由于NPS的化學多樣性及其在非法市場上的存在時間短等性質,目前該藥物的檢測措施面臨重大挑戰(zhàn)。

  DarkNPS可以大大縮短新出現的NPS識別時間,并有效縮短對其化學結構的搜索范圍。該論文發(fā)表于Nature子刊Nature Machine Intelligence。

  01.AI查毒只需幾小時,準確率達86%

  新精神活性物質又稱“策劃藥”或“實驗室毒品”,是不法分子為逃避打擊而對管制毒品進行化學處理所得到的毒品類似物,具有與管制毒品相似或更強的興奮、致幻、麻醉等效果。加拿大不列顛哥倫比亞大學研究小組成員Michael Skinnider和他的同事創(chuàng)造了一種名為DarkNPS的機器學習工具,通過AI工具進行簡單的分析,快速提取出精神活性“新型藥物”化學結構的可能分子結構。

  該工具可以快速開發(fā)實驗室測試服務,以篩選與可卡因和海洛因等毒品具有類似效果的、且無法在當前測試中檢測到的藥物使用情況。研究小組從世界各地的法醫(yī)實驗室收集了大約1700種已知新型設計藥物的化學結構,對其進行訓練。訓練集包括每種藥物的串聯質譜結果,也就是翻譯并分析其部分重組蛋白數據,可以提供有關分子質量及其包含的元素的信息。這使得AI能夠識別串聯質譜數據和化學結構之間的模式。

  Skinnider表示:“我們的方法可以將識別NPS所需的時間從幾周或幾個月縮短到幾個小時?!苯o定一種以前未知的NPS的串聯質譜數據,DarkNPS可以猜測其分子結構。該過程準確度約為51%。如果AI能夠對其分子結構的前10項進行預測,其準確度將增加到86%,這意味著該工具能有效縮小對分子結構的搜索范圍。Skinnider說:“這不僅節(jié)省了大量時間,還能更快識別新上市的新精神活性物質?!?/p>

  02.1700個實例生成穩(wěn)健AI模型

  研究小組在論文中表示,DarkNPS可以僅使用質譜數據自動闡明未知NPS的化學結構,并基于化學結構的深層生成模型。該研究小組的模型橫跨化學和深度學習領域,因為它們有可能根據需要生成具有任意物理化學或生物性質的分子,從而解決所謂的“逆向設計”問題。這項工作的大部分集中在分析具有活性的特定藥物對策分子結構可能性上。

  研究小組表示,他們在研究過程中尋求生成與一個或多個分析測量特性相匹配的類NPS分子,并使用適用于處理低級數據存儲區(qū)的策略來實現這一目標。從約1700個實例中學習設計藥物的穩(wěn)健生成模型,并從這個模型中取樣,隨機產生與現有的NPS存儲空間類似的新的分子結構。研究過程顯示,從模型中取樣新分子的頻率可以用來表明最有可能解釋觀測到的精確質量的化學結構。將生成的結構與串聯質譜數據相結合,進一步提高了結構解析的準確性。DarkNPS最先闡明了2021年2月首次出現在歐洲的NPS的分子結構。該模型的最終結果是建立新型精神活性物質的深層生成模型。

  03.AI生成數據,為模型提供數據庫

  許多計算工具已經開發(fā)出來,能夠在質譜數據中自動識別藥物及其代謝產物。然而,所有這些工具都需要一個已知化學結構的數據庫,可以將觀察到的質譜數據與之進行比較。因此,這些工具無法用于識別現有數據庫中未發(fā)現的新合成設計藥物。該研究小組推斷,通過生成一個新的、類似核動力源的化學結構數據庫,就可以自動識別完全未知的核動力源。因此,研究人員著手學習核動力源化學結構的深層生成模型,從中隨機取樣新的核動力源結構(圖1a-b)。目前包含NPS結構最新、最全面的資源數據庫是用于NPS篩選的數據庫HighResNPS,來自世界各地數十家法醫(yī)實驗室的貢獻者在生物樣本或執(zhí)法部門緝獲的物品中檢測到新物質時,會向HighResNPS提交數據。盡管如此,在2020年6月初,該數據庫僅包含1753個獨特的NPS結構。

  這一數據集的有限規(guī)模反映了非法市場上出現并隨后被法醫(yī)實驗室檢測到的核動力源數量。然而,通常用于訓練化學結構生成模型的數據集將包含數十萬個數據。之后,該研究團隊獲得了194種NPS藥物的數據,發(fā)現其中176種出現在AI生成的數據中。研究人員還通過使用AI推斷1億種可能的化學結構,研究未來可能生成的藥物。此外,哥倫比亞大學梅爾曼公共衛(wèi)生學院的研究人員正在研究使用機器學習來評估法律及其與處方阿片類藥物分配模式的關系。“機器學習方法越來越多地應用于類似的高維數據問題,并可能為其他形式的政策分析提供一種補充方法,包括作為篩選工具來識別需要進一步關注的政策和法律規(guī)定相互作用。”哥倫比亞大學流行病學副教授Silvia Martins說。

  04.結語:AI+醫(yī)療,落地場景更廣闊

  “機器學習方法越來越多地應用于類似的高維數據問題,并可能為其他形式的政策分析提供一種補充方法,包括作為篩選工具來識別需要進一步關注的政策和法律規(guī)定相互作用?!备鐐惐葋喆髮W流行病學副教授Silvia Martins說。NPS特殊的化學結構,使得不法分子有可乘之機,而AI模型能夠快速識別其分子結構,并利用AI從藥物分子結構中預先推斷其可能的情況,提前阻止某些藥物流入市場。這為AI工具的應用提供了新范例,能夠評估類似的藥物分子結構、藥物分配模式等問題。