英國《自然·機器智慧》雜誌15日發表一項計算生物學突破,包括加拿大英屬哥倫比亞大學在內的研究團隊研發了一種自動化、生成式的機器學習方法,可以僅利用質譜就確定未知的新型精神藥物(又稱人造毒品)的化學結構,了解這些結構能幫助法醫實驗室更快識別出疑似的人造毒品。

每年有大量新型精神藥物出現在非法市場上,這些藥物會造成與已知非法藥物相近的精神效果,但其合成方式使其在化學上與已知非法藥物有所不同,這些藥物規避了現有的毒品法規,甚至難以被偵測。法醫實驗室使用質譜分析法在查封藥片或粉末中識別已知人造毒品。但是,要弄清一種全新人造毒品的結構,通常需要化學專家工作數周或數月,並且需要用到多種實驗技術。

加拿大英屬哥倫比亞大學研究人員邁克爾·斯金奈德及其同事,此次使用全球各地法醫實驗室眾包的保密數據,訓練了一個機器學習模型。他們所使用的演算法也被稱為深度神經網路,其靈感來自於人腦的結構和功能。機器學習産生了結構和性質都類似于近期人造毒品的分子。該模型隨後産生了一個數據庫,包含十億種潛在新型精神藥物的結構。用模型訓練結束後新收集的數據測試該模型,發現這一方法可以僅用質譜就確定未知人造毒品。在準確結構難以精準確定的實例中,該模型建議的結構,與未知人造毒品非常相似。

研究人員發現,該模型還可幫助人們了解到哪些分子更有可能出現在市場上,哪些不太可能。研究人員總結説,用其他數據集訓練的類似的生成方法,也可以幫助識別其他特定領域未知分子的結構,例如識別新型興奮劑或者環境污染物。

研究資深作者、阿爾伯塔大學計算科學專業教授戴維·維斯哈特表示,這一模型意義有點類似2002年的科幻電影《少數派報告》,其可以對即將發生的犯罪活動有所預知,從而幫助顯著減少犯罪,“從本質上講,這一新成果為執法機構和公共衛生計劃提供了一個所謂‘先機’,讓他們知道需注意什麼。”

斯金奈德表示,該模型僅僅通過精確的質譜測量就闡明整個化學結構,而將數十億個結構的列表縮小到10個候選結構,大大加快了化學家識別新藥物的速度。

責任編輯:白雨