機器學習可預測未上市新型人造毒品

英國《自然·機器智慧》雜誌15日發表一項計算生物學突破，包括加拿大英屬哥倫比亞大學在內的研究團隊研發了一種自動化、生成式的機器學習方法，可以僅利用質譜就確定未知的新型精神藥物（又稱人造毒品）的化學結構，了解這些結構能幫助法醫實驗室更快識別出疑似的人造毒品。

每年有大量新型精神藥物出現在非法市場上，這些藥物會造成與已知非法藥物相近的精神效果，但其合成方式使其在化學上與已知非法藥物有所不同，這些藥物規避了現有的毒品法規，甚至難以被偵測。法醫實驗室使用質譜分析法在查封藥片或粉末中識別已知人造毒品。但是，要弄清一種全新人造毒品的結構，通常需要化學專家工作數周或數月，並且需要用到多種實驗技術。

加拿大英屬哥倫比亞大學研究人員邁克爾·斯金奈德及其同事，此次使用全球各地法醫實驗室眾包的保密數據，訓練了一個機器學習模型。他們所使用的演算法也被稱為深度神經網路，其靈感來自於人腦的結構和功能。機器學習産生了結構和性質都類似于近期人造毒品的分子。該模型隨後産生了一個數據庫，包含十億種潛在新型精神藥物的結構。用模型訓練結束後新收集的數據測試該模型，發現這一方法可以僅用質譜就確定未知人造毒品。在準確結構難以精準確定的實例中，該模型建議的結構，與未知人造毒品非常相似。

研究人員發現，該模型還可幫助人們了解到哪些分子更有可能出現在市場上，哪些不太可能。研究人員總結説，用其他數據集訓練的類似的生成方法，也可以幫助識別其他特定領域未知分子的結構，例如識別新型興奮劑或者環境污染物。

研究資深作者、阿爾伯塔大學計算科學專業教授戴維·維斯哈特表示，這一模型意義有點類似2002年的科幻電影《少數派報告》，其可以對即將發生的犯罪活動有所預知，從而幫助顯著減少犯罪，“從本質上講，這一新成果為執法機構和公共衛生計劃提供了一個所謂‘先機’，讓他們知道需注意什麼。”

斯金奈德表示，該模型僅僅通過精確的質譜測量就闡明整個化學結構，而將數十億個結構的列表縮小到10個候選結構，大大加快了化學家識別新藥物的速度。

責任編輯：白雨

分享到：