基于Agraph卷積的分類模型,用于從越南傳統(tǒng)草藥數(shù)據(jù)庫中識別抗癌代謝物的分類模型
一、文章概述
幾千年來,越南一直是豐富多樣的草藥來源,在藥物開發(fā)中發(fā)揮各種目的,以解決健康問題,如癌癥。聲稱化學信息學相關(guān)的原理,結(jié)構(gòu)相似的化合物很可能有類似的生物活性,本研究采用分子圖卷積,機器學習體系結(jié)構(gòu)從小分子提取特征的作為無向圖,預測基于代謝物的結(jié)構(gòu)越南草藥的抗癌能力。除了分子圖卷積,擴展連接指紋,一種傳統(tǒng)的利用分子細節(jié)的飽和器(ECFP),以進行性能比較。最后,我們成功地構(gòu)建了一個基于圖卷積的神經(jīng)網(wǎng)絡(luò),具有較高的預測精度,表明該模型在檢測抗癌活性方面是可靠的。
二、圖文導讀
圖1.從NCI-60數(shù)據(jù)集建立訓練和預測抗癌活性的數(shù)據(jù)集。
圖2.在迭代0時,部分分子的說明。N表示氮原子,被認為是檢測原子或核心原子,其標識符為d。C和O分別表示碳,標識符為b的氧原子和標識符為a的氧原子。一行代表單鍵,雙線代表雙鍵。
圖3.在迭代0和迭代1時,N個原子的標識符d的說明。每次迭代后,子結(jié)構(gòu)表示在化學結(jié)構(gòu)洞察力方面變得更加豐富。
圖4.在圖卷積層中的操作說明。C1、C2和C3的陣列表示C原子的特征向量。N原子和O原子分別使用相同的符號。核心原子,氮,被標記為藍色。為了進行卷積,形成與3個相鄰原子相關(guān)的核心原子的新特征,這個總和將由一個激活函數(shù)進行和包裹。新的特征向量被標記為紅色。類似地,同樣的過程將應(yīng)用于分子結(jié)構(gòu)中的所有節(jié)點,這將為每個節(jié)點產(chǎn)生全新的特征向量。
圖5.在兩個相鄰原子的核心原子上的圖卷積層的說明。
圖6.基于勞盟-俄羅斯石油公司的分類性能。
三、全文總結(jié)
我們成功地構(gòu)建了抗癌活性預測模型,盡管數(shù)據(jù)集規(guī)模小,結(jié)果有希望。此外,我們還成功地從NCI-60數(shù)據(jù)庫中抓取微笑數(shù)據(jù),并進行過濾,獲得最終清理后的數(shù)據(jù)集,從而取得了良好的性能。在未來,該模型將作為一個獨立的版本構(gòu)建,作為挖掘越南藥用植物的工具。基于這項研究,DeepChem不僅有能力發(fā)現(xiàn)抗癌候選藥物,而且還可以用于對針對其他疾病的潛在候選藥物進行圖挖掘。
文章鏈接:
http://n.ustb.edu.cn/https/77726476706e69737468656265737421f4fb0f9d243d265f6c0f/doi/10.1145/3184066.3184090
本信息源自互聯(lián)網(wǎng)僅供學術(shù)交流 ,如有侵權(quán)請聯(lián)系我們立即刪除。
| 溫馨提示:蘇州北科納米供應(yīng)產(chǎn)品僅用于科研,不能用于人體,不同批次產(chǎn)品規(guī)格性能有差異。網(wǎng)站部分文獻案例圖片源自互聯(lián)網(wǎng),圖片僅供參考,請以實物為主,如有侵權(quán)請聯(lián)系我們立即刪除。 |
下一篇: 納米醫(yī)學產(chǎn)品1


