您現(xiàn)在的位置是:首頁 >要聞 > 2020-12-09 15:21:30 來源:
深度學(xué)習(xí)有助于弄清基因相互作用
卡內(nèi)基梅隆大學(xué)計算機科學(xué)家采用了一種深度學(xué)習(xí)方法,近年來徹底改變了人臉識別和其他基于圖像的應(yīng)用程序,并將其功能重新定向到探索基因之間的關(guān)系。
他們說,訣竅在于將大量的基因表達數(shù)據(jù)轉(zhuǎn)換成更像圖像的東西。善于分析視覺圖像的卷積神經(jīng)網(wǎng)絡(luò)(CNN)隨后可以推斷出哪些基因正在相互作用。CNN在此任務(wù)上的表現(xiàn)優(yōu)于現(xiàn)有方法。
研究人員關(guān)于CNN如何幫助鑒定與疾病相關(guān)的基因以及可能成為藥物靶標的發(fā)育和遺傳途徑的報告今天在《國家科學(xué)院院刊》上發(fā)表。但是計算生物學(xué)和機器學(xué)習(xí)教授Ziv Bar-Joseph表示,這種名為CNNC的新方法的應(yīng)用范圍可能遠遠超出基因相互作用。
與博士后Ye Yuan共同撰寫論文的Bar-Joseph說,論文中描述的新見解表明,CNNC可以類似地用于調(diào)查包括財務(wù)數(shù)據(jù)和社交網(wǎng)絡(luò)在內(nèi)的各種現(xiàn)象的因果關(guān)系。CMU機器學(xué)習(xí)系研究員。
Bar-Joseph說:“十年前開發(fā)的CNN具有革命性意義。” 當他在智能手機上滾動瀏覽照片時,他補充說:“我仍然對使用谷歌照片進行面部識別感到敬畏。”他展示了該應(yīng)用程序如何識別不同年齡的兒子,或根據(jù)圖像識別父親頭部右后方 “我們有時會把這項技術(shù)視為理所當然的,因為我們一直在使用它。但是它功能強大,而且不僅限于圖像。這完全取決于您如何表示數(shù)據(jù)。”
在這種情況下,他和袁正在研究基因關(guān)系。人類中大約有20,000個基因協(xié)同工作,因此有必要知道基因如何在復(fù)合體或網(wǎng)絡(luò)中協(xié)同工作以了解人類的發(fā)育或疾病。
推斷這些關(guān)系的一種方法是查看基因表達,它表示細胞中基因的活性水平。通常,如果基因A同時激活,則基因B激活,這就是兩者相互作用的線索。不過,這可能是巧合,或者兩者都被第三個基因C激活。已經(jīng)開發(fā)出了幾種先前的方法來弄清這些關(guān)系。
為了利用CNN來幫助分析基因關(guān)系,Yuan和Bar-Joseph使用了單細胞表達數(shù)據(jù),這些實驗可以確定單個細胞中每個基因的水平。然后,以矩陣或直方圖的形式排列數(shù)十萬個這些單細胞分析的結(jié)果,以使矩陣的每個細胞代表一對基因的不同共表達水平。
以這種方式呈現(xiàn)數(shù)據(jù)增加了空間方面,這使得數(shù)據(jù)更像圖像,因此CNN更易于訪問。通過使用來自已經(jīng)建立了相互作用的基因的數(shù)據(jù),研究人員能夠訓(xùn)練CNN識別哪些基因在相互作用,哪些不是基于數(shù)據(jù)矩陣中的視覺模式。
Yuan說:“很難區(qū)分因果關(guān)系和相關(guān)性,”但是CNNC方法在統(tǒng)計學(xué)上比現(xiàn)有方法更準確。他和Bar-Joseph期望CNNC將成為研究人員最終將用于分析大型數(shù)據(jù)集的幾種技術(shù)之一。
Bar-Joseph說:“這是一種非常通用的方法,可以應(yīng)用于許多分析。” 主要限制是數(shù)據(jù)-數(shù)據(jù)越多,CNN的工作效果越好。細胞生物學(xué)非常適合使用CNNC,因為典型的實驗可能涉及成千上萬個細胞并產(chǎn)生大量數(shù)據(jù)。