DNA作為一種數(shù)據(jù)存儲(chǔ)介質(zhì),只有在讀取、復(fù)制和發(fā)送到其他地方時(shí)才有用。從細(xì)胞核中傳遞遺傳信息的介質(zhì)是RNA(https://www.genome.gov/genetics-glossary/RNA-Ribonucleic-Acid)——從DNA轉(zhuǎn)錄而來(lái),它本身永遠(yuǎn)不會(huì)離開(kāi)細(xì)胞核?,F(xiàn)在,伊利諾伊州埃文斯頓西北大學(xué)的研究人員利用深度學(xué)習(xí),解開(kāi)了RNA轉(zhuǎn)錄過(guò)程中的一個(gè)復(fù)雜部分:細(xì)胞如何知道何時(shí)停止復(fù)制。
在RNA轉(zhuǎn)錄中,知道何時(shí)停止是至關(guān)重要的。編碼成RNA的信息在整個(gè)細(xì)胞中用于合成蛋白質(zhì)和調(diào)節(jié)廣泛的代謝過(guò)程。要想將正確的信息傳遞給預(yù)期的目標(biāo),需要這些RNA鏈盡可能多地表達(dá)——僅此而已。
“This is a very useful prescreening tool for investigating genetic variants in a high-throughput manner.”
—EMILY KUNCE STROUP, NORTHWESTERN UNIVERSITY
停止RNA復(fù)制過(guò)程——稱為聚腺苷酸化(polyA,https://en.wikipedia.org/wiki/Polyadenylation),是指它連接在切斷的RNA鏈末端的一系列腺嘌呤分子——涉及一系列相互作用從未被完全理解的蛋白質(zhì)。
因此,為了幫助解開(kāi)polyA,西北大學(xué)的研究人員Zhe Ji和Emily Kunce Stroup開(kāi)發(fā)了一個(gè)機(jī)器學(xué)習(xí)模型,可以定位和識(shí)別polyA位點(diǎn)。它的工作原理是將經(jīng)過(guò)訓(xùn)練以匹配遺傳密碼中重要序列的卷積神經(jīng)網(wǎng)絡(luò)(CNNs,https://spectrum.ieee.org/tag/convolutional-neural-networks)與經(jīng)過(guò)訓(xùn)練以研究CNN輸出的遞歸神經(jīng)網(wǎng)絡(luò)(RNN,https://spectrum.ieee.org/the-neural-network-that-remembers)配對(duì)。
雖然之前的模型采用了類似的方法,同時(shí)使用了CNNs和RNN,但這些研究人員隨后將CNN/RNN模型的輸出輸入到另外兩個(gè)經(jīng)過(guò)訓(xùn)練的深度學(xué)習(xí)模型中,以定位和識(shí)別基因組中的polyA位點(diǎn)。
另外兩個(gè)模型似乎起到了幫助作用。Stroup說(shuō):“擁有這些串聯(lián)輸出是我們工作中真正獨(dú)特的東西。讓模型向外延伸到兩個(gè)獨(dú)立的輸出分支,然后我們將其組合起來(lái)以高分辨率識(shí)別站點(diǎn),這是我們與現(xiàn)有工作的區(qū)別?!?/p>
從他們的模型中,研究人員了解了導(dǎo)致polyA進(jìn)展順利或不佳的幾個(gè)重要方面。模型的CNN部分學(xué)習(xí)了已知能吸引控制polyA的蛋白質(zhì)的DNA中的遺傳模式,而模型的RNN部分揭示了可靠地切斷轉(zhuǎn)錄需要在這些模式之間仔細(xì)間隔。由于該模型的核苷酸分辨率,這些研究人員可以得出如此精確的結(jié)論。Ji說(shuō):“我們的模型能夠準(zhǔn)確地捕捉到這一點(diǎn),這令人震驚。”
該團(tuán)隊(duì)表示,今后他們計(jì)劃將他們的模型和類似技術(shù)應(yīng)用于識(shí)別可能導(dǎo)致疾病的關(guān)鍵基因突變的研究,然后從中開(kāi)發(fā)出一種可能的更有針對(duì)性的治療藥物。Stroup說(shuō):“這是一種非常有用的預(yù)篩選工具,可以以高通量的方式研究基因變異。這有望幫助減少候選突變的數(shù)量,使這一過(guò)程更加有效?!?/p>
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4841瀏覽量
108147 -
DNA
+關(guān)注
關(guān)注
0文章
244瀏覽量
32132 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5604瀏覽量
124610
原文標(biāo)題:深度學(xué)習(xí)破解DNA數(shù)據(jù)復(fù)制難題
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
云翎智能低軌衛(wèi)星通信數(shù)據(jù)終端:破解交通鐵路應(yīng)急搶險(xiǎn)與全球無(wú)縫接入雙重難題
意法半導(dǎo)體為超大規(guī)模AI數(shù)據(jù)中心破解供電難題
【技術(shù)帖】音頻雜音深度拆解:從成因到破解,告別排查難題
軟通動(dòng)力攜手中國(guó)誠(chéng)通破解多業(yè)態(tài)財(cái)務(wù)風(fēng)險(xiǎn)管理難題
佩特科技RK3588一體屏如何破解工業(yè)數(shù)據(jù)閉環(huán)難題
燒錄芯片與IC復(fù)制是一回事嗎?深度解析芯片燒錄原理
福祿克BT520/521系列蓄電池測(cè)試儀破解行業(yè)運(yùn)維難題
設(shè)備電磁兼容整改:硬軟件雙維度破解輻射超標(biāo)難題
新思科技如何破解邊緣AI部署難題
深度學(xué)習(xí)對(duì)工業(yè)物聯(lián)網(wǎng)有哪些幫助
實(shí)時(shí)監(jiān)測(cè)技術(shù)如何破解高溫巡檢難題
如何破解三菱PLC與西門子PLC的通訊難題
云翎智能巡檢終端:以“北斗+”破解森林巡檢“最后一公里”難題
深度學(xué)習(xí)破解DNA數(shù)據(jù)復(fù)制難題
評(píng)論