點擊👉

娛樂城

深度學習在合成生物在線娛樂城學上獲得“立足點”

DNA和RNA已與“說明手冊”進行了比較,其中包含了使活“機器”運行所需的信息。但是,儘管像計算機和機器人這樣的電子機器是從頭開始設計用於特定目的的,但是生物體卻受更混亂,更複雜的功能集的控制,這些功能缺乏二進制代碼的可預測性。發明解決生物學問題的新方法需要分開看似棘手的變量,即使對於最強悍的人腦來說,這也是一項艱鉅的任務。

哈佛大學懷斯研究所和麻省理工學院的兩個科學家小組已經超越了人類的大腦,設計了繞過這一障礙的途徑。他們開發了一套機器學習算法,可以分析大量基於RNA的“ toehold”序列,並預測哪些序列對感應和響應所需的目標序列最有效。正如今天同時發表在兩篇論文中的報導 自然通訊,該算法也可以推廣到合成生物學中的其他問題,並且可以加快生物技術工具的開發,以改善科學和醫學並幫助挽救生命。

Luis Soenksen博士說:“這些成就令人激動,因為它們標誌著我們能夠提出有關RNA折疊基本原理的更好問題的起點,這是我們需要知道的以便實現有意義的發現並構建有用的生物技術。” D.是Wyss研究所的博士後研究員,麻省理工學院的Jameel Clinic的風險投資人,他是這兩篇論文中第一篇的共同第一作者。

了解腳趾開關

Wyss研究所的Predictive BioAnalytics Initiative的數據科學家與Wyss核心學院成員Jim Collins的麻省理工學院的合成生物學家之間的協作是為了將機器學習,神經網絡和其他算法架構的計算能力應用於生物學中復雜的問題而迄今沒有解決的問題。作為他們研究方法的基礎,兩個團隊專注於特定類別的工程RNA分子:腳趾開關,它們在“關閉”狀態下折疊成髮夾狀。當互補的RNA鏈與髮夾一端的“觸發”序列結合時,腳趾開關將展開至其“接通”狀態,並暴露先前隱藏在髮夾內的序列,從而使核醣體結合併翻譯打麻將賺現金下游基因轉化為蛋白質分子。響應給定分子的存在,對基因表達的這種精確控制使得前額開關成為檢測環境中物質,檢測疾病和其他目的的非常強大的組件。

但是,許多腳尖開關在進行實驗測試時不能很好地工作,即使已將它們設計為根據已知的RNA折疊規則響應給定輸入而產生所需的輸出。認識到這個問題後,研究小組決定使用機器學習來分析大量的腳趾開關序列,並利用分析得出的見解來更準確地預測哪些腳趾可靠地執行了預期的任務,這將使研究人員能夠快速識別高質量的腳趾開關。各種實驗。

他們面臨的第地下539包牌一個障礙是,沒有足夠大的鞋頭開關序列數據集可供深度學習技術有效分析。作者自己動手生成了一個數據集完美娛樂城 這對於訓練此類模型很有用。 “我們通過系統採樣23種病毒和906種人類轉錄因子的整個基因組中的短觸發區域,設計並合成了一個龐大的腳趾開關庫,總共近100,000個,” Wyss的哈佛大學研究生Alex Garruss說。娛樂城註冊送體驗金 是第一篇論文的共同第一作者的研究所。 “該數據集規模空前,可以使用先進的機器學習技術來識別和理解有用的開關,以用於直接下游應用和未來設計。”

有了足夠的數據,研究小組首先採用了傳統上用於分析合成RNA分子的工具,以查看它們是否可以準確預測腳趾開關的行為,因為現在有更多示例可用。但是,他們嘗試的所有方法-包括基於熱力學和物理特徵的機械模型-都無法以足夠的準確性進行預測,從而可以更好地預測功能。

一幅圖片價值一千個鹼基對

然後,研究人員探索了各種機器學習技術,以查看它們是否可以創建具有更好預測能力的模型。第一篇論文的作者決定分析腳趾開關不是作為鹼基序列,而是作為鹼基對可能性的二維“圖像”。 Nicolaas Angenent-Mari說:“我們知道RNA分子鹼基對如何相互鍵合的基準規則,但分子是搖擺不定的-它們從來沒有單一的完美形狀,而是它們可能處於不同形狀的可能性,是在Wyss研究所工作的MIT研究生,也是第一篇論文的第一作者。 “計算機視覺算法已經非常擅長於分析圖像,因此我們創建了每個腳趾開關所有可能折疊狀態的圖像表示形式,並在這些圖像上訓練了機器學習算法,以便可以識別出指示給定的圖片是一個好還是不好的頭銜。”

他們基於視覺的方法的另一個好處是,在確定給定序列是“好”還是“壞”時,團隊能夠“看到”腳趾切換序列的哪些部分,算法最受關注。他們將這種解釋方法命名為“可視化二級結構顯著性圖或VIS4Map”,並將其應用於整個腳趾開關d。娛樂城註冊送500數據集。 VIS4Map成功地識別了影響腳趾開關性能的腳趾開關的物理元素,並允許研究人員得出結論,具有潛在競爭性內部結構的腳趾具有更多的“洩漏性”,因此其質量要比具有較少此類結構的腳趾開關低,從而深入了解RNA折疊機制使用傳統分析技術尚未發現的。

“能夠理解和解釋為什麼某些工具起作用或不起作用在一段時間以來一直是人工智能界的次要目標,但是在研究生物學時,可解釋性必須成為我們關注的首要問題,因為這些原因的根本原因系統的行為通常無法直覺,”第一篇論文的資深作者吉姆·柯林斯(Jim Collins)博士說。 “有意義的發現和破壞是對大自然如何運作的深刻理解的結果,並且該項目表明,正確設計和應用機器學習,可以大大增強我們獲得有關生物系統的重要見解的能力。”柯林斯還是麻省理工學院醫學工程和科學的泰米爾醫學教授。

現在你在說我的語言

第一個團隊將腳趾開關序列分析為2D圖像以預測其質量,而第二個團隊則創建了兩種不同的深度學習架構,這些架構使用正交技術來應對這一挑戰。然後,他們超出了預測鞋頭質量的範圍,並使用他們的模型針對不同目的優化和重新設計了性能不佳的鞋頭開關,這在第二篇論文中進行了報導。

第一個模型基於卷積神經網絡(CNN)和多層感知器(MLP),將腳趾序列視為一維圖像或核苷酸鹼基行,並識別鹼基的模式以及這些鹼基之間的潛在相互作用,以預測良好和腳趾頭不好。該團隊使用該模型創建了一種稱為STORM(基於序列的Toehold優化和重新設計模型)的優化方法,該方法可以從頭開始對Toehold序列真錢麻將app進行完全重新設計。該“空白板”工具最適合生成新穎的腳趾開關,以執行特定功能,作為合成遺傳電路的一部分,從而能夠創建複雜的生物工具。

“關於STORM及其基礎模型的真正酷的部分是,在用第一篇論文的輸入數據播種了STORM之後,我們僅用168個樣本就可以對模型進行微調,並使用改進的模型來優化腳趾開關。普遍的假設是,每次想要將機器學習算法應用於新問題時,都需要生成大量數據集的普遍假設,這表明深度學習對合成生物學家的潛在應用要比我們想像的更廣泛。”瓦萊里(Valeri)是麻省理工學院和懷斯學院的研究生。

第二種模型是基於 九州娛樂城在自然語言處理(NLP)上運行,並將每個腳趾序列視為由“單詞”模式組成的“短語”,從而最終了解特定單詞娛樂城推薦ptt在一起組成一個連貫的短語。 “我喜歡將每個腳尖開關都視為句詩:像a句一樣,它是其母語中短語的非常具體的排列-在這種情況下,是RNA。我們實質上是在訓練這種模型以學習如何編寫好的good句。通過提供很多實例,共同撰寫第一篇論文。”共同第一作者普拉德普·拉梅什(Pradeep Ramesh)博士說,他是Wyss研究所的客座博士後,同時也是Sherlock Biosciences的機器學習科學家。

Ramesh和他的合著者將該基於NLP的模型與基於CNN的模型集成在一起,創建了NuSpeak(核酸語音),這是一種優化方法,使他們可以重新設計給定腳趾開關的最後9個核苷酸,同時保留其餘21個核苷酸完整。該技術允許創建旨在檢測特定病原性RNA序列的存在的鞋頭,並可以用於開發新的診斷測試。

該團隊通過優化旨在檢測SARS-CoV-2病毒基因組片段的腳趾開關來實驗驗證了這兩個平台。 NuSpeak將傳感器的性能平均提高了160%,而STORM創建了四個“不良” SARS-CoV-2病毒RNA傳感器的更好版本,其性能提高了28倍。

共同第一作者凱蒂·柯林斯(Katie Collins)說:“ STORM和NuSpeak平台的真正好處在於,它們使您能夠快速設計和優化合成生物學組件,正如我們在開髮用於COVID-19診斷的腳趾傳感器中所展示的那樣。威斯學院(Wyss Institute)的MIT本科生,曾與MIT副教授Timothy Lu,醫學博士,第二篇論文的通訊作者。

“通過機器學習實現的數據驅動方法為計算機科學與合成生物學之間真正有價值的協同增效打開了大門,而我們才剛剛開始涉足這一領域,” Diogo Camacho博士說。第二篇論文是Wyss研究所的高級生物信息學科學家和Predictive BioAnalytics Initiative的聯合負責人。 “也許我們在這些論文中開發的工具最重要的方面是,它們可以推廣到其他類型的基於RNA的序列,例如誘導型啟動子和天然存在的核糖開關,因此可以應用於廣泛的問題和機遇。生物技術和醫學。”

論文的其他作者包括Wyss核心教員和HMS喬治教堂遺傳學教授。和Wyss和MIT研究生Miguel Alcantar和Bianca Lepe。

“人工智能是剛剛開始影響科學和工業的浪潮,在幫助解決棘手的問題方面具有不可思議的潛力。這些研究中描述的突破表明,將計算與合成生物學融合在一起,可以開發出更強大的新功能。生物啟發技術,除了可以帶來對生物控制基本機制的新見解之外,”威斯研究所創始理事Don Ingber博士說。 Ingber還是哈佛醫學院和波士頓兒童醫院血管生物學計劃的Judah Folkman教授,他也是哈佛大學約翰·保爾森工程與應用科學學院的生物工程學教授。

參考:

Angenent-Mari NM,Garruss AS,Soenksen LR,G教堂,Collins JJ。用於可編程RNA開關的深度學習方法。 自然通訊2020; 11(1):5057。 doi:10.1038 / s41467-020-18677-1

本文已從以下材料重新發布。注意:材料的長度和內容可能已被編輯。有關更多信息,請聯繫引用的來源。