| 1 | 1/1 | 返回列表 |
| 查看: 6766 | 回復(fù): 0 | |||
科研小生k新蟲 (初入文壇)
|
[交流]
集成多組學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用
|
|
集成多組學(xué)數(shù)據(jù)的機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用 機(jī)器學(xué)習(xí)及生物組學(xué)基礎(chǔ) 目標(biāo):對(duì)機(jī)器學(xué)習(xí)基本概念進(jìn)行介紹,讓大家對(duì)機(jī)器學(xué)習(xí)基本概念有大致了解。明確機(jī)器學(xué)習(xí)方法的適用性,優(yōu)勢,以及局限性等 什么是機(jī)器學(xué)習(xí) 機(jī)器學(xué)習(xí)的應(yīng)用實(shí)例 生物組學(xué)簡介(基因組學(xué),轉(zhuǎn)錄組學(xué),蛋白組學(xué),代謝組學(xué)) 機(jī)器學(xué)習(xí)在在多組學(xué)數(shù)據(jù)分析的應(yīng)用 python基礎(chǔ) 目標(biāo):機(jī)器學(xué)習(xí)主流實(shí)現(xiàn)是python語言。學(xué)習(xí)機(jī)器學(xué)習(xí)之前,有針對(duì)性的對(duì)python進(jìn)行系統(tǒng)的學(xué)習(xí),數(shù)據(jù)的基本處理,以方便將來開展機(jī)器學(xué)習(xí)的學(xué)習(xí) python安裝與開發(fā)環(huán)境的搭建 基本數(shù)據(jù)類型、組合數(shù)據(jù)類型 函數(shù)、列表 、元組、字典、集合 控制結(jié)構(gòu)、循環(huán)結(jié)構(gòu) Numpy模塊——矩陣的科學(xué)計(jì)算 Matplotlib模塊——數(shù)據(jù)處理與繪圖 Pandas模塊——csv數(shù)據(jù)處理與分析 Sklearn模塊——機(jī)器學(xué)習(xí)模型基礎(chǔ)軟件包調(diào)用 ² 案例實(shí)踐一:利用Python pandas讀取組學(xué)CSV數(shù)據(jù)并進(jìn)行數(shù)據(jù)讀取、轉(zhuǎn)換、保存等 生物組學(xué)大數(shù)據(jù)預(yù)處理與探索分析 目標(biāo):對(duì)高維組學(xué)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析及機(jī)器學(xué)習(xí)建模前,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,如缺失值填補(bǔ)、降維可視化等,大數(shù)據(jù)預(yù)處理與探索分析是檢驗(yàn)數(shù)據(jù)質(zhì)量與了解數(shù)據(jù)分布的必要過程。 高維組學(xué)數(shù)據(jù)的預(yù)處理框架 常用數(shù)據(jù)預(yù)處理方法:缺失值填補(bǔ),標(biāo)準(zhǔn)化,歸一化,對(duì)數(shù)轉(zhuǎn)化 常用的降維方法,PCA,tSNE等 數(shù)據(jù)探索分析(EDA) ² 案例實(shí)踐教學(xué)二:利用Python讀取組學(xué)CSV數(shù)據(jù)并進(jìn)行數(shù)據(jù)探索可視化分析(Exploratory data analysis,EDA) 經(jīng)典機(jī)器學(xué)習(xí)模型及多組學(xué)應(yīng)用 目標(biāo):對(duì)在多組學(xué)整合分析中最常使用的幾種機(jī)器學(xué)習(xí)模型進(jìn)行介紹,總結(jié)它們的優(yōu)缺點(diǎn)及適用范圍,通過動(dòng)手實(shí)踐快速掌握幾種方法 線性模型(線性回歸、梯度下降、正則化、回歸的評(píng)價(jià)指標(biāo)) 決策樹(決策樹原理、ID3算法、C4.5算法、CART算法) 支持向量機(jī)(線性支持向量機(jī)、可分、不可分支持向量機(jī)) 集成學(xué)習(xí)(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法) 模型選擇與性能優(yōu)化(數(shù)據(jù)清洗、特征工程、數(shù)據(jù)建模) Scikit-learn機(jī)器學(xué)習(xí)庫的使用 ² 案例實(shí)踐三:基于轉(zhuǎn)錄組學(xué)數(shù)據(jù)進(jìn)行端到端的機(jī)器學(xué)習(xí)項(xiàng)目泛癌預(yù)測(數(shù)據(jù)預(yù)處理,數(shù)據(jù)建模,模型評(píng)估) ² 案例實(shí)踐四:基于蛋白組學(xué)-代謝組學(xué)在COVID-19中生物標(biāo)志物的發(fā)現(xiàn) 深度學(xué)習(xí)在組學(xué)數(shù)據(jù)的應(yīng)用 (入門及實(shí)踐) 目標(biāo):隨著高通量組學(xué)平臺(tái)的發(fā)展,生物醫(yī)學(xué)研究大多采取了多組學(xué)技術(shù)結(jié)合的方法,不同組學(xué)來源(如轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué))的數(shù)據(jù)可以通過基于深度學(xué)習(xí)的預(yù)測算法進(jìn)行整合,以揭示系統(tǒng)生物學(xué)的復(fù)雜工作。在這一部分我們會(huì)重點(diǎn)對(duì)基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)進(jìn)行系統(tǒng)的講解,學(xué)習(xí)常見的神經(jīng)網(wǎng)絡(luò)架構(gòu)在多組學(xué)分析的應(yīng)用。 Ø 深度學(xué)習(xí)介紹,常用神經(jīng)網(wǎng)絡(luò)架構(gòu)介紹Ø 監(jiān)督學(xué)習(xí)介紹,神經(jīng)網(wǎng)絡(luò)在轉(zhuǎn)錄組學(xué)+代謝組學(xué)的疾病預(yù)測為例 Ø 無監(jiān)督學(xué)習(xí)介紹,高維組學(xué)數(shù)據(jù)降維,聚類分析,以單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)為例 ² 案例實(shí)踐五:基于t-SNE和UMAP進(jìn)行單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)降維,細(xì)胞亞型聚類分析。 進(jìn)階大綱 多組學(xué)聯(lián)合分析,闡明疾病分子機(jī)制 (入門及實(shí)戰(zhàn)) 背景:研究影響疾病表型變化影響的因素包括DNA,RNA,蛋白質(zhì)和代謝物等。單一組學(xué)的數(shù)據(jù)難以系統(tǒng)全面地解析復(fù)雜生理過程的調(diào)控機(jī)制,多組學(xué)聯(lián)合分析通過對(duì)來自基因組、轉(zhuǎn)錄組、蛋白組、代謝組和脂質(zhì)組等不同生物分子層次的批量數(shù)據(jù)進(jìn)行歸一化處理、比較分析和相關(guān)性分析等統(tǒng)計(jì)學(xué)分析,建立不同層次分子間的數(shù)據(jù)關(guān)系,從而共同探究生物體內(nèi)潛在的調(diào)控網(wǎng)絡(luò)機(jī)制,為生物體作用機(jī)制提供了更多證據(jù)。 目標(biāo):從常見的多組學(xué)聯(lián)合分析策略出發(fā),如轉(zhuǎn)錄組+代謝組,蛋白組+代謝組等,對(duì)常用的數(shù)理統(tǒng)計(jì)分析方法進(jìn)行介紹,之后學(xué)習(xí)如何利用數(shù)據(jù)庫如KEGG等進(jìn)行生物功能富集分析,結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行生物標(biāo)志物的挖掘,疾病預(yù)測以及生物分子作用機(jī)制等。 常用生物組學(xué)實(shí)驗(yàn)與分析方法,如轉(zhuǎn)錄組學(xué),代謝組學(xué)常用組學(xué)數(shù)據(jù)庫介紹,如TCGA,PathBank,HMDB,KEGG Python批量處理組學(xué)數(shù)據(jù)-歸一化處理,差異分析,相關(guān)性分析 生物功能分析:GO 功能分析、代謝通路富集、分子互作等 基于轉(zhuǎn)錄組學(xué)的差異基因篩選,疾病預(yù)測 基于差異基因,聯(lián)合代謝組學(xué)分析疾病分子發(fā)生機(jī)制 Ø 組學(xué)數(shù)據(jù)可視化,如火山圖,t-SNE降維,代謝通路網(wǎng)絡(luò)分析 Ø 組學(xué)特征(基因,蛋白,代謝物)選擇(隨機(jī)森林分析) Ø 單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)分析及可視化分析 ² 案例實(shí)踐三:(包含以下內(nèi)容) ² 轉(zhuǎn)錄組+代謝組的多組學(xué)分析胃癌 ² 從海量的數(shù)據(jù)中篩選出關(guān)鍵基因、代謝物及代謝通路 ² 深度解析胃癌腫瘤標(biāo)志物解釋腫瘤發(fā)生發(fā)展的復(fù)雜性和整體性案例 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)階(入門及實(shí)踐) 目標(biāo):學(xué)習(xí)前沿神經(jīng)網(wǎng)絡(luò)如卷積神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò),注意力機(jī)制,自編碼器,圖神經(jīng)網(wǎng)絡(luò)在生物組學(xué)及藥物篩選的應(yīng)用,遷移學(xué)習(xí)應(yīng)用等。 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(影像組學(xué)) 循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(蛋白組學(xué)) 注意力機(jī)制基礎(chǔ)及其應(yīng)用 自編碼器基礎(chǔ)及其應(yīng)用(轉(zhuǎn)錄組學(xué)) 圖神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(代謝組學(xué)) 遷移學(xué)習(xí)、深度學(xué)習(xí)框架——transformer的應(yīng)用 ² 案例實(shí)踐四:基于(變分)自編碼器進(jìn)行藥物/代謝物分子生成 深度學(xué)習(xí)在組學(xué)數(shù)據(jù)藥物發(fā)現(xiàn)的應(yīng)用 (入門及實(shí)踐) 目標(biāo):基于基因表達(dá)特征建立疾病與小分子藥物之間的關(guān)聯(lián)關(guān)系,運(yùn)用轉(zhuǎn)錄組學(xué),蛋白組學(xué),機(jī)器學(xué)習(xí)算法進(jìn)行藥物重定位。 基于生物組學(xué)的藥物發(fā)現(xiàn)基礎(chǔ)介紹 藥物分子化學(xué)特征提取(分子指紋,描述符,分子圖)圖神經(jīng)網(wǎng)絡(luò)預(yù)測藥物分子性質(zhì) 基于胰腺癌差異表達(dá)基因進(jìn)行藥物重定位 ² 案例實(shí)踐教五:基于機(jī)器學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)進(jìn)行代謝物/藥物分子的性質(zhì)預(yù)測 AI+Science 目標(biāo):人工智能領(lǐng)域前沿內(nèi)容,讓大家了解最新的多組學(xué)與機(jī)器學(xué)習(xí)領(lǐng)域的研究動(dòng)態(tài),同時(shí)介紹幾種更為先進(jìn)的機(jī)器學(xué)習(xí)算法。 集成學(xué)習(xí)在多組學(xué)數(shù)據(jù)聯(lián)合分析中的應(yīng)用 多組學(xué)數(shù)據(jù)庫在生物信息網(wǎng)絡(luò)的挖掘與應(yīng)用 生成模型在多組學(xué)數(shù)據(jù)的應(yīng)用與挑戰(zhàn) 圖神經(jīng)網(wǎng)絡(luò)進(jìn)階,鏈路預(yù)測在疾病-基因-蛋白-代謝物的關(guān)聯(lián)網(wǎng)絡(luò)應(yīng)用 ² 案例實(shí)踐七:基于生成模型進(jìn)行單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)深度特征提取的研究 經(jīng)典案例論文研究(論文圖表復(fù)現(xiàn)) 目標(biāo):通過學(xué)習(xí)經(jīng)典多組學(xué)研究的SCI論文研究思路,系統(tǒng)學(xué)習(xí)多組學(xué)研究的論文圖表制作,以單細(xì)胞組學(xué)研究為例,進(jìn)行論文思路研究,方法探討,圖表制作。 ² 論文復(fù)現(xiàn)一:單細(xì)胞組學(xué)論文的常用圖表制作、細(xì)胞差異分析、細(xì)胞注釋(自動(dòng)與手動(dòng)) ² 論文復(fù)現(xiàn)二:蛋白-蛋白相互作用網(wǎng)絡(luò)構(gòu)建與可視化復(fù)現(xiàn)。 ![]() ![]() 了解更多 請(qǐng)關(guān)注公眾號(hào):第一性原理計(jì)算與應(yīng)用 |
| 1 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[基金申請(qǐng)]
|
xhuama 2026-03-02 | 11/550 |
|
|---|---|---|---|---|
|
[考博] 26申博-目前4篇SCI一作 +3 | chen_2024 2026-03-02 | 3/150 |
|
|
[考研] 0703化學(xué)調(diào)劑 +4 | G212 2026-03-03 | 5/250 |
|
|
[考研] 085601 材料305分求助 +3 | 泡泡郵件 2026-03-03 | 5/250 |
|
|
[考研] 復(fù)試調(diào)劑 +4 | 杰尼龜aaa 2026-03-03 | 4/200 |
|
|
[考研] 292求調(diào)劑 +3 | sgbl 2026-03-03 | 3/150 |
|
|
[考研] 環(huán)境調(diào)劑 +5 | 柒槿levana 2026-03-01 | 5/250 |
|
|
[考研] 一志愿華中科技大學(xué),化學(xué)專業(yè)344分,求調(diào)劑 +6 | 邢xing1 2026-03-02 | 6/300 |
|
|
[考研] 考研復(fù)試調(diào)劑,過國家線的同學(xué)都可報(bào)名 +7 | 黑!在干嘛 2026-02-28 | 8/400 |
|
|
[考研]
|
好好好1233 2026-02-28 | 16/800 |
|
|
[考研] 11408,學(xué)碩276求調(diào)劑 +3 | 崔wj 2026-03-02 | 5/250 |
|
|
[考研] 0856材料求調(diào)劑 +12 | hyf hyf hyf 2026-02-28 | 13/650 |
|
|
[考研] 化學(xué),材料,環(huán)境類求調(diào)劑 +7 | 考研版棒棒 2026-03-02 | 7/350 |
|
|
[考研] 275求調(diào)劑 +7 | 明遠(yuǎn)求學(xué) 2026-03-01 | 7/350 |
|
|
[考博] 博士自薦 +4 | kkluvs 2026-02-28 | 5/250 |
|
|
[考研] 264求調(diào)劑 +4 | 巴拉巴拉根556 2026-02-28 | 4/200 |
|
|
[考研] 275求調(diào)劑 +3 | L-xin? 2026-03-01 | 6/300 |
|
|
[考博] 26申博 +4 | 想申博! 2026-02-26 | 6/300 |
|
|
[考研] 328求調(diào)劑 +3 | aaadim 2026-03-01 | 5/250 |
|
|
[考研] 304求調(diào)劑 +6 | 曼殊2266 2026-02-28 | 7/350 |
|