答辯教室——
苗苗扯了扯林書墨衣袖:“快看!教授回來了!不是……他怎么拿上東西又走了???他、他不是評(píng)委嗎?”
邵溫白簡(jiǎn)單和幾位教授交代了兩句,便大步離開。
背影透著一股并不留戀的干脆。
很快,另一位教授站起來,抬手壓了壓現(xiàn)場(chǎng)逐漸變大的嘩然聲和議論聲——
“各位稍安勿躁。邵教授剛才臨時(shí)接到校方的其他安排,所以無法繼續(xù)擔(dān)任評(píng)委一職,接替他的教授正在趕來的路上,很快就到,還請(qǐng)大家保持安靜,耐心等待?!?
大概過了十來分鐘,接替的教授才匆匆趕到。
答辯也正式開始。
第一個(gè)上臺(tái)的,就是蘇雨眠。
她點(diǎn)開ppt,笑著看向臺(tái)下:“各位老師,同學(xué),上午好。我是生命科學(xué)院研三學(xué)生蘇雨眠,我的論文題目是《mosaic-integration-and-knowledge-transfer-of-single-cell-multimodal-data-with-midas》,即利用midas進(jìn)行單細(xì)胞多模態(tài)數(shù)據(jù)的馬賽克整合和知識(shí)遷移,我將從以下四個(gè)方面進(jìn)行具體講解……”
半小時(shí)后——
蘇雨眠:“……以上就是我畢業(yè)論文的全部?jī)?nèi)容,感謝傾聽?!?
說完,后退半步,鞠躬。
現(xiàn)場(chǎng)如夢(mèng)初醒,接著,雷鳴般的掌聲響起。
“天哪!女神也太牛了吧,她講的那些,我完全聽不懂。”
“已經(jīng)很照顧我們了,全程都用中文。她這篇論文原稿是英文的?!?
“聽不懂才正常,如果我們都聽懂了,那還能上nature-biotechnology嗎?”
“雖然聽得不是很明白,但我還是想說,女神的邏輯流暢度和語(yǔ)表達(dá)能力太強(qiáng)了!”
“接下來是不是提問環(huán)節(jié)?我已經(jīng)嗅到評(píng)委席上飄來的硝煙味……”
第一個(gè)開口的是來自生命科學(xué)院的周士博周老,他曾主動(dòng)向院方領(lǐng)導(dǎo)提出想帶蘇雨眠幾人,結(jié)果沒成。
雖有遺憾,不過他尊重幾個(gè)孩子的選擇。
甚至隱隱有種刮目相看的意味。
“不忘師恩”誰(shuí)都會(huì)說,但真正落實(shí)到行動(dòng)的,又有幾個(gè)?
歐陽(yáng)沒看錯(cuò)人,也沒等錯(cuò)人。
蘇雨眠值得!
周士博:“既然大家都這么謙虛,那就由我來起這個(gè)頭,權(quán)當(dāng)拋磚引玉。蘇同學(xué),你剛才著重講了midas這種新算法的基礎(chǔ)邏輯,以及具體運(yùn)行思路和前端操作方式,卻沒提這種新算法出現(xiàn)的意義和可能帶來的積極影響,可以大致說一說嗎?”
蘇雨眠:“眾所周知,單細(xì)胞測(cè)序技術(shù)是近年來生命科學(xué)領(lǐng)域的突破性技術(shù),能夠檢測(cè)單個(gè)細(xì)胞內(nèi)的多種遺傳物質(zhì)與功能分子,比如rna表達(dá)、蛋白質(zhì)豐度和染色質(zhì)可及性等等,從而揭示細(xì)胞在不同分子層面的異質(zhì)性以及組學(xué)之間的關(guān)聯(lián),有助于更加深入地理解細(xì)胞功能,探索生命發(fā)育和疾病發(fā)生等機(jī)制。然而——”
她話鋒一轉(zhuǎn),“隨著測(cè)序技術(shù)的發(fā)展和測(cè)序數(shù)據(jù)的增長(zhǎng),不同組學(xué)組合、不同測(cè)序技術(shù)、不同測(cè)序樣本的‘馬賽克’式單細(xì)胞數(shù)據(jù)整合成為巨大的挑戰(zhàn)。”
周士博點(diǎn)頭:“確實(shí)如此?!?
蘇雨眠:“您問midas出現(xiàn)的意義,我認(rèn)為這應(yīng)該是人類研究首次實(shí)現(xiàn)通用單細(xì)胞多組學(xué)馬賽克數(shù)據(jù)的模態(tài)對(duì)齊、數(shù)據(jù)補(bǔ)全、批次校正等整合功能,為構(gòu)建大規(guī)模多組學(xué)細(xì)胞圖譜、實(shí)現(xiàn)大規(guī)模單細(xì)胞多組學(xué)分析與知識(shí)遷移提供了重要的原創(chuàng)技術(shù)……”
接著,是化學(xué)與分子工程學(xué)院的民受文,民教授——
“這種新算法對(duì)比從前的方法,有什么突出優(yōu)勢(shì)嗎?”
這個(gè)問題很大,很泛泛,屬于“萬(wàn)精油式”提問,套用到其他論文上也沒毛病。
但蘇雨眠還是想了想,認(rèn)真答道:
“midas假設(shè)每個(gè)細(xì)胞的多模態(tài)觀測(cè)值是通過深度神經(jīng)網(wǎng)絡(luò)從兩個(gè)與模態(tài)無關(guān)且解耦的隱變量生成……其輸入由不同單細(xì)胞樣本(批次)的表達(dá)矩陣和批次編號(hào)向量組成……因此可能存在不同的技術(shù)噪聲、模態(tài)組合和觀測(cè)特征……midas的輸出包括生物狀態(tài)和技術(shù)噪聲兩種低維表示的矩陣,以及對(duì)缺失模態(tài)和特征進(jìn)行了補(bǔ)全并消除了批次效應(yīng)的表達(dá)矩陣?!?