- +1
大學(xué)2025|對話陳潤生院士:科學(xué)發(fā)展是不斷交叉融合的過程
【編者按】
在人工智能與人形機器人的一騎絕塵中,中國大學(xué)迎來2025。
2025年,注定要成為變革的年份。是以戰(zhàn)略敏捷贏得戰(zhàn)略主動,還是在延誤中錯失轉(zhuǎn)型機遇,中國大學(xué)踏上征途。
人工智能技術(shù)如何賦能學(xué)科建設(shè)?人工智能技術(shù)給創(chuàng)新人才培養(yǎng)帶來哪些啟示?澎湃新聞特推出“大學(xué)2025”專題,以深入探討人工智能時代的大學(xué)之變。
日前,中國科學(xué)院院士、中國科學(xué)院生物物理研究所研究員陳潤生在接受澎湃新聞記者采訪時表示,人工智能是為人類社會發(fā)展服務(wù)的,科學(xué)智能需要成為善意的智能。科學(xué)需要傳承,傳承需要教育,所以科學(xué)本身的發(fā)展有賴于科學(xué)教育。如果一個科學(xué)家能夠肩負(fù)起教育家的責(zé)任,當(dāng)然是很好的,但畢竟科學(xué)家和教育家是不同的,科學(xué)家應(yīng)當(dāng)在教育這個領(lǐng)域探索和努力,才能夠肩負(fù)起教育家的責(zé)任。
“早在1988年,我就用復(fù)雜神經(jīng)網(wǎng)絡(luò),也就是現(xiàn)在所謂的人工智能做研究工作。雖然那個時候我們不叫人工智能,但是也早已經(jīng)把這個方法用來解析基因組?!敝袊茖W(xué)院院士、中國科學(xué)院生物物理研究所研究員陳潤生是中國最早從事理論生物學(xué)、生物信息學(xué)和非編碼RNA研究的科研人員之一。
生物信息學(xué)是以生物學(xué)、數(shù)學(xué)和信息科學(xué)為基礎(chǔ)的交叉科學(xué),通過綜合運用數(shù)學(xué)和信息科學(xué)等多領(lǐng)域的方法和工具對生物信息進(jìn)行獲取、加工、存儲、分析和解釋,來闡明大量生物數(shù)據(jù)所包含的生物學(xué)意義,研究重點主要是基因組學(xué)和蛋白質(zhì)組學(xué),直逼人類基因深處的秘密。
三十多年來,陳潤生在生物信息學(xué)領(lǐng)域進(jìn)行了系統(tǒng)的研究,曾參加中國第一個完整基因組泉生熱袍菌B4基因組序列的組裝和基因標(biāo)識,以及人類基因組1%和水稻基因組工作草圖的研究。他構(gòu)建了收錄非編碼RNA及其基因的數(shù)據(jù)庫NONCODE,以及收錄非編碼RNA與其它生物大分子相互作用的數(shù)據(jù)庫NPInter,這兩個數(shù)據(jù)庫已成為國際在非編碼RNA領(lǐng)域非常有影響力的數(shù)據(jù)庫。
此外,陳潤生也是中國內(nèi)地第一個開設(shè)生物信息學(xué)課程的人。1988年,該課程首次在中國科學(xué)技術(shù)大學(xué)研究生院(中國科學(xué)院大學(xué)前身)開設(shè),當(dāng)時這門課程在國內(nèi)外都處于摸索階段,課程內(nèi)使用的所有算法、程序、理論都是陳潤生自己推導(dǎo)的。目前生物信息學(xué)是中國科學(xué)院大學(xué)(以下簡稱“國科大”)生命科學(xué)學(xué)院的學(xué)科核心課,同時也廣泛吸引了來自醫(yī)學(xué)、化學(xué)、材料、環(huán)境、計算機等學(xué)科專業(yè)的學(xué)生選修。如今,80多歲的陳潤生仍然在國科大的講臺上為同學(xué)們講課。
近日,陳潤生院士在接受澎湃新聞采訪時強調(diào),科學(xué)發(fā)展永遠(yuǎn)是交叉融合的。新的學(xué)科不斷出現(xiàn),這是一個科學(xué)發(fā)展的必然。因此,陳潤生鼓勵年輕人不斷探索未來,不斷去關(guān)注學(xué)科交叉融合,“年輕人要多去做一些別人沒有做過或別人沒有想過的事情,這樣社會才能更加活躍?!?/p>
中國科學(xué)院院士、中國科學(xué)院生物物理研究所研究員陳潤生。 國科大供圖
以下是陳潤生院士與澎湃新聞的對話:
澎湃新聞:您是內(nèi)地第一位教授生物信息學(xué)課程的教師,教材也是您自己原創(chuàng)的。當(dāng)時您是如何設(shè)計的課程體系?在這種“無先例可循”的學(xué)科建設(shè)上,有哪些經(jīng)驗分享?
陳潤生:第一次把生物信息學(xué)作為一門課程是在1988年。之所以開設(shè)這門課,跟我在國外和在國內(nèi)的經(jīng)歷有關(guān)。在國內(nèi),我參加了唐敖慶先生的量子生物學(xué)講習(xí)班;在國外,我做的是生物大分子的電子結(jié)構(gòu)和空間結(jié)構(gòu)的理論研究。所以,我先把這兩部分內(nèi)容融合起來,作為理論生物學(xué)的一門課程,講給第一批學(xué)生聽,那個時候的學(xué)生大約有30個人。
兩年之后,人類基因組的概念在科技界被大家逐漸關(guān)注,那時我也在為自己未來的科研選擇方向和重點。當(dāng)時我認(rèn)為破譯人類遺傳密碼一定是未來重要的科學(xué)事件,所以我把講課內(nèi)容逐漸從理論生物學(xué)過渡到生物信息學(xué)。后來就在生物信息學(xué)這個軌道上,不斷地更改、更新自己的教學(xué)內(nèi)容。
生物信息學(xué)第一個階段是遺傳密碼的破譯,也叫測序基因組時代的生物信息學(xué)。后來,我們有了生物芯片和功能基因組,第二部分的內(nèi)容就升華到功能基因組階段,再后來,有了系統(tǒng)生物學(xué),就把生物信息學(xué)增加了系統(tǒng)生物學(xué)內(nèi)容。整個課程的演化完全緊跟國際上該領(lǐng)域的發(fā)展,不斷地更新。我想這也是學(xué)生們樂意學(xué)這門課的原因,能夠使得他們緊跟這個時代發(fā)展,使得他們站在國際這個領(lǐng)域發(fā)展的前沿。
澎湃新聞:您研究的生物信息學(xué)包含著對基因組信息的獲取、處理、加工、分布、分析和解釋,通過挖掘生物大數(shù)據(jù)來分析深刻的生物學(xué)內(nèi)涵。如今生物信息學(xué)與AI大模型發(fā)展迅速,您認(rèn)為它們將如何改變生命科學(xué)研究范式?
陳潤生:我在1992年參加人類基因組計劃時是負(fù)責(zé)理論分析的,在理論分析過程中會用到各種各樣的工具,早在1988年我就用復(fù)雜神經(jīng)網(wǎng)絡(luò),也就是現(xiàn)在所謂的人工智能做研究工作。
在參加人類基因組計劃之前,我們公開發(fā)表的論文有一些就是用復(fù)雜神經(jīng)網(wǎng)絡(luò)或者機器學(xué)習(xí)的辦法研究這個大分子的特征,所以在1992年我參加人類基因組以后,自然地就把這個方法用到了生物信息學(xué)研究當(dāng)中。
雖然那個時候我們不叫人工智能,但是也早已經(jīng)把人工智能這個方法用來解析基因組。例如發(fā)現(xiàn)基因組當(dāng)中哪些地方是基因,也用到了人工智能的方法?,F(xiàn)在有了大模型,使得對基因和整個生物信息學(xué)的研究,有了一個更加全面的工具。因為大模型提供了大語言模型,把人類的所有知識都集成起來了,也使得整個生物信息學(xué)作為一門學(xué)科上了一個臺階,有了更好的技術(shù)基礎(chǔ)。
澎湃新聞:早期生物信息學(xué)研究面臨“數(shù)據(jù)少、算力弱”的困境,如今算力與數(shù)據(jù)已不再是主要矛盾,您認(rèn)為當(dāng)前生物信息領(lǐng)域發(fā)展面臨的挑戰(zhàn)是什么?
陳潤生:在信息領(lǐng)域,我認(rèn)為人工智能的發(fā)展帶來了前所未有的重大挑戰(zhàn)。人工智能本身是希望用數(shù)字技術(shù)來完成或是實現(xiàn)人腦的智能。這是人類從來沒有的新的事物,這個新的事物會從根本上改變所有工作、研究、生活的范式,這在人類的歷史上是重大事件。
而挑戰(zhàn)的核心科學(xué)哲學(xué)問題就是,數(shù)字智能能否超過人類智能或者腦的智能,這兩個智能體將如何協(xié)同?
“AI教父”辛頓在他的報告里講了一個非常形象的例子,等于我們培養(yǎng)了一只老虎崽,它長成老虎的趨勢是不可改變的。那長成老虎就可能吃你怎么辦?這就是培養(yǎng)了一個人工智能面臨的問題。這只老虎可能你用好了對人很有用,它是一種新的生產(chǎn)力,它有自己的訴求,有自己的智能,但是它也可能起壞的作用。所以辛頓認(rèn)為,人工智能將來要并行發(fā)展為兩類,一類是為人類社會發(fā)展服務(wù),另外一類要培養(yǎng)未來的數(shù)字智能,讓它形成一個善意的智能,而不要成為破壞人類的智能。
澎湃新聞:您曾指出,對比發(fā)達(dá)國家,我國在基礎(chǔ)研究階段已有趕超趨勢,但臨床轉(zhuǎn)化的道路“道阻且長”。不斷涌現(xiàn)的基礎(chǔ)科研成果,并沒有在成果端得到效率體現(xiàn)。您認(rèn)為應(yīng)如何提升臨床轉(zhuǎn)化能力?
陳潤生:我們知道整個生物醫(yī)學(xué)的研究,實際上終極的目的是改善人類生活,提高人類健康的素質(zhì)。醫(yī)院是為人類健康服務(wù)的,因此它也是獲得各種各樣健康信息的第一場所。所以我們知道,人工智能在健康領(lǐng)域的發(fā)展其實跟醫(yī)院是有緊密的相互作用的。
我們知道一個人工智能是三個要素組成的,一個要素就是算力,這個是由芯片發(fā)展。第二個就是模型,就是怎么來建造一個物理的系統(tǒng),能夠來變成一個信息加工的場所。第三個就是所謂數(shù)據(jù),醫(yī)學(xué)的數(shù)據(jù)很多是來自臨床,所以臨床數(shù)據(jù)的收集整理是發(fā)展專業(yè)大模型不可或缺的關(guān)鍵部分。所以如何把數(shù)據(jù)收集起來,如何把這些數(shù)據(jù)標(biāo)準(zhǔn)化,讓這些數(shù)據(jù)能夠不僅僅是一個醫(yī)院,而是把各個醫(yī)院的數(shù)據(jù)都整合起來。這是未來做好生物醫(yī)藥大模型的關(guān)鍵性步驟。
澎湃新聞:您認(rèn)為目前關(guān)于人工智能和生命科學(xué)的這個交叉領(lǐng)域,還有哪些地方是空白的?您覺得哪些領(lǐng)域值得科研人員繼續(xù)探索?
陳潤生:人工智能可以說是一個平臺,是個范式,每一個領(lǐng)域都應(yīng)當(dāng)為自己這個領(lǐng)域建一個專屬于它的模型。有很多的垂直模型還沒有建設(shè),所以總體來講還有很多的發(fā)展空間。
我認(rèn)為人工智能本身也還在發(fā)展,很多人工智能的專家認(rèn)為人工智能目前只有5歲到10歲的年紀(jì),很多的人工智能的理論還在不斷發(fā)展。有一些著名的科學(xué)家質(zhì)疑現(xiàn)在用的大模型的這套理論體系是能夠長久地保存嗎?有人講只有幾年時間,過了幾年它就被推翻了,會有新的智能模型出現(xiàn),從各個垂直模型到總體的人工智能系統(tǒng)理論的發(fā)展,有太多值得斟酌和考慮的空間。
此外,科學(xué)發(fā)展永遠(yuǎn)是交叉融合的。新的學(xué)科不斷出現(xiàn),這是一個歷史科學(xué)發(fā)展的必然。因此我鼓勵年輕人不斷探索未來,不斷去關(guān)注學(xué)科交叉融合。
我希望年輕人做一些別人沒有做過或別人沒有想過的事情。年輕人應(yīng)當(dāng)更勇于為社會做出自己的一份貢獻(xiàn),去探索一些有利于社會的,但是別人沒有做過沒有想過的事,這樣社會才能更加活躍,更加積極。
而科學(xué)本身是要傳承的,傳承是需要教育的,所以科學(xué)本身的發(fā)展有賴于科學(xué)教育。如果一個科學(xué)家能夠肩負(fù)起這個教育家的責(zé)任,當(dāng)然是很好的,但畢竟科學(xué)家和教育家是不同的,科學(xué)家要成為教育家的話,應(yīng)當(dāng)在教育這個領(lǐng)域探索和努力,才能夠肩負(fù)起教育家的責(zé)任??茖W(xué)家要變成教育家,這是科學(xué)發(fā)展的需求??茖W(xué)能夠傳承,能夠使得我們不斷地培養(yǎng)年輕人,這是一個系統(tǒng)的延續(xù)性的工作。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司