- +1
大學2025|對話陳潤生院士:科學發(fā)展是不斷交叉融合的過程
【編者按】
在人工智能與人形機器人的一騎絕塵中,中國大學迎來2025。
2025年,注定要成為變革的年份。是以戰(zhàn)略敏捷贏得戰(zhàn)略主動,還是在延誤中錯失轉型機遇,中國大學踏上征途。
人工智能技術如何賦能學科建設?人工智能技術給創(chuàng)新人才培養(yǎng)帶來哪些啟示?澎湃新聞特推出“大學2025”專題,以深入探討人工智能時代的大學之變。
日前,中國科學院院士、中國科學院生物物理研究所研究員陳潤生在接受澎湃新聞記者采訪時表示,人工智能是為人類社會發(fā)展服務的,科學智能需要成為善意的智能。科學需要傳承,傳承需要教育,所以科學本身的發(fā)展有賴于科學教育。如果一個科學家能夠肩負起教育家的責任,當然是很好的,但畢竟科學家和教育家是不同的,科學家應當在教育這個領域探索和努力,才能夠肩負起教育家的責任。
“早在1988年,我就用復雜神經網絡,也就是現在所謂的人工智能做研究工作。雖然那個時候我們不叫人工智能,但是也早已經把這個方法用來解析基因組?!敝袊茖W院院士、中國科學院生物物理研究所研究員陳潤生是中國最早從事理論生物學、生物信息學和非編碼RNA研究的科研人員之一。
生物信息學是以生物學、數學和信息科學為基礎的交叉科學,通過綜合運用數學和信息科學等多領域的方法和工具對生物信息進行獲取、加工、存儲、分析和解釋,來闡明大量生物數據所包含的生物學意義,研究重點主要是基因組學和蛋白質組學,直逼人類基因深處的秘密。
三十多年來,陳潤生在生物信息學領域進行了系統(tǒng)的研究,曾參加中國第一個完整基因組泉生熱袍菌B4基因組序列的組裝和基因標識,以及人類基因組1%和水稻基因組工作草圖的研究。他構建了收錄非編碼RNA及其基因的數據庫NONCODE,以及收錄非編碼RNA與其它生物大分子相互作用的數據庫NPInter,這兩個數據庫已成為國際在非編碼RNA領域非常有影響力的數據庫。
此外,陳潤生也是中國內地第一個開設生物信息學課程的人。1988年,該課程首次在中國科學技術大學研究生院(中國科學院大學前身)開設,當時這門課程在國內外都處于摸索階段,課程內使用的所有算法、程序、理論都是陳潤生自己推導的。目前生物信息學是中國科學院大學(以下簡稱“國科大”)生命科學學院的學科核心課,同時也廣泛吸引了來自醫(yī)學、化學、材料、環(huán)境、計算機等學科專業(yè)的學生選修。如今,80多歲的陳潤生仍然在國科大的講臺上為同學們講課。
近日,陳潤生院士在接受澎湃新聞采訪時強調,科學發(fā)展永遠是交叉融合的。新的學科不斷出現,這是一個科學發(fā)展的必然。因此,陳潤生鼓勵年輕人不斷探索未來,不斷去關注學科交叉融合,“年輕人要多去做一些別人沒有做過或別人沒有想過的事情,這樣社會才能更加活躍?!?/p>
中國科學院院士、中國科學院生物物理研究所研究員陳潤生。 國科大供圖
以下是陳潤生院士與澎湃新聞的對話:
澎湃新聞:您是內地第一位教授生物信息學課程的教師,教材也是您自己原創(chuàng)的。當時您是如何設計的課程體系?在這種“無先例可循”的學科建設上,有哪些經驗分享?
陳潤生:第一次把生物信息學作為一門課程是在1988年。之所以開設這門課,跟我在國外和在國內的經歷有關。在國內,我參加了唐敖慶先生的量子生物學講習班;在國外,我做的是生物大分子的電子結構和空間結構的理論研究。所以,我先把這兩部分內容融合起來,作為理論生物學的一門課程,講給第一批學生聽,那個時候的學生大約有30個人。
兩年之后,人類基因組的概念在科技界被大家逐漸關注,那時我也在為自己未來的科研選擇方向和重點。當時我認為破譯人類遺傳密碼一定是未來重要的科學事件,所以我把講課內容逐漸從理論生物學過渡到生物信息學。后來就在生物信息學這個軌道上,不斷地更改、更新自己的教學內容。
生物信息學第一個階段是遺傳密碼的破譯,也叫測序基因組時代的生物信息學。后來,我們有了生物芯片和功能基因組,第二部分的內容就升華到功能基因組階段,再后來,有了系統(tǒng)生物學,就把生物信息學增加了系統(tǒng)生物學內容。整個課程的演化完全緊跟國際上該領域的發(fā)展,不斷地更新。我想這也是學生們樂意學這門課的原因,能夠使得他們緊跟這個時代發(fā)展,使得他們站在國際這個領域發(fā)展的前沿。
澎湃新聞:您研究的生物信息學包含著對基因組信息的獲取、處理、加工、分布、分析和解釋,通過挖掘生物大數據來分析深刻的生物學內涵。如今生物信息學與AI大模型發(fā)展迅速,您認為它們將如何改變生命科學研究范式?
陳潤生:我在1992年參加人類基因組計劃時是負責理論分析的,在理論分析過程中會用到各種各樣的工具,早在1988年我就用復雜神經網絡,也就是現在所謂的人工智能做研究工作。
在參加人類基因組計劃之前,我們公開發(fā)表的論文有一些就是用復雜神經網絡或者機器學習的辦法研究這個大分子的特征,所以在1992年我參加人類基因組以后,自然地就把這個方法用到了生物信息學研究當中。
雖然那個時候我們不叫人工智能,但是也早已經把人工智能這個方法用來解析基因組。例如發(fā)現基因組當中哪些地方是基因,也用到了人工智能的方法?,F在有了大模型,使得對基因和整個生物信息學的研究,有了一個更加全面的工具。因為大模型提供了大語言模型,把人類的所有知識都集成起來了,也使得整個生物信息學作為一門學科上了一個臺階,有了更好的技術基礎。
澎湃新聞:早期生物信息學研究面臨“數據少、算力弱”的困境,如今算力與數據已不再是主要矛盾,您認為當前生物信息領域發(fā)展面臨的挑戰(zhàn)是什么?
陳潤生:在信息領域,我認為人工智能的發(fā)展帶來了前所未有的重大挑戰(zhàn)。人工智能本身是希望用數字技術來完成或是實現人腦的智能。這是人類從來沒有的新的事物,這個新的事物會從根本上改變所有工作、研究、生活的范式,這在人類的歷史上是重大事件。
而挑戰(zhàn)的核心科學哲學問題就是,數字智能能否超過人類智能或者腦的智能,這兩個智能體將如何協同?
“AI教父”辛頓在他的報告里講了一個非常形象的例子,等于我們培養(yǎng)了一只老虎崽,它長成老虎的趨勢是不可改變的。那長成老虎就可能吃你怎么辦?這就是培養(yǎng)了一個人工智能面臨的問題。這只老虎可能你用好了對人很有用,它是一種新的生產力,它有自己的訴求,有自己的智能,但是它也可能起壞的作用。所以辛頓認為,人工智能將來要并行發(fā)展為兩類,一類是為人類社會發(fā)展服務,另外一類要培養(yǎng)未來的數字智能,讓它形成一個善意的智能,而不要成為破壞人類的智能。
澎湃新聞:您曾指出,對比發(fā)達國家,我國在基礎研究階段已有趕超趨勢,但臨床轉化的道路“道阻且長”。不斷涌現的基礎科研成果,并沒有在成果端得到效率體現。您認為應如何提升臨床轉化能力?
陳潤生:我們知道整個生物醫(yī)學的研究,實際上終極的目的是改善人類生活,提高人類健康的素質。醫(yī)院是為人類健康服務的,因此它也是獲得各種各樣健康信息的第一場所。所以我們知道,人工智能在健康領域的發(fā)展其實跟醫(yī)院是有緊密的相互作用的。
我們知道一個人工智能是三個要素組成的,一個要素就是算力,這個是由芯片發(fā)展。第二個就是模型,就是怎么來建造一個物理的系統(tǒng),能夠來變成一個信息加工的場所。第三個就是所謂數據,醫(yī)學的數據很多是來自臨床,所以臨床數據的收集整理是發(fā)展專業(yè)大模型不可或缺的關鍵部分。所以如何把數據收集起來,如何把這些數據標準化,讓這些數據能夠不僅僅是一個醫(yī)院,而是把各個醫(yī)院的數據都整合起來。這是未來做好生物醫(yī)藥大模型的關鍵性步驟。
澎湃新聞:您認為目前關于人工智能和生命科學的這個交叉領域,還有哪些地方是空白的?您覺得哪些領域值得科研人員繼續(xù)探索?
陳潤生:人工智能可以說是一個平臺,是個范式,每一個領域都應當為自己這個領域建一個專屬于它的模型。有很多的垂直模型還沒有建設,所以總體來講還有很多的發(fā)展空間。
我認為人工智能本身也還在發(fā)展,很多人工智能的專家認為人工智能目前只有5歲到10歲的年紀,很多的人工智能的理論還在不斷發(fā)展。有一些著名的科學家質疑現在用的大模型的這套理論體系是能夠長久地保存嗎?有人講只有幾年時間,過了幾年它就被推翻了,會有新的智能模型出現,從各個垂直模型到總體的人工智能系統(tǒng)理論的發(fā)展,有太多值得斟酌和考慮的空間。
此外,科學發(fā)展永遠是交叉融合的。新的學科不斷出現,這是一個歷史科學發(fā)展的必然。因此我鼓勵年輕人不斷探索未來,不斷去關注學科交叉融合。
我希望年輕人做一些別人沒有做過或別人沒有想過的事情。年輕人應當更勇于為社會做出自己的一份貢獻,去探索一些有利于社會的,但是別人沒有做過沒有想過的事,這樣社會才能更加活躍,更加積極。
而科學本身是要傳承的,傳承是需要教育的,所以科學本身的發(fā)展有賴于科學教育。如果一個科學家能夠肩負起這個教育家的責任,當然是很好的,但畢竟科學家和教育家是不同的,科學家要成為教育家的話,應當在教育這個領域探索和努力,才能夠肩負起教育家的責任。科學家要變成教育家,這是科學發(fā)展的需求。科學能夠傳承,能夠使得我們不斷地培養(yǎng)年輕人,這是一個系統(tǒng)的延續(xù)性的工作。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業(yè)務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司