日前,2023年世界人工智能大會(WAIC)主論壇科學(xué)前沿全體會議在上海舉辦。多位全球人工智能及相關(guān)交叉領(lǐng)域頂級科學(xué)家、高校教授及業(yè)內(nèi)外人士齊聚一堂,共同探討全球化視野下的“通用人工智能與科學(xué)未來”。
(潘潔 攝)
(資料圖片)
上海市副市長劉多在致辭中指出,面向未來,上海將搶抓通用人工智能發(fā)展機(jī)遇,發(fā)揮城市功能、技術(shù)積累、產(chǎn)業(yè)集聚、應(yīng)用場景、人力資源等綜合優(yōu)勢,進(jìn)一步加強(qiáng)人工智能基礎(chǔ)理論和關(guān)鍵技術(shù)研究,著力提升自主創(chuàng)新能力,打造具有全球影響力的創(chuàng)新高地和世界級產(chǎn)業(yè)集群。
科技部戰(zhàn)略規(guī)劃司司長梁穎達(dá)表示,展望未來,我們將聚焦人工智能發(fā)展和治理等重大議題,與國際業(yè)界同仁共推發(fā)展、共護(hù)安全、共享成果。
開啟通用大模型新時代
會議期間,上海AI實驗室與商湯科技聯(lián)合香港中文大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)及清華大學(xué)發(fā)布全新升級的“書生通用大模型體系”(簡稱“書生大模型”),包括“書生·多模態(tài)”“書生·浦語”和“書生·天際”等三大基礎(chǔ)模型,以及首個面向大模型研發(fā)與應(yīng)用的全鏈條開源體系。
目前,“書生大模型”在130多個評測中性能達(dá)世界領(lǐng)先或先進(jìn)水平。其中,“書生·多模態(tài)”無縫整合了語言、圖像、視頻等多種模態(tài),首次實現(xiàn)通過自然語言定義視覺任務(wù),并具有多模態(tài)交互和跨模態(tài)生成能力;升級后的“書生·浦語”為國內(nèi)首個正式發(fā)布的支持8K語境長度的千億參數(shù)級語言大模型;“書生·天際”則是全球首個城市級NeRF實景三維大模型,具備千億參數(shù),在全球首次實現(xiàn)對100平方公里城市實景進(jìn)行4K高精度建模及編輯。
在全面升級的同時,書生·浦語也正式開源了一個70億參數(shù)的輕量級版本InternLM-7B,以及貫穿數(shù)據(jù)、預(yù)訓(xùn)練、微調(diào)、部署和評測五大環(huán)節(jié)的全鏈條工具體系。
共商AI過去與未來
論壇現(xiàn)場,兩位AI頂級學(xué)者對人工智能研究的前沿課題進(jìn)行了回溯與展望。
圖靈獎得主、美國科學(xué)院院士、美國工程院院士、谷歌杰出工程師David A. Patterson(大衛(wèi)·帕特森),香港科技大學(xué)首席副校長、英國皇家工程院院士郭毅可分別帶來了主題演講。
David A. Patterson發(fā)表了題為《A decade of Machine Learning Accelerators: Lessons Learned and Carbon Footprint》的視頻演講。他提到,當(dāng)前訓(xùn)練某一模型需要產(chǎn)生大量碳排放,如果進(jìn)一步提升模型準(zhǔn)確度,排放數(shù)字可能會更大。而在未來,我們有辦法讓機(jī)器學(xué)習(xí)的能耗和碳排放降低。研究人員有望從模型、硬件、數(shù)據(jù)中心能效、數(shù)據(jù)中心位置四方面協(xié)同著手,大幅降低機(jī)器學(xué)習(xí)的能耗與碳排放。
在主題為《The Human Use of Human Bing: University Education in the AI Era(人有人的用處:人工智能時代的大學(xué)教育)》的演講中,郭毅可表示,生成式人工智能對教育的影響是根本性的,人工智能賦能的時代,教師及學(xué)習(xí)者都更需要創(chuàng)造力和批判思維能力。“我相信人有人的用處,我覺得聰明的我們應(yīng)該用我們創(chuàng)作的機(jī)器培養(yǎng)更聰明的人,而這些人又去創(chuàng)造更聰明的機(jī)器,更聰明的機(jī)器培養(yǎng)更聰明的人,這是一個健康的循環(huán)。”?
AI如何保障人類社會的可持續(xù)和良性發(fā)展
隨著模型規(guī)模的不斷擴(kuò)大和性能的不斷提升,大模型已成為推動人機(jī)交互革命的重要力量。由上海AI實驗室林達(dá)華教授主持,加拿大工程院外籍院士、IEEE/IAPR/CAAI Fellow、HiDream.ai創(chuàng)始人兼首席執(zhí)行官梅濤、清華大學(xué)教授唐杰、復(fù)旦大學(xué)教授邱錫鵬、普林斯頓大學(xué)教授王夢迪、南洋理工大學(xué)助理教授潘新鋼、微軟研究院高級研究員楊健偉以及上海AI實驗室青年科學(xué)家戴勃展開了以“大模型驅(qū)動的交互新范式”為主題的圓桌討論。
(潘潔 攝)
當(dāng)下,絕大部分大語言模型依舊是Transformer模型,這基本也成為標(biāo)準(zhǔn)結(jié)構(gòu)。“Transformer的成功有必然因素,首先它的模型容量非常適合GPU,因為它是GPU誕生之后形成的模型,所以考慮設(shè)計模型時基于現(xiàn)在的GPU架構(gòu),非常適合通過GPU把規(guī)模擴(kuò)大,這是其成功的主要原因,包括它的容量要足夠大。”邱錫鵬表示,這同樣帶來一個問題,包括算力消耗,它需要非常大的計算量,比如把模型規(guī)模進(jìn)一步擴(kuò)大時,可能就難以承受了。
“未來應(yīng)該會出現(xiàn)深的架構(gòu),而且成本會非常低,這種架構(gòu)長什么樣,還不確定,基本可以借鑒人的記憶機(jī)制,現(xiàn)在的Transformer沒有狀態(tài)的,所以引入記憶之類的是可以大幅地減少計算量。”大模型這波浪潮,很大程度上影響或改變了世界交互的方式。潘新鋼則表示,交互的方式也取決于硬件技術(shù),蘋果前不久發(fā)布新的VR設(shè)備,對于3D建模師來說將是新的創(chuàng)作方式,大模型也可以和新興硬件交互方式結(jié)合,讓設(shè)計師們更好地進(jìn)行創(chuàng)作。
“大模型擅長模仿人的推理和創(chuàng)作方式,但它從0-1的創(chuàng)新能力目前達(dá)不到人的水平。”潘新鋼同時表示,人可以從沒有文字創(chuàng)造出文字,可以從有文字再發(fā)展出三次工業(yè)革命,但目前來說,大模型在模仿人進(jìn)行機(jī)械或推理任務(wù)時,沒有從0-1的創(chuàng)作能力,“大模型可以替代人的機(jī)械式勞動,比如你有一個想法,把它變成電影草圖,大模型就可以幫你做,但如何想一個好的甚至數(shù)據(jù)中沒有出現(xiàn)過的想法,這反而體現(xiàn)了設(shè)計師的可貴或任何利用AI作為工具的人的更加重要的能力。”
人工智能如何賦能科學(xué)研究日益成為科學(xué)家們關(guān)心的話題。大會圍繞“AI for Earth”召集全球地球科學(xué)專家展開討論。對話由上海AI實驗室教授歐陽萬里主持,聚焦于AI技術(shù)在地球系統(tǒng)基礎(chǔ)研究的最新技術(shù)進(jìn)展和成果,以及AI大模型在地球科學(xué)基礎(chǔ)研究領(lǐng)域的挑戰(zhàn)和發(fā)展趨勢。美國工程院院士、中國科學(xué)技術(shù)大學(xué)講席教授張捷、國家氣象中心副主任代刊、歐洲中期天氣預(yù)報中心副總干事兼預(yù)報部主任Florian Pappenberger、慕尼黑工業(yè)大學(xué)教授Niklas Boers、北京大學(xué)長聘副教授林金泰及上海AI實驗室青年科學(xué)家白磊共同開展了主題為“AI for Earth: Building a Sustainable Future”的圓桌對話。