大模型熱潮引爆后,短短幾個(gè)月,國(guó)內(nèi)就已有數(shù)十家公司先后宣布進(jìn)入大模型領(lǐng)域,然而到了產(chǎn)業(yè)落地階段,所有人都是“摸著石頭過(guò)河”,缺乏既有的行業(yè)經(jīng)驗(yàn)、標(biāo)準(zhǔn)和指引,業(yè)界關(guān)于大模型的疑惑也越來(lái)越多。
比如,此前有不少報(bào)道稱(chēng),大模型是“豪華游戲”,訓(xùn)練一次千億大模型動(dòng)輒要幾千萬(wàn)美元,可是市面上為什么還會(huì)出現(xiàn)許多大模型?市場(chǎng)真的需要那么多大模型?企業(yè)選擇基礎(chǔ)大模型需要注意哪些問(wèn)題?
【資料圖】
就相關(guān)問(wèn)題,百度集團(tuán)副總裁侯震宇和百度智能云副總裁朱勇近日接受媒體采訪,進(jìn)行了解答和探討。
大模型門(mén)檻高不高,要看是哪一類(lèi)玩家
朱勇告訴記者,大模型的“門(mén)檻”是一個(gè)相對(duì)概念,因?yàn)檎麄€(gè)大模型領(lǐng)域有三大類(lèi)“玩家”。
第一類(lèi)負(fù)責(zé)從零開(kāi)始建造“基礎(chǔ)大模型”,這一類(lèi)肯定屬于“豪華游戲”,無(wú)論是對(duì)數(shù)據(jù)、算力還是人才的要求都非常高。
比如在算力方面,需要大量投入大量高性能GPU芯片。在數(shù)據(jù)方面,需要“相當(dāng)于幾百萬(wàn)個(gè)人一生的閱讀量”的數(shù)據(jù)量以及高質(zhì)量的標(biāo)注數(shù)據(jù)。除此之外還需要大量精通算法、有豐富AI實(shí)踐經(jīng)驗(yàn)的人才。“就好比是廚師做菜,不同的廚師用同樣的原材料做出來(lái)的菜,口味都不一樣”朱勇說(shuō)。
百度智能云事業(yè)群副總裁 朱勇
第二類(lèi)“玩家”負(fù)責(zé)做“行業(yè)大模型”,門(mén)檻相比第一類(lèi)大大降低,行業(yè)大模型主要是在“基礎(chǔ)大模型”的基礎(chǔ)之上,通過(guò)注入特定行業(yè)、領(lǐng)域或企業(yè)數(shù)據(jù),進(jìn)行針對(duì)性的定制化,讓它能更好的服務(wù)好特定行業(yè)場(chǎng)景。
第三類(lèi)“玩家”負(fù)責(zé)在這兩類(lèi)大模型之上開(kāi)發(fā)應(yīng)用,服務(wù)最終用戶(hù),門(mén)檻較低,也是機(jī)會(huì)最多的。
簡(jiǎn)而言之,建基礎(chǔ)大模型門(mén)檻最高,建行業(yè)大模型次之,用大模型門(mén)檻不高。
大模型沒(méi)有絕對(duì)好壞,適合的才是最好的
侯震宇認(rèn)為,大模型不能在單一維度上評(píng)價(jià)好壞,正如我們很難說(shuō)某一款暢銷(xiāo)的手機(jī)就一定適合某些人在某些場(chǎng)景下。他說(shuō):“盡管在大模型剛剛推出時(shí),很多人經(jīng)常像考它一樣去問(wèn)一些非常有意思的問(wèn)題。但事實(shí)上,在真正嚴(yán)肅的企業(yè)級(jí)環(huán)境里面,不太會(huì)有這樣的場(chǎng)景,企業(yè)應(yīng)該針對(duì)企業(yè)自己的場(chǎng)景去選擇自己更適合的大模型。”
具體到實(shí)操層面,侯震宇建議企業(yè)重點(diǎn)關(guān)注三個(gè)方面:模型效果、大模型開(kāi)發(fā)平臺(tái)提供的工具鏈,以及迭代速度。
在模型效果上,企業(yè)應(yīng)該去測(cè)試、評(píng)估大模型在實(shí)際場(chǎng)景中能發(fā)揮出的能力和價(jià)值;
在開(kāi)發(fā)平臺(tái)方面,企業(yè)要看提供模型服務(wù)的平臺(tái)是否有完整的開(kāi)發(fā)工具鏈,這將決定企業(yè)是否能很方便地去基于模型去開(kāi)發(fā)上層應(yīng)用,把大模型的能力“植入”到企業(yè)場(chǎng)景中來(lái)。
在迭代速度方面,只有選擇一個(gè)在持續(xù)快速進(jìn)步的大模型,才能更好地支撐企業(yè)應(yīng)用和解決方案的快速迭代,滿(mǎn)足當(dāng)下及未來(lái)的需求。
百度集團(tuán)副總裁 侯震宇
談到國(guó)內(nèi)大模型在國(guó)際上的技術(shù)水平時(shí),侯震宇認(rèn)為中國(guó)的大模型技術(shù)放在整個(gè)全球來(lái)看,還是比較領(lǐng)先的。他說(shuō):“中國(guó)的大模型一定能發(fā)展起來(lái)也一定會(huì)發(fā)展起來(lái)。”
B端市場(chǎng)不需要那么多基礎(chǔ)大模型,找準(zhǔn)角色很重要
當(dāng)記者問(wèn)到“大模型領(lǐng)域是否出現(xiàn)泡沫,B端市場(chǎng)真的需要那么多大模型嗎?”侯震宇說(shuō),如果從終局來(lái)看,市場(chǎng)上的確不需要那么多的基礎(chǔ)大模型,純粹做基礎(chǔ)大模型最后只有少數(shù)玩家能留下來(lái),但目前大模型領(lǐng)域還屬于起步階段,任何一個(gè)新的技術(shù)階段都難免有一定泡沫,應(yīng)該予以理解,因?yàn)槭袌?chǎng)需求是真實(shí)的。
他表示,大公司會(huì)比創(chuàng)業(yè)公司更適合做基礎(chǔ)大模型,因?yàn)榛A(chǔ)大模型不僅需要足夠多的算力、足夠多和質(zhì)量好的數(shù)據(jù),以及大量算法和AI人才的長(zhǎng)時(shí)間積累,還需要一個(gè)易用的平臺(tái)來(lái)管理、調(diào)度好各種資源,大公司會(huì)有更好的環(huán)境和資源去訓(xùn)練大模型,并且支持后續(xù)的模型快速迭代。
朱勇補(bǔ)充,盡管市場(chǎng)未必需要那么多基礎(chǔ)大模型,但是一定會(huì)有很多行業(yè)大模型和定制化需求,這些都可以在基礎(chǔ)大模型之上,用企業(yè)自己的數(shù)據(jù)去做針對(duì)性的定制化開(kāi)發(fā),這樣可以兼顧成本和企業(yè)需求。相比如何去建一個(gè)大模型,企業(yè)應(yīng)該更多地去思考如何用上大模型,用好大模型。
“現(xiàn)在每一家公司都應(yīng)該去考慮如何用大模型,就像當(dāng)年智能手機(jī)出來(lái)以后,我們每一家公司都應(yīng)該去擁抱移動(dòng)時(shí)代帶來(lái)的變化。但是行業(yè)里的每一家企業(yè)是否都需要自己去做一個(gè)大模型?我覺(jué)得不一定。”侯震宇說(shuō),大模型本身的特點(diǎn)就已經(jīng)決定了,企業(yè)拿自己數(shù)據(jù)在一個(gè)基礎(chǔ)大模型上做微調(diào),一樣可以獲得非常好的AI效果。
他建議,大模型從業(yè)者應(yīng)該量力而行,根據(jù)自己能力、場(chǎng)景在大模型的產(chǎn)業(yè)鏈中,找準(zhǔn)最合適自己的角色,找到自己最短的落地路徑。