中國大模型到底什么水平？世界觀焦點

2023-07-04 19:21:42來源：ZAKER科技

文 | 白馬商評

" 都快成紅海了。" 當(dāng)我和一個創(chuàng)業(yè)者聊起大模型的時候，他直接甩了這句話給我。

(資料圖)

去年 11 月，OpenAI 發(fā)布基于 GPT-3.5 的 ChatGPT，瞬間引爆大模型的熱潮。半年多的時間，中國出現(xiàn)了 " 百模大戰(zhàn) " 的局面，BAT 等頭部互聯(lián)網(wǎng)公司和人工智能公司基本都對外宣布了自己的大模型。

5 月初，360 掌門人周鴻祎對外稱，" 如果不經(jīng)過兩年的模仿和抄襲，上來就說自己能超越，那才叫吹牛呢。" 僅僅一個月后，周鴻祎就表示，" 我原來說國內(nèi)大模型跟國外差距兩年，我收回這句話，今天已經(jīng)接近國際水平。"

有人感慨，半年就追上 ChatGPT 了，大模型似乎也不難。那么，大模型的核心壁壘是什么？中國大模型到底什么水平？大模型在應(yīng)用層面最先突圍的方向是什么？

沈為（化名）是某知名 985 高校教授，多年從事機器學(xué)習(xí)研究，還曾擔(dān)任過某頭部券商首席分析師，我們和他聊了聊，試圖揭開大模型的迷霧。

GPT 路徑跑通了，所以有了 " 百模大戰(zhàn) "

白馬商評：能不能用最通俗簡單的語言解釋一下大模型，大模型是什么？和以往的 AI 模型有什么區(qū)別？

沈為：所謂大模型就是指模型的參數(shù)量大，但學(xué)術(shù)界并沒有一個清晰明確的定義界定到底多大參數(shù)叫 " 大 "，還在快速研究發(fā)展階段，一般來講大模型的參數(shù)量達(dá)到 1 億以上。

其實深度學(xué)習(xí)的發(fā)展大致經(jīng)歷了三個階段。第一個階段是 2012-2017 年，以圖像分割 yolo、圖像分類 ResNet 這種特定領(lǐng)域的小模型為代表，參數(shù)量占內(nèi)存最多也就幾百 MB。

2017 年，Transformer 的問世讓深度學(xué)習(xí)可以并行化計算，效率更高，意味著可以做大模型的運算，隨后產(chǎn)生了 OpenAI GPT 和谷歌 Bert 這類自然語言大模型。這一階段誕生的是特定任務(wù)的大模型，模型參數(shù)突破了 1 億。

到了 2020 年前后，深度學(xué)習(xí)進入通用模型階段，它的輸入就是一句帶空格的話，模型的作用就是 " 填空 "，以前是模型適配下游應(yīng)用，現(xiàn)在是下游應(yīng)用適配模型。這一階段的模型代表包括自然語言領(lǐng)域的 GPT 3.5、GPT 4 以及圖像領(lǐng)域的 Clip、DALLE、Stable Diffusion、Midjourney 等等。這一階段模型參數(shù)可以達(dá)到百億、千億級別。

白馬商評：你了解到最早研究大模型是哪家企業(yè)或機構(gòu)？有哪些成果？

沈為：最早是高校和科研機構(gòu)做相關(guān)的研究，我了解比較早的是北京智源人工智能研究院的悟道、鵬程實驗室的腦海，現(xiàn)在產(chǎn)業(yè)界的研究也很同步了。學(xué)術(shù)界的研究有一些成果，但性能沒有 ChatGPT 那么驚艷。

白馬商評：短短幾個月的時間，國內(nèi)出現(xiàn)了 " 百模大戰(zhàn) " 的局面，推出大模型的公司已經(jīng)數(shù)不過來了，你怎么看待這種現(xiàn)象？

沈為：大模型肯定是趨勢，也一直有人在研究。之前很多公司可能會小范圍投入，做一些淺嘗輒止的研究；現(xiàn)在突然出現(xiàn)了 ChatGPT 這樣一個好產(chǎn)品，大家看到了明確的商業(yè)方向，于是都開始加大投入。

另一方面，很多公司面臨商業(yè)競爭的壓力，不做大模型可能就掉隊了，所以必須上馬大模型項目。

白馬商評：周鴻祎最近說他收回 " 國內(nèi)大模型跟國外差距兩年 " 這句話，他認(rèn)為今天已經(jīng)接近國際水平。這才過去幾個月的時間，大模型好像也不難嘛。你覺得差距有多少？

沈為：差距看跟誰對標(biāo)吧，我目前沒有體驗過 360 智腦的產(chǎn)品，不太好評價。但是國內(nèi)有些生成式 AI 產(chǎn)品，我體驗以后感覺跟 ChatGPT 還是有差距的，國內(nèi)的大模型還需要努力。

重資本投入下，只有頭部公司有機會？

白馬商評：研發(fā)大模型的核心壁壘是什么？

沈為：大模型的核心壁壘包括數(shù)據(jù)、算力、算法。

從算力上看，訓(xùn)練 ChatGPT 這樣的生成式 AI 需要至少 1 萬張英偉達(dá) A100 顯卡，單張顯卡的價格目前是六七萬，性能更優(yōu)的 V100 單價 8 萬元人民幣，也就是說光算力投入至少就要達(dá)到六七個億以上，只有少數(shù)頭部公司和機構(gòu)能承擔(dān)得起。對于商業(yè)機構(gòu)而言，花幾個億買一堆顯卡，還不一定能產(chǎn)出成果，這是必須要思考的問題。

接下來是數(shù)據(jù)和算法，算法比較好理解，比如框架開發(fā)、算法優(yōu)化。數(shù)據(jù)方面，中國不缺數(shù)據(jù)，甚至互聯(lián)網(wǎng)數(shù)據(jù)比美國還要多，但是選擇哪些數(shù)據(jù)去訓(xùn)練、采用什么樣的方式處理，這些都是核心的壁壘。

白馬商評：你平時會跟企業(yè)交流嗎？非營利性的研究機構(gòu)和企業(yè)在研究上有什么區(qū)別？

沈為：我們會跟企業(yè)的研究部門有一些交流。跟企業(yè)交流我們會更加了解實際的業(yè)務(wù)需求，有時候我們做的學(xué)術(shù)研究會更關(guān)注技術(shù)前瞻性，對落地性要求不那么高；但企業(yè)一般更強調(diào)落地性。

白馬商評：你有沒有研究過國內(nèi)的大模型？最看好哪家？

沈為：可能還是頭部公司能跑出來吧。一是重資本的投入，只有頭部公司有實力；二是幾家頭部公司手里的數(shù)據(jù)更豐富；三是在人工智能領(lǐng)域已經(jīng)有了一段時間的技術(shù)積累。

白馬商評：你最看好的大模型應(yīng)用是什么？

沈為：從技術(shù)角度看，最先應(yīng)用的應(yīng)該是自然語言處理和圖像領(lǐng)域，語音識別可能要晚一些。

大家看到比較多的用 ChatGPT 來寫文案，這類內(nèi)容創(chuàng)作的應(yīng)用越來越多，其他我覺得像智能客服這種應(yīng)用應(yīng)該也會比較快。現(xiàn)在的一些智能客服很多時候理解不了用戶的需求，解決不了實際問題，如果讓用戶區(qū)分不出到底是人還是機器人，體驗就會改善很多；包括游戲中的 NPC，以前的對話是 " 寫死 " 的，現(xiàn)在漸漸可以互動了，玩家體驗也會更好。

白馬商評：你原來做過頭部券商的首席分析師，從投資角度看，你覺得大模型有哪些機會？

沈為：資金炒作的邏輯是從應(yīng)用到算法、模型，再到算力；產(chǎn)業(yè)的邏輯反而是相反的，算力是有明確的增長預(yù)期的，所以英偉達(dá)最近上漲很快、很多。投資者現(xiàn)在也明白了，誰家的大模型能跑出來、能變現(xiàn)還需要驗證，但是增加的資本投入大部分都投到了算力。經(jīng)過反復(fù)炒作，普漲行情應(yīng)該已經(jīng)告一段落，后面需要邏輯驗證和業(yè)績兌現(xiàn)。

我原來主要看傳媒互聯(lián)網(wǎng)行業(yè)，比如前段時間比較強勢的游戲板塊，資本的邏輯一是應(yīng)用大模型提升研發(fā)效率、降低成本；二是大模型帶來更好的體驗，NPC 角色更智能，最后用戶的粘性提升、UP 值提升。當(dāng)然，最終可能還需要業(yè)績驗證。

人類無法左右 AI，甚至無法左右自己的命運？

白馬商評：我們看到包括奧特曼、馬斯克都對人工智能的安全性問題提出過擔(dān)憂，現(xiàn)在我們只知道通過大模型訓(xùn)練出現(xiàn)了智能化的結(jié)果，但訓(xùn)練過程像一個黑箱，其實挺可怕的。你怎么看待安全問題？

沈為：在安全方面，首先我觀察到幾個反常的現(xiàn)象。第一個是今年 3 月包括馬斯克、蘋果公司聯(lián)合創(chuàng)始人史蒂夫 · 沃茲尼亞克在內(nèi)的 1000 多人簽署了一份公開信，呼吁暫停訓(xùn)練比 GPT-4 更強大的 AI 系統(tǒng)。

第二個是，今年 5 月谷歌首席科學(xué)家、已經(jīng) 75 歲的 "AI 教父 " 杰弗里 · 辛頓辭職，他離開谷歌的直接原因是擔(dān)憂人工智能的危險，甚至對自己一生從事的工作感到后悔。

第三個是近兩年學(xué)術(shù)領(lǐng)域訓(xùn)練大模型新增了倫理討論。

目前來看，我覺得大模型還是可控的，沒有大的問題；但是技術(shù)發(fā)展太快了，出圈以來短短幾個月的時間，GPT 就又經(jīng)歷了幾次迭代，發(fā)展速度太快，越來越智能，會不會產(chǎn)生自主意識，不再聽人類的 " 使喚 "，走向失控？這個問題是大家擔(dān)心的。

白馬商評：你覺得 AI 會不會造成大量失業(yè)？在 AI 面前，普通人怎么保住工作？

沈為：從宏觀上看我不覺得 AI 會造成大量的失業(yè)，人類總會有工作的，只是說人的工作內(nèi)容會發(fā)生轉(zhuǎn)變。當(dāng)然，從個體角度看肯定會出現(xiàn)結(jié)構(gòu)性的失業(yè)，我們只能不斷學(xué)習(xí)。

白馬商評：之前很多人說機器沒有感情、缺乏想象力，取代不了人類；現(xiàn)在既然人類大腦可以通過 AI 模擬出來，那人類的情欲、性欲是不是未來也可以模擬，荷爾蒙、多巴胺這些不過是一種生物學(xué)的獎勵機制嘛。

沈為：機器沒有感情是當(dāng)前的假設(shè)，人工智能越來越接近人的思考模式，那是不是就會產(chǎn)生類似于人類的 " 感情 "？只是他們和人類生活在不同的空間維度，就像《流浪地球》里圖恒宇的女兒。人工智能可能會產(chǎn)生自己世界類似于人類的生物學(xué)意義上獎勵機制。

白馬商評：如果一切都可以計算、規(guī)劃、設(shè)置，是不是有點無趣？

沈為：AI 的行為并不是人類預(yù)測和規(guī)劃的，而是他自我強化、自我訓(xùn)練的結(jié)果，《流浪地球》里 MOSS 的決策是自己做的，而不是服從人類給的指令。

白馬商評：硅基文明取代碳基文明是不是確定性的方向？

沈為：這個問題超綱了。按照目前的發(fā)展趨勢可能是這樣的，就像《流浪地球》里真正主宰人類命運的是 MOSS，而不是人類；但現(xiàn)實中也有可能技術(shù)會停滯在某個階段，跨不過去，畢竟技術(shù)發(fā)展不是線性的。