中國大模型到底什么水平? 世界觀焦點
文 | 白馬商評
" 都快成紅海了。" 當(dāng)我和一個創(chuàng)業(yè)者聊起大模型的時候,他直接甩了這句話給我。
(資料圖)
去年 11 月,OpenAI 發(fā)布基于 GPT-3.5 的 ChatGPT,瞬間引爆大模型的熱潮。半年多的時間,中國出現(xiàn)了 " 百模大戰(zhàn) " 的局面,BAT 等頭部互聯(lián)網(wǎng)公司和人工智能公司基本都對外宣布了自己的大模型。
5 月初,360 掌門人周鴻祎對外稱," 如果不經(jīng)過兩年的模仿和抄襲,上來就說自己能超越,那才叫吹牛呢。" 僅僅一個月后,周鴻祎就表示," 我原來說國內(nèi)大模型跟國外差距兩年,我收回這句話,今天已經(jīng)接近國際水平。"
有人感慨,半年就追上 ChatGPT 了,大模型似乎也不難。那么,大模型的核心壁壘是什么?中國大模型到底什么水平?大模型在應(yīng)用層面最先突圍的方向是什么?
沈為(化名)是某知名 985 高校教授,多年從事機器學(xué)習(xí)研究,還曾擔(dān)任過某頭部券商首席分析師,我們和他聊了聊,試圖揭開大模型的迷霧。
GPT 路徑跑通了,所以有了 " 百模大戰(zhàn) "
白馬商評:能不能用最通俗簡單的語言解釋一下大模型,大模型是什么?和以往的 AI 模型有什么區(qū)別?
沈為:所謂大模型就是指模型的參數(shù)量大,但學(xué)術(shù)界并沒有一個清晰明確的定義界定到底多大參數(shù)叫 " 大 ",還在快速研究發(fā)展階段,一般來講大模型的參數(shù)量達(dá)到 1 億以上。
其實深度學(xué)習(xí)的發(fā)展大致經(jīng)歷了三個階段。第一個階段是 2012-2017 年,以圖像分割 yolo、圖像分類 ResNet 這種特定領(lǐng)域的小模型為代表,參數(shù)量占內(nèi)存最多也就幾百 MB。
2017 年,Transformer 的問世讓深度學(xué)習(xí)可以并行化計算,效率更高,意味著可以做大模型的運算,隨后產(chǎn)生了 OpenAI GPT 和谷歌 Bert 這類自然語言大模型。這一階段誕生的是特定任務(wù)的大模型,模型參數(shù)突破了 1 億。
到了 2020 年前后,深度學(xué)習(xí)進入通用模型階段,它的輸入就是一句帶空格的話,模型的作用就是 " 填空 ",以前是模型適配下游應(yīng)用,現(xiàn)在是下游應(yīng)用適配模型。這一階段的模型代表包括自然語言領(lǐng)域的 GPT 3.5、GPT 4 以及圖像領(lǐng)域的 Clip、DALLE、Stable Diffusion、Midjourney 等等。這一階段模型參數(shù)可以達(dá)到百億、千億級別。
白馬商評:你了解到最早研究大模型是哪家企業(yè)或機構(gòu)?有哪些成果?
沈為:最早是高校和科研機構(gòu)做相關(guān)的研究,我了解比較早的是北京智源人工智能研究院的悟道、鵬程實驗室的腦海,現(xiàn)在產(chǎn)業(yè)界的研究也很同步了。學(xué)術(shù)界的研究有一些成果,但性能沒有 ChatGPT 那么驚艷。
白馬商評:短短幾個月的時間,國內(nèi)出現(xiàn)了 " 百模大戰(zhàn) " 的局面,推出大模型的公司已經(jīng)數(shù)不過來了,你怎么看待這種現(xiàn)象?
沈為:大模型肯定是趨勢,也一直有人在研究。之前很多公司可能會小范圍投入,做一些淺嘗輒止的研究;現(xiàn)在突然出現(xiàn)了 ChatGPT 這樣一個好產(chǎn)品,大家看到了明確的商業(yè)方向,于是都開始加大投入。
另一方面,很多公司面臨商業(yè)競爭的壓力,不做大模型可能就掉隊了,所以必須上馬大模型項目。
白馬商評:周鴻祎最近說他收回 " 國內(nèi)大模型跟國外差距兩年 " 這句話,他認(rèn)為今天已經(jīng)接近國際水平。這才過去幾個月的時間,大模型好像也不難嘛。你覺得差距有多少?
沈為:差距看跟誰對標(biāo)吧,我目前沒有體驗過 360 智腦的產(chǎn)品,不太好評價。但是國內(nèi)有些生成式 AI 產(chǎn)品,我體驗以后感覺跟 ChatGPT 還是有差距的,國內(nèi)的大模型還需要努力。
重資本投入下,只有頭部公司有機會?
白馬商評:研發(fā)大模型的核心壁壘是什么?
沈為:大模型的核心壁壘包括數(shù)據(jù)、算力、算法。
從算力上看,訓(xùn)練 ChatGPT 這樣的生成式 AI 需要至少 1 萬張英偉達(dá) A100 顯卡,單張顯卡的價格目前是六七萬,性能更優(yōu)的 V100 單價 8 萬元人民幣,也就是說光算力投入至少就要達(dá)到六七個億以上,只有少數(shù)頭部公司和機構(gòu)能承擔(dān)得起。對于商業(yè)機構(gòu)而言,花幾個億買一堆顯卡,還不一定能產(chǎn)出成果,這是必須要思考的問題。
接下來是數(shù)據(jù)和算法,算法比較好理解,比如框架開發(fā)、算法優(yōu)化。數(shù)據(jù)方面,中國不缺數(shù)據(jù),甚至互聯(lián)網(wǎng)數(shù)據(jù)比美國還要多,但是選擇哪些數(shù)據(jù)去訓(xùn)練、采用什么樣的方式處理,這些都是核心的壁壘。
白馬商評:你平時會跟企業(yè)交流嗎?非營利性的研究機構(gòu)和企業(yè)在研究上有什么區(qū)別?
沈為:我們會跟企業(yè)的研究部門有一些交流。跟企業(yè)交流我們會更加了解實際的業(yè)務(wù)需求,有時候我們做的學(xué)術(shù)研究會更關(guān)注技術(shù)前瞻性,對落地性要求不那么高;但企業(yè)一般更強調(diào)落地性。
白馬商評:你有沒有研究過國內(nèi)的大模型?最看好哪家?
沈為:可能還是頭部公司能跑出來吧。一是重資本的投入,只有頭部公司有實力;二是幾家頭部公司手里的數(shù)據(jù)更豐富;三是在人工智能領(lǐng)域已經(jīng)有了一段時間的技術(shù)積累。
白馬商評:你最看好的大模型應(yīng)用是什么?
沈為:從技術(shù)角度看,最先應(yīng)用的應(yīng)該是自然語言處理和圖像領(lǐng)域,語音識別可能要晚一些。
大家看到比較多的用 ChatGPT 來寫文案,這類內(nèi)容創(chuàng)作的應(yīng)用越來越多,其他我覺得像智能客服這種應(yīng)用應(yīng)該也會比較快。現(xiàn)在的一些智能客服很多時候理解不了用戶的需求,解決不了實際問題,如果讓用戶區(qū)分不出到底是人還是機器人,體驗就會改善很多;包括游戲中的 NPC,以前的對話是 " 寫死 " 的,現(xiàn)在漸漸可以互動了,玩家體驗也會更好。
白馬商評:你原來做過頭部券商的首席分析師,從投資角度看,你覺得大模型有哪些機會?
沈為:資金炒作的邏輯是從應(yīng)用到算法、模型,再到算力;產(chǎn)業(yè)的邏輯反而是相反的,算力是有明確的增長預(yù)期的,所以英偉達(dá)最近上漲很快、很多。投資者現(xiàn)在也明白了,誰家的大模型能跑出來、能變現(xiàn)還需要驗證,但是增加的資本投入大部分都投到了算力。經(jīng)過反復(fù)炒作,普漲行情應(yīng)該已經(jīng)告一段落,后面需要邏輯驗證和業(yè)績兌現(xiàn)。
我原來主要看傳媒互聯(lián)網(wǎng)行業(yè),比如前段時間比較強勢的游戲板塊,資本的邏輯一是應(yīng)用大模型提升研發(fā)效率、降低成本;二是大模型帶來更好的體驗,NPC 角色更智能,最后用戶的粘性提升、UP 值提升。當(dāng)然,最終可能還需要業(yè)績驗證。
人類無法左右 AI,甚至無法左右自己的命運?
白馬商評:我們看到包括奧特曼、馬斯克都對人工智能的安全性問題提出過擔(dān)憂,現(xiàn)在我們只知道通過大模型訓(xùn)練出現(xiàn)了智能化的結(jié)果,但訓(xùn)練過程像一個黑箱,其實挺可怕的。你怎么看待安全問題?
沈為:在安全方面,首先我觀察到幾個反常的現(xiàn)象。第一個是今年 3 月包括馬斯克、蘋果公司聯(lián)合創(chuàng)始人史蒂夫 · 沃茲尼亞克在內(nèi)的 1000 多人簽署了一份公開信,呼吁暫停訓(xùn)練比 GPT-4 更強大的 AI 系統(tǒng)。
第二個是,今年 5 月谷歌首席科學(xué)家、已經(jīng) 75 歲的 "AI 教父 " 杰弗里 · 辛頓辭職,他離開谷歌的直接原因是擔(dān)憂人工智能的危險,甚至對自己一生從事的工作感到后悔。
第三個是近兩年學(xué)術(shù)領(lǐng)域訓(xùn)練大模型新增了倫理討論。
目前來看,我覺得大模型還是可控的,沒有大的問題;但是技術(shù)發(fā)展太快了,出圈以來短短幾個月的時間,GPT 就又經(jīng)歷了幾次迭代,發(fā)展速度太快,越來越智能,會不會產(chǎn)生自主意識,不再聽人類的 " 使喚 ",走向失控?這個問題是大家擔(dān)心的。
白馬商評:你覺得 AI 會不會造成大量失業(yè)?在 AI 面前,普通人怎么保住工作?
沈為:從宏觀上看我不覺得 AI 會造成大量的失業(yè),人類總會有工作的,只是說人的工作內(nèi)容會發(fā)生轉(zhuǎn)變。當(dāng)然,從個體角度看肯定會出現(xiàn)結(jié)構(gòu)性的失業(yè),我們只能不斷學(xué)習(xí)。
白馬商評:之前很多人說機器沒有感情、缺乏想象力,取代不了人類;現(xiàn)在既然人類大腦可以通過 AI 模擬出來,那人類的情欲、性欲是不是未來也可以模擬,荷爾蒙、多巴胺這些不過是一種生物學(xué)的獎勵機制嘛。
沈為:機器沒有感情是當(dāng)前的假設(shè),人工智能越來越接近人的思考模式,那是不是就會產(chǎn)生類似于人類的 " 感情 "?只是他們和人類生活在不同的空間維度,就像《流浪地球》里圖恒宇的女兒。人工智能可能會產(chǎn)生自己世界類似于人類的生物學(xué)意義上獎勵機制。
白馬商評:如果一切都可以計算、規(guī)劃、設(shè)置,是不是有點無趣?
沈為:AI 的行為并不是人類預(yù)測和規(guī)劃的,而是他自我強化、自我訓(xùn)練的結(jié)果,《流浪地球》里 MOSS 的決策是自己做的,而不是服從人類給的指令。
白馬商評:硅基文明取代碳基文明是不是確定性的方向?
沈為:這個問題超綱了。按照目前的發(fā)展趨勢可能是這樣的,就像《流浪地球》里真正主宰人類命運的是 MOSS,而不是人類;但現(xiàn)實中也有可能技術(shù)會停滯在某個階段,跨不過去,畢竟技術(shù)發(fā)展不是線性的。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
傳阿里有意將優(yōu)酷和土豆注入阿里影業(yè)?阿里大文娛公關(guān)回應(yīng)稱,不屬實
36氪獲悉,有市場消息傳出,阿里巴巴據(jù)悉考慮視頻平臺優(yōu)酷和土豆的戰(zhàn)略
2023-07-04
相關(guān)閱讀
-
中國大模型到底什么水平? 世界觀焦點
圖片來源@視覺中國文|白馬商評都快成紅海了。當(dāng)我和一個創(chuàng)業(yè)者聊起大模
-
全球焦點!掃地機器人市場回暖,科沃斯卻難突破?
「核心要點」經(jīng)過今年5月以及618促銷期,掃地機器人市場終于迎來了銷量
-
【天天速看料】佛山南海區(qū)里水鎮(zhèn)小學(xué)轉(zhuǎn)學(xué)插班報名對象2023
佛山南海區(qū)里水鎮(zhèn)公辦小學(xué)插班生將實行網(wǎng)上報名,2023年7月4日早上7:00
-
小孩子可以買百萬醫(yī)療嗎?要多少錢?_全球新要聞
可以, 給孩子買百萬醫(yī)療險是可以的, 根據(jù)自身家庭情況來決定是否需要
-
腦起搏器百萬醫(yī)療報銷嗎?報銷多少?
如果使用腦起搏器所發(fā)生的醫(yī)療費用是合理且必要的,那么通常是可以進行
-
今日熱聞!百萬醫(yī)療險可以申請墊付嗎?需要什么材料?
百萬醫(yī)療險通常是在事后報銷醫(yī)療費用,即投保人先自行支付醫(yī)療費用,然
-
33歲買百萬醫(yī)療多少錢?劃算嗎?
年繳費用大約在1000元至3000元之間。 百萬醫(yī)療保險的價格因保險公司、
-
百萬醫(yī)療險可以報銷icu嗎?能報銷多少?
可以, 首先,我們需要明確百萬醫(yī)療險的保險范圍。 百萬醫(yī)療險是一種針
-
時代IPO快訊:天極科技申請獲受理,蘇環(huán)院首獲問詢,惠柏新材提交注冊|環(huán)球精選
來源|時代商學(xué)院作者|雷小艷孫佳雯黃銳陳麗娜畢肖磊編輯|陳佳鑫一、受
-
世界要聞:極狐阿爾法S先行版OTA再升級,AVP功能驚喜上線
極狐阿爾法S先行版OTA再升級,AVP功能驚喜上線車位找不到?車多停車難
-
做好創(chuàng)新創(chuàng)業(yè)教育這篇大文章|世界播資訊
創(chuàng)新是社會進步的靈魂,創(chuàng)業(yè)是推動經(jīng)濟社會發(fā)展、改善民生的重要途徑。
-
地平線與四維圖新:圍繞智駕系統(tǒng)等多領(lǐng)域加深合作-天天速看料
地平線與四維圖新:圍繞智駕系統(tǒng)等多領(lǐng)域加深合作簡介:7月4日,蓋世汽
-
宇通客車:6月汽車銷量同比增長111.55%
宇通客車公告,6月汽車銷量4726輛,同比增長111 55%。本年累計銷量1513
-
湯臣倍健發(fā)布2023年H1業(yè)績預(yù)告:凈利潤同比增長30%-50%-當(dāng)前快訊
7月3日,湯臣倍健發(fā)布2023年半年度業(yè)績預(yù)告。報告期內(nèi),公司預(yù)計實現(xiàn)歸
-
方程豹汽車首款車型定名豹5,將于年內(nèi)開啟交付|熱門
7月4日,比亞迪方程豹汽車首款車型定名“豹5”,價格將在40-60萬元之間
-
馬斯克硬剛 OpenAI,用戶慘遭池魚之殃
只聽說過社交媒體想方設(shè)法讓用戶多停留的,沒聽說過主動給人加個上限的
-
MIUI15 來了!小米下半年最大重頭戲:多款新機已在測試!|全球快報
在去年底發(fā)布的小米13系列上,除了在核心硬件上的全新升級外,我們也見
-
菜鳥京東化,順豐怎么辦?
圖片來源@視覺中國文|解碼Decode每年,國家郵政局都會按季度公布一份快
-
傳阿里有意將優(yōu)酷和土豆注入阿里影業(yè)?阿里大文娛公關(guān)回應(yīng)稱,不屬實
36氪獲悉,有市場消息傳出,阿里巴巴據(jù)悉考慮視頻平臺優(yōu)酷和土豆的戰(zhàn)略
-
中端手機暴打旗艦!上半年重磅新機扎堆,太卷了!
隨著6月份的結(jié)束,熱鬧了整整半年的手機市場總算是迎來了「冷靜期」。
-
集度汽車緘默,百度造車到哪一步了? 環(huán)球快訊
作者:孫志富來源:貓頭鷹車志(ID:owlauto)2021年,李彥宏首次明確了
-
即時:新型硅了解下?性能全面升級自帶新特性 適用于量子計算機等領(lǐng)域
財聯(lián)社7月4日訊(編輯黃君芝)近一個世紀(jì)以來,硅在電子領(lǐng)域一直占據(jù)著
-
合資變外資?smart 電動化轉(zhuǎn)型國內(nèi)市場承壓
隨著A00級別小車市場規(guī)模下降,行業(yè)電動化轉(zhuǎn)型趨勢加快等因素影響,sma
-
鎵鍺出口管制!概念股應(yīng)聲大漲,業(yè)內(nèi):半導(dǎo)體產(chǎn)業(yè)或受影響
利好消息助攻,今日鍺、鎵概念股開盤大漲。個股中,國內(nèi)兩大鍺生產(chǎn)企業(yè)
-
“陳思誠模式”為何叫座? 焦點速遞
燃次元(ID:chaintruth)原創(chuàng)作者|陶淘編輯|曹楊電影《消失的她》爆
-
萬控智造: 公司在定期報告披露相應(yīng)報告期末的股東人數(shù) 今熱點
萬控智造(603070)07月04日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
-
重疾險和百萬醫(yī)療哪個好?區(qū)別是什么?
都好。重疾險和百萬醫(yī)療都有各自的優(yōu)勢,取決于您的需求和偏好。重疾險
-
焦點!畢馬威中國發(fā)布金融科技企業(yè)首席洞察報告
6月30日,由青島市地方金融監(jiān)督管理局、中國人民銀行青島市中心支行指
-
生孩子能用百萬醫(yī)療保險么?一年要交多少保費?|每日觀點
不能。百萬醫(yī)療保險一般并不包括生育相關(guān)的費用。百萬醫(yī)療保險主要針對
-
全球觀察:顧家家居被投訴,拒絕為保修期內(nèi)產(chǎn)品保修,官網(wǎng)8大承諾成一紙空話?
近日,有消費者向《消費者報道》投訴稱對顧家家居的售后運營感到不滿,
精彩推薦
閱讀排行
精彩推送
- 環(huán)球時訊:大麥稱被罰系項目批文...
- 工傷報完百萬醫(yī)療可以報嗎?多久...
- 元宇宙|WAIC 2023 阿里元境元...
- 眾安惠醫(yī)保百萬醫(yī)療險保什么?可...
- 每日短訊:元宇宙 | 上海市多...
- 環(huán)球觀熱點:網(wǎng)上說的百萬醫(yī)療是...
- 全球簡訊:叉車龍頭安徽合力業(yè)績...
- 網(wǎng)傳阿里或?qū)⒅匦抡弦曨l資產(chǎn),...
- 中國駐日大使館:國際原子能機構(gòu)...
- 全球今熱點:突發(fā)!中國電子競技...
- 微軟內(nèi)部信流出,雄心規(guī)劃曝光,...
- 每日快播:集度汽車緘默,百度造...
- 美媒:Meta 想進入中國市場賣產(chǎn)...
- 700 億游戲巨頭終被立案,“莆...
- 天天日報丨堅持異質(zhì)主機形態(tài),任...
- 世界快看:車企最看好的激光雷達(dá)...
- 曾被安徽前首富“掏空”,700 ...
- 燕京啤酒的蔡徐坤隱喻 滾動
- 世界快資訊丨上汽的痛,誰懂?
- 半年排名躍升近30位 中建智地...
- 途昂鎖車?yán)仍趺撮_啟視頻(途昂...
- 【全球新視野】華夏喜盈門年金保...
- 世界新動態(tài):惠添寶年金保險條款...
- 環(huán)球關(guān)注:平安年金保險富贏金生...
- 天天通訊!華東醫(yī)藥(000963.SZ)...
- 天天亮點!農(nóng)銀人壽養(yǎng)老年金保險...
- 平安有增額終身壽險嗎?值得購買...
- 報道:菜鳥京東化,順豐怎么辦?
- 高德地圖宣布王鶴棣為新代言人
- 每日快報!騰勢N7,宣戰(zhàn)BBA








