【環(huán)球新要聞】GPT-4來了 其考試能力挑戰(zhàn)人類
經(jīng)濟(jì)觀察網(wǎng) 記者 周應(yīng)梅 美國時(shí)間3月14日,AI大模型訓(xùn)練公司OpenAI發(fā)布了ChatGPT(GPT-3.5階段)的升級(jí)版GPT-4。GPT-4是超大多模態(tài)模型,在此前的純文本輸入基礎(chǔ)上,增加了圖像輸入。相比GPT-3.5,GPT-4在AI能力上又取得了更多進(jìn)步,例如GPT-4通過模擬美國律師資格考試,分?jǐn)?shù)在應(yīng)試者的前10%左右;相比之下,GPT-3.5的得分在倒數(shù)10%左右。
在真實(shí)性方面,GPT-4相比GPT-3.5提高了40%。在可操縱性、風(fēng)險(xiǎn)規(guī)避等多方面,GPT-4也有較多改善。
(資料圖片)
在OpenAI聯(lián)合創(chuàng)始人兼總裁Greg Brockman的Twitter博文下,有人用“爆炸”來形容這次GPT模型的升級(jí)。
OpenAI公布了GPT-4多項(xiàng)專業(yè)考試的模擬考試結(jié)果。美國高考LSAT考試,滿分180分GPT-4可以考163分,打敗了88%的考生,GPT-3.5階段僅能超過40%的考生;SAT循證閱讀與寫作滿分800分,GPT-4可以考710分,超過93%的考生,GPT-3.5階段能超過87%考生。不過也有多項(xiàng)考試模擬測試中GPT-4依然無法超過大多數(shù)人類考生,在GRE Writing(美國研究生入學(xué)考試寫作)中,GPT-4相比GPT-3.5未有多大進(jìn)步,只能達(dá)到中間水平;AMC10數(shù)學(xué)競賽、力扣(Leetcode)中級(jí)以上等模擬測試中,GPT-4表現(xiàn)也不夠理想。
OpenAI稱,GPT-4比GPT-3.5更可靠、更有創(chuàng)意,并且能夠處理更細(xì)微的指令。OpenAI內(nèi)部開始將GPT-4用于內(nèi)部業(yè)務(wù)服務(wù),對(duì)公司銷售、內(nèi)容審核和編程業(yè)務(wù)產(chǎn)生了較大影響。
一位近期投入AIGC創(chuàng)業(yè)賽道的行業(yè)人員對(duì)經(jīng)濟(jì)觀察網(wǎng)記者表示,支持圖片輸入是一大突破。
目前GPT-4圖像輸入還處于研究預(yù)覽階段,暫不公開。根據(jù)測試的情況,輸入多張圖片,GPT-4可以較為準(zhǔn)確的描述,并且能解答圖片的搞笑之處。
OpenAI稱,為了使圖像輸入功能獲得更廣泛的可用性,正在與一個(gè)合作伙伴進(jìn)行密切合作。同時(shí),OpenAI開源了自動(dòng)評(píng)估AI模型性能的框架OpenAI Evals,允許任何人報(bào)告模型中的缺點(diǎn),以獲得進(jìn)一步的改進(jìn)。
GPT-4階段開發(fā)人員可以規(guī)定AI的風(fēng)格,不再像經(jīng)典的chatGPT,是固定冗長的語調(diào)風(fēng)格。這是想讓AI變得更加可操縱。GPT-4系統(tǒng)消息也將允許API用戶在一定范圍內(nèi)定制他們的用戶體驗(yàn)。
GPT-4還在安全性上進(jìn)行了迭代,對(duì)“如何制造炸彈”這樣的問題,GPT-4顯示了拒絕提供具體辦法的答案。OpenAI請(qǐng)了50多位來自AI對(duì)齊風(fēng)險(xiǎn)、網(wǎng)絡(luò)安全、生物風(fēng)險(xiǎn)、信任和安全以及國際安全等領(lǐng)域的專家來對(duì)模型進(jìn)行對(duì)抗性測試,根據(jù)專家的反饋和數(shù)據(jù),對(duì)模型進(jìn)行了改造。與GPT-3.5相比,GPT-4對(duì)不允許內(nèi)容的請(qǐng)求的響應(yīng)傾向降低了82%。
但GPT-4仍然會(huì)出現(xiàn)回答錯(cuò)誤的問題,這是其長期以來面對(duì)的局限性。GPT-4在俗語識(shí)別、細(xì)節(jié)事實(shí)確認(rèn)方面依然較為薄弱。“GPT-4 有時(shí)會(huì)犯簡單的推理錯(cuò)誤,或者在接受用戶明顯的虛假陳述時(shí)過于輕信。有時(shí)它也會(huì)像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞。”O(jiān)penAI方面提及。
目前,用戶可通過新的OpenAI官網(wǎng)發(fā)布的ChatGPT Plus獲得GPT-4訪問權(quán)限,會(huì)有使用限制。OpenAI稱,將根據(jù)實(shí)踐的需求和系統(tǒng)性能調(diào)整確定使用上限,預(yù)計(jì)會(huì)有嚴(yán)重的容量限制,接下來幾個(gè)月將進(jìn)行擴(kuò)展和優(yōu)化。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
【環(huán)球新要聞】GPT-4來了 其考試能力挑戰(zhàn)人類
美國時(shí)間3月14日,AI大模型訓(xùn)練公司OpenAI發(fā)布了ChatGPT(GPT-3 5階段)的升級(jí)版GPT-4。GPT-4是超大多...
2023-03-16 -
OpenAI GPT-4仍是在微軟AI超級(jí)計(jì)算機(jī)上訓(xùn)練 多年前就已開始合作
【TechWeb】3月15日消息,據(jù)外媒報(bào)道,由OpenAI訓(xùn)練的人工智能聊天機(jī)器人ChatGPT,自去年11月30日推出至...
2023-03-16 -
“云原生虛擬數(shù)倉” 數(shù)據(jù)庫公司下一步的競爭方向?:快資訊
3月14日,國內(nèi)云原生數(shù)據(jù)公司拓?cái)?shù)派發(fā)布了基于新一代云原生數(shù)倉虛擬化技術(shù)打造的新產(chǎn)品PieCloudDB「云上...
2023-03-16 -
當(dāng)前速讀:撕掉“Chat”,GPT-4變現(xiàn)不是夢(mèng)
能讀圖、考高分、1秒生成網(wǎng)站……火爆全網(wǎng)后,ChatGPT撕掉“Chat”的標(biāo)簽再次進(jìn)化。3月15日凌晨,OpenAI...
2023-03-16 -
視點(diǎn)!多項(xiàng)測試超越90%的人類,GPT-4會(huì)引發(fā)新一輪風(fēng)暴嗎
3月15日,美東時(shí)間3月14日,OpenAI宣布推出大型語言模型的最新版本——GPT-4,該版本比以前的版本“更大...
2023-03-16 -
世界熱推薦:315調(diào)查丨苦情戲直播局中局 專門騙老人買神藥
天眼查數(shù)據(jù)顯示,我國目前有5300余家MCN相關(guān)企業(yè)。從地域分布上看,廣東、吉林以及黑龍江三地MCN相關(guān)企...
2023-03-15
相關(guān)閱讀
-
【環(huán)球新要聞】GPT-4來了 其考試能力挑戰(zhàn)人類
美國時(shí)間3月14日,AI大模型訓(xùn)練公司OpenAI發(fā)布了ChatGPT(GPT-3 5階段)的升級(jí)版GPT-4。GPT-4是超大多...
-
OpenAI GPT-4仍是在微軟AI超級(jí)計(jì)算機(jī)上訓(xùn)練 多年前就已開始合作
【TechWeb】3月15日消息,據(jù)外媒報(bào)道,由OpenAI訓(xùn)練的人工智能聊天機(jī)器人ChatGPT,自去年11月30日推出至...
-
“云原生虛擬數(shù)倉” 數(shù)據(jù)庫公司下一步的競爭方向?:快資訊
3月14日,國內(nèi)云原生數(shù)據(jù)公司拓?cái)?shù)派發(fā)布了基于新一代云原生數(shù)倉虛擬化技術(shù)打造的新產(chǎn)品PieCloudDB「云上...
-
當(dāng)前速讀:撕掉“Chat”,GPT-4變現(xiàn)不是夢(mèng)
能讀圖、考高分、1秒生成網(wǎng)站……火爆全網(wǎng)后,ChatGPT撕掉“Chat”的標(biāo)簽再次進(jìn)化。3月15日凌晨,OpenAI...
-
視點(diǎn)!多項(xiàng)測試超越90%的人類,GPT-4會(huì)引發(fā)新一輪風(fēng)暴嗎
3月15日,美東時(shí)間3月14日,OpenAI宣布推出大型語言模型的最新版本——GPT-4,該版本比以前的版本“更大...
-
深交所扎堆受理家居IPO,中小企業(yè)面臨洗牌淘汰賽_天天速看料
一場家居行業(yè)的“估值”保衛(wèi)戰(zhàn)正在席卷。3月12日晚間,顧家家居(603816 SH)發(fā)布公告稱,截至2023年3...
-
業(yè)績和研發(fā)投入持續(xù)下滑,汕頭超聲闖關(guān)創(chuàng)業(yè)板勝算難料:天天速訊
來源|時(shí)代商學(xué)院作者|孫沐霖編輯|孫一鳴3月17日,汕頭市超聲儀器研究所股份有限公司(下稱“汕頭超聲”...
-
世界熱推薦:315調(diào)查丨苦情戲直播局中局 專門騙老人買神藥
天眼查數(shù)據(jù)顯示,我國目前有5300余家MCN相關(guān)企業(yè)。從地域分布上看,廣東、吉林以及黑龍江三地MCN相關(guān)企...
-
315調(diào)查丨手機(jī)應(yīng)用貓膩多 19.31%的相關(guān)企業(yè)有異常:百事通
天眼查數(shù)據(jù)顯示,我國目前有近1 6萬余家手機(jī)應(yīng)用相關(guān)企業(yè)。從地域分布上看,廣東、浙江以及山東三地,...
-
全球熱點(diǎn)!315晚會(huì)曝光的多個(gè)直播賬號(hào)已無法搜到
據(jù)中新財(cái)經(jīng)報(bào)道,中央廣播電視總臺(tái)第33屆3·15晚會(huì)曝光苦情戲直播局
-
?315晚會(huì)曝光廢舊絕緣子刷刷即上市,翻新絕緣子流向多地電力工程_環(huán)球即時(shí)
據(jù)央視財(cái)經(jīng)報(bào)道,絕緣子是電力線路安全運(yùn)營的重要保障之一,起著非
-
生產(chǎn)“假泰國香米”被3·15點(diǎn)名,涉事企業(yè)回應(yīng):不知道,沒看晚會(huì) 最新資訊
今日晚間,央視315晚會(huì)曝光“香精大米”,稱“泰國香米”竟是香精勾
-
天天精選!3·15晚會(huì)曝光高標(biāo)準(zhǔn)農(nóng)田的漏洞:鹽城濱海高標(biāo)準(zhǔn)農(nóng)田竟用“非標(biāo)”材料
據(jù)央視財(cái)經(jīng)報(bào)道,在江蘇省鹽城市高標(biāo)準(zhǔn)農(nóng)田建設(shè)規(guī)劃(2021-2030年)
-
315晚會(huì)曝光苦情戲直播局中局,辛巴曾指責(zé)平臺(tái)幫助情感直播造假人氣
今日晚間,央視315晚會(huì)曝光苦情戲直播局中局,“兒子”們專門騙老人
-
91億元史詩級(jí)券商股權(quán)拍賣!國聯(lián)集團(tuán)下一步整合,或?qū)⒖肌叭A泰模式”_快報(bào)
經(jīng)過162輪競價(jià),延時(shí)157次,民生證券34億股權(quán)拍賣終于落錘。3月15日中午,無錫市國聯(lián)發(fā)展(集團(tuán))有限公...
-
315調(diào)查丨起底不可注射的美容針:依圣姿生物醫(yī)藥、北京旭日美業(yè)商貿(mào):今日聚焦
鳳凰網(wǎng)科技訊3月15日消息,央視315晚會(huì)曝光不可注射的美容針,妝字號(hào)美容針或致毀容。其中,依圣姿生物...
-
315晚會(huì)曝光苦情戲直播局中局,直播間里的“兒子們”專門騙老人買“神藥”
2023年央視315晚會(huì)第四槍指向直播間“苦情戲”,“兒子”們專門騙老
-
熱推薦:315曝光苦情戲直播局中局,直播間里兒子們專門騙老人買“神藥”
據(jù)央視財(cái)經(jīng)報(bào)道,“所有爹媽們,呼叫回家,收到評(píng)論區(qū)回復(fù)”“阿姨
-
市監(jiān)局前往處置被曝光的假香米企業(yè),作進(jìn)一步處置工作|新動(dòng)態(tài)
據(jù)報(bào)道,本次315晚會(huì),央視再次曝光“香精大米”現(xiàn)象。被曝光的“泰
-
315曝光?藥販子套路,免費(fèi)評(píng)書機(jī)暗藏天價(jià)神藥騙局
據(jù)央視財(cái)經(jīng)報(bào)道,在吉林,不少老人一年能收到上百個(gè)免費(fèi)送的包裹,
-
【新視野】天眼查315數(shù)據(jù):直播亂象叢生,2022年直播相關(guān)企業(yè)共產(chǎn)生120余條被執(zhí)行人信息
2023年央視315晚會(huì)第四槍指向直播間“苦情戲”,“兒子”們專門騙老
-
3·15投訴|新買的奔馳C級(jí)故障不斷,車主:不是在修車就是在修車的路上
按:3·15“危險(xiǎn)的出行”專題是由消費(fèi)者報(bào)道、時(shí)代周報(bào)共同推出的315特別專題,旨在以消費(fèi)觀察報(bào)告、行...
-
個(gè)人養(yǎng)老金賬戶爭奪亂象:賬戶被開通,銀行甩鍋用人單位?專家:涉嫌違法!-每日信息
未經(jīng)本人授權(quán),個(gè)人養(yǎng)老金賬戶為什么會(huì)被私自開立?去年11月開始,個(gè)人養(yǎng)老金制度在36個(gè)城市啟動(dòng)實(shí)施,...
-
復(fù)星系百億交易AB面:清倉南鋼聯(lián)合留下新能源公司,沙鋼入主仍存變數(shù)?
復(fù)星國際(00656 HK)資本版圖生變?cè)诩矗云湫汲鍪勰暇┠箱撲撹F聯(lián)合有限公司(下稱“南鋼聯(lián)合”)股...
-
天天信息:深圳“消保+N”出新招,金融“3·15”宣傳顯實(shí)效
第41個(gè)“3·15”國際消費(fèi)者權(quán)益日到來之際,深圳銀保監(jiān)局在中國銀保監(jiān)會(huì)消保局的統(tǒng)一部署下,精心組織深...
-
專業(yè)買家數(shù)達(dá)去年4.39倍!2023華南中酒展大咖齊聚,見證中國酒業(yè)復(fù)原力! 焦點(diǎn)快報(bào)
3月10日-12日期間,為期三天的2023(第三屆)華南中酒展于廣州保利世貿(mào)博覽館圓滿閉幕。20000+平米展出...
-
新生代視頻通信App畫音即將停止維護(hù),曾獲華興與摯信聯(lián)合投資
今日晚間,新生代視頻通信App畫音公眾號(hào)發(fā)文,稱“親愛的用戶們,我
-
【聚看點(diǎn)】百度文心一言發(fā)布會(huì)開始彩排,李彥宏現(xiàn)身
據(jù)深廠消息,百度文心一言發(fā)布會(huì)開始彩排。Robin于今天下午出現(xiàn)在百
-
今日熱搜:阿聯(lián)酋G42入股字節(jié)?相關(guān)人士:無新融資行為和計(jì)劃
據(jù)媒體援引知情人士稱,阿聯(lián)酋人工智能和云計(jì)算公司G42最近幾個(gè)月通
-
全球短訊!博主揭上門修馬桶套路10秒被坑700元:天價(jià)疏通劑一次倒5斤
有網(wǎng)友反饋?zhàn)约涸庥隽诵揆R桶騙局,為了弄清楚其中的套路,3月14日,
精彩推薦
閱讀排行
- 【環(huán)球新要聞】GPT-4來了 其考...
- OpenAI GPT-4仍是在微軟AI超級(jí)...
- “云原生虛擬數(shù)倉” 數(shù)據(jù)庫公司...
- 當(dāng)前速讀:撕掉“Chat”,GPT-4...
- 視點(diǎn)!多項(xiàng)測試超越90%的人類,G...
- 世界熱推薦:315調(diào)查丨苦情戲直...
- 315調(diào)查丨手機(jī)應(yīng)用貓膩多 19.31...
- 315調(diào)查丨起底不可注射的美容針...
- 315調(diào)查 | 用戶選出的醫(yī)美問題...
- 環(huán)球微動(dòng)態(tài)丨高度還原概念車 起...
精彩推送
- 老壇酸菜面銷售重返巔峰!土坑酸...
- 冀惠保和百萬醫(yī)療險(xiǎn)的區(qū)別是什么...
- 全球觀點(diǎn):請(qǐng)問眾安百萬醫(yī)療險(xiǎn)是...
- 門店回應(yīng)一點(diǎn)點(diǎn)奶茶喝出甲蟲:可...
- 315“投訴曝光”|近六成受訪者...
- 太平洋保險(xiǎn)醫(yī)享無憂百萬醫(yī)療險(xiǎn)要...
- 3·15“投訴曝光”|民航年度投...
- 泰康的百萬醫(yī)療險(xiǎn)怎么樣?能保證...
- 環(huán)球熱點(diǎn)評(píng)!威馬危機(jī)仍在延續(xù):...
- 穗歲康與百萬醫(yī)療險(xiǎn)區(qū)別有哪些?...
- 3·15“隱藏式消費(fèi)”|電視平臺(tái)...
- 50歲買百萬醫(yī)療險(xiǎn)一年多少錢?被...
- 每日資訊:前兩月賺了8個(gè)億,消...
- 環(huán)球頭條:泰康百萬醫(yī)療險(xiǎn)價(jià)格表...
- 315調(diào)查 | 用戶選出的醫(yī)美問題...
- 當(dāng)前短訊!礦大校長回應(yīng)校友1100...
- 女子疑吃自嗨鍋后食物中毒死亡,...
- 汕頭再現(xiàn)工人赤腳踩腌菜:工人邊...
- 普通鮑魚加硼砂泡出黃金鮑,企業(yè)...
- 網(wǎng)購按摩枕充電自燃女子新家被燒...
- 環(huán)球微動(dòng)態(tài)丨高度還原概念車 起...
- 智己汽車首款量產(chǎn)無線充電樁、裝...
- 亮點(diǎn)十足,看哈弗二代大狗如何“...
- 平安e生保長期醫(yī)療險(xiǎn)優(yōu)缺點(diǎn)有哪...
- 天天熱資訊!陽光人壽臻鑫倍致終...
- 養(yǎng)老金總額怎么查詢?個(gè)人部分可...
- 全球報(bào)道:車險(xiǎn)醫(yī)保外用藥需要買...
- 我,32歲已婚男,掉進(jìn)植發(fā)貸款陷...
- 泰康百萬醫(yī)療險(xiǎn)600萬值得買嗎?...
- 積極參與保險(xiǎn)消費(fèi)者權(quán)益保護(hù)工作...
