在线欧美精品国产综合五月_国产精品免费久久久久影院_国产精品久久久久无码av_a级毛片黄免费a级毛片

首頁 > 新聞 > 智能 > 正文

GPT-4 變笨引爆輿論!文本代碼質量都下降,OpenAI 剛剛回應了降本減料質疑

2023-06-02 13:13:59來源:ZAKER科技  

大模型天花板GPT-4,它是不是……變笨了?


(相關資料圖)

先是少數用戶提出質疑,隨后大量網友表示自己也注意到了,還貼出不少證據。

有人反饋,把 GPT-4 的 3 小時 25 條對話額度一口氣用完了,都沒解決自己的代碼問題。

無奈切換到 GPT-3.5,反倒解決了。

總結下大家的反饋,最主要的幾種表現有:

以前 GPT-4 能寫對的代碼,現在滿是 Bug

回答問題的深度和分析變少了

響應速度比以前快了

這就引起不少人懷疑,OpenAI 是不是為了節省成本,開始偷工減料

兩個月前 GPT-4 是世界上最偉大的寫作助手,幾周前它開始變得平庸。我懷疑他們削減了算力或者把它變得沒那么智能。

這就不免讓人想起微軟新必應" 出道即巔峰 ",后來慘遭 " 前額葉切除手術 " 能力變差的事情……

網友們相互交流自己的遭遇后," 幾周之前開始變差 ",成了大家的共識。

一場輿論風暴同時在 Hacker News、Reddit 和 Twitter 等技術社區形成。

這下官方也坐不住了。

OpenAI 開發者推廣大使Logan Kilpatrick,出面回復了一位網友的質疑:

API 不會在沒有我們通知您的情況下更改。那里的模型處于靜止狀態

不放心的網友繼續追問確認 " 就是說 GPT-4 自從3 月 14 日發布以來都是靜態的對吧?",也得到了 Logan 的肯定回答。" 我注意到對于某些提示詞表現不一致,只是由于大模型本身的不穩定性嗎?",也得到了"Yes"的回復。但是截至目前,針對網頁版 GPT-4 是否被降級過的兩條追問都沒有得到回答,并且 Logan 在這段時間有發布別的內容。那么事情究竟如何,不如自己上手測試一波。

對于網友普遍提到 GPT-4 寫代碼水平變差,我們做了個簡單實驗。

實測 GPT-4" 煉丹 " 本領下降了嗎?

3 月底,我們曾實驗過讓 GPT-4" 煉丹 ",用 Python 寫一個多層感知機來實現異或門。

ShareGPT 截圖,界面稍有不同

讓 GPT-4 改用 numpy 不用框架后,第一次給出的結果不對。

修改兩次代碼后,運行得到了正確結果。第一次修改隱藏神經元數量,第二次把激活函數從 sigmoid 修改成 tanh。

6 月 2 日,我們再次嘗試讓 GPT-4 完成這個任務,但換成了中文提示詞。

這回 GPT-4 第一次就沒有使用框架,但給的代碼仍然不對。

后續只修改一次就得到正確結果,而且換成了力大磚飛的思路,直接增加訓練 epoch 數和學習率。

回答的文字部分質量也未觀察到明顯下降,但響應速度感覺確實有變快。

由于時間有限,我們只進行了這一個實驗,且由于 AI 本身的隨機性,也并不能否定網友的觀察。

最早 4 月 19 日就有人反饋

我們在 OpenAI 官方 Discord 頻道中搜索,發現從4 月下旬開始,就不時有零星用戶反饋 GPT-4 變差了。

但這些反饋并未引發大范圍討論,也沒有得到官方正式回應。

5 月 31 日,Hacker News 和 Twitter 同天開始大量有網友討論這個問題,成為整個事件的關鍵節點。

HackerNews 一位網友指出,在 GPT-4 的頭像還是黑色的時候更強,現在紫色頭像版在修改代碼時會丟掉幾行。

在 Twitter 上較早提出這個問題的,是 HyperWrite(一款基于 GPT API 開發的寫作工具)的 CEO,Matt Shumer。

但這條推文卻引發了許多網友的共鳴,OpenAI 員工回復的推文也正是針對這條。

不過這些回應并沒讓大家滿意,反而討論的范圍越來越大。

比如 Reddit 上一篇帖子提到,原來能回答代碼問題的 GPT-4,現在連哪些是代碼哪些是問題都分不出來了。

在其他網友的追問下,帖子作者對問題出現的過程進行了概述,還附上了和 GPT 的聊天記錄。對于 OpenAI 聲稱模型從三月就沒有改動過,公開層面確實沒有相關記錄。

ChatGPT 的更新日志中,分別在1 月 9 日、1 月 30 日、2 月 13 日提到了對模型本身的更新,涉及改進事實準確性和數學能力等。

但自從3 月 14 日GPT-4 發布之后就沒提到模型更新了,只有網頁 APP 功能調整和添加聯網模式、插件模式、蘋果 APP 等方面的變化。

假設真如 OpenAI 所說,GPT-4 模型本身的能力沒有變化,那么這么多人都感覺它表現變差是怎么回事呢?

很多人也給出了自己的猜想。

第一種可能的原因是心理作用。

Keras 創始人 Fran ois Chollet 就表示,不是 GPT 的表現變差,而是大家渡過了最初的驚喜期,對它的期待變高了。

Hacker News 上也有網友持相同觀點,并補充到人們的關注點發生了改變,對 GPT 失誤的敏感度更高了。拋開人們心理感受的差異,也有人懷疑API 版本和網頁版本不一定一致,但沒什么實據。

還有一種猜測是在啟用插件的情況下,插件的額外提示詞對要解決的問題來說可能算一種污染

WebPilot 插件中的額外提示詞

這位網友就表示,在他看來 GPT 表現變差正是從插件功能開始公測之后開始的。

也有人向 OpenAI 員工詢問是否模型本身沒變,但推理參數是否有變化?量子位也曾偶然 " 拷問 " 出 ChatGPT 在iOS 上的系統提示詞與網頁版并不一致。

如果在手機端開啟一個對話,它會知道自己在通過手機與你交互。

會把回答控制在一到兩句話,除非需要長的推理。

不會使用表情包,除非你明確要求他使用。

不一定成功,大概率拒絕回答

那么如果在網頁版繼續一個在 iOS 版開啟的對話而沒意識到,就可能觀察到 GPT-4 回答變簡單了。

總之,GPT-4 自發布以來到底有沒有變笨,目前還是個未解之謎。

但有一點可以確定:

3 月 14 日起大家上手玩到的 GPT-4,從一開始就不如論文里的。

與人類對齊讓 AI 能力下降

微軟研究院發表的 150 多頁刷屏論文《AGI 的火花:GPT-4 早期實驗》中明確:

他們早在 GPT-4 開發未完成時就得到了測試資格,并進行了長期測試。

后來針對論文中很多驚艷例子,網友都不能成功用公開版 GPT-4 復現。

目前學術界有個觀點是,后來的RLHF 訓練雖然讓 GPT-4 更與人類對齊——也就更聽從人類指示和符合人類價值觀——但讓也讓它自身的推理等能力變差

論文作者之一、微軟科學家張弋在中文播客節目《What ’ s Next|科技早知道》S7E11 期中也提到:

那個版本的模型,比現在外面大家都可以拿得到的 GPT-4 還要更強,強非常非常多。

舉例來說,微軟團隊在論文中提到,他們每隔相同一段時間就讓 GPT-4 使用 LaTeX 中的 TikZ 畫一個獨角獸來追蹤 GPT-4 能力的變化。

論文中展示的最后一個結果,畫得已經相當完善。

但論文一作Sebastien Bubeck后續在 MIT 發表演講時透露了更多信息。

后來當 OpenAI 開始關注安全問題的時候,后續版本在這個任務中變得越來越糟糕了。

與人類對齊但并不降低 AI 自身能力上限的訓練方法,也成了現在很多團隊的研究方向,但還在起步階段。

除了專業研究團隊之外,關心 AI 的網友們也在用自己的辦法追蹤著 AI 能力的變化。

有人每天讓 GPT-4 畫一次獨角獸,并在網站上公開記錄。

從 4 月 12 日開始,直到現在也還沒看出來個獨角獸的大致形態。當然網站作者表示,自己讓 GPT-4 使用 SVG 格式畫圖,與論文中的 TikZ 格式不一樣也有影響。

并且 4 月畫的與現在畫的似乎只是一樣差,也沒看出來明顯退步。

最后來問問大家,你是 GPT-4 用戶么?最近幾周有感到 GPT-4 能力下降么?歡迎在評論區聊聊。

Bubeck 演講:

https://www.youtube.com/watch?v=qbIk7-JPB2c

張弋訪談:

https://xyzfm.link/s/UfTan0

每天一個 GPT-4 獨角獸

https://gpt-unicorn.adamkdean.co.uk

參考鏈接:

[ 1 ] https://news.ycombinator.com/item?id=36134249

[ 2 ] https://twitter.com/nabeelqu/status/1663915378265800705

[ 3 ] https://twitter.com/OfficialLoganK/status/1663934947931897857

[ 4 ] https://discord.com/channels/974519864045756446/1001151820170801244

[ 5 ] https://twitter.com/mattshumer_/status/1663744527448829954

[ 6 ] https://www.reddit.com/r/ChatGPT/comments/13xik2o/chat_gpt_4_turned_dumber_today/

[ 7 ] https://help.openai.com/en/articles/6825453-chatgpt-release-notes

[ 8 ] https://twitter.com/fchollet/status/1664036777416597505

[ 9 ] https://news.ycombinator.com/item?id=36155267

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

在线欧美精品国产综合五月_国产精品免费久久久久影院_国产精品久久久久无码av_a级毛片黄免费a级毛片

      
      

        色综合久久久久综合体| 久久精品水蜜桃av综合天堂| 欧美国产成人在线| 日韩黄色片在线观看| 97超碰欧美中文字幕| 亚洲国产一区二区在线播放| 日韩美女一区二区三区四区| 亚洲最新视频在线播放| 成人一区二区三区视频 | 视频在线观看91| av激情综合网| 亚洲va欧美va国产va天堂影院| 91精品国产综合久久福利软件| 亚洲欧美另类在线| 国产91色综合久久免费分享| 亚洲精品免费在线播放| 精品欧美一区二区在线观看| 午夜视频在线观看一区二区| 久久这里只有精品6| 91国内精品野花午夜精品| 中文字幕乱码亚洲精品一区 | 色狠狠综合天天综合综合| 国产日韩欧美制服另类| 久久激情综合网| 中文字幕一区二区三| 91精品国产品国语在线不卡| 亚洲综合视频网| 91片在线免费观看| 在线观看一区二区精品视频| 最近日韩中文字幕| 成人免费av资源| 色噜噜狠狠成人网p站| 亚洲视频在线一区观看| 丁香啪啪综合成人亚洲小说 | 久久综合五月天婷婷伊人| 日韩av成人高清| 国产精品久99| 欧美草草影院在线视频| 麻豆中文一区二区| 综合久久久久久| 久久日韩精品一区二区五区| 久久99国产精品久久99 | 国产精品免费视频网站| 欧美一区二区三区免费| 日韩av中文字幕一区二区三区| 国产精品你懂的在线欣赏| 日韩精品一区二区三区视频播放| 免费观看久久久4p| 亚洲在线视频网站| 国产精品久久久久影院亚瑟| 成人晚上爱看视频| 欧洲精品视频在线观看| 亚洲韩国精品一区| 国产精品久久久爽爽爽麻豆色哟哟 | 中文字幕视频一区| 国产亚洲精品资源在线26u| 高清不卡一二三区| 欧美日韩一区二区三区四区五区 | av电影在线不卡| 欧美日韩一级视频| 日韩专区一卡二卡| 一区二区三区丝袜| 亚洲美女在线一区| 欧美激情在线一区二区三区| 2欧美一区二区三区在线观看视频| 国产最新精品免费| 在线亚洲一区观看| 丝瓜av网站精品一区二区| 亚洲欧美日韩小说| 亚洲日本成人在线观看| 中文字幕精品综合| 欧美国产日产图区| 久久综合色播五月| 精品国产免费视频| 成人激情视频网站| 91精品国产综合久久小美女| 久久av老司机精品网站导航| 色综合天天在线| 三级精品在线观看| 午夜影院久久久| 午夜av一区二区三区| 亚洲韩国一区二区三区| 亚洲已满18点击进入久久| 亚洲免费电影在线| 一区二区三区欧美| 有码一区二区三区| 亚洲图片欧美综合| 亚洲福利一区二区| 视频一区免费在线观看| 亚洲国产精品久久不卡毛片| 夜夜精品视频一区二区| 亚洲乱码国产乱码精品精的特点| 亚洲黄色小视频| 一区二区在线观看av| 亚洲一区二区在线播放相泽| 亚洲精品成人悠悠色影视| 樱桃视频在线观看一区| 亚洲精品国产精华液| 亚洲va韩国va欧美va精品| 亚洲一区在线播放| 天堂午夜影视日韩欧美一区二区| 午夜视频在线观看一区| 欧美aaaaaa午夜精品| 欧美午夜电影网| 国产成人啪免费观看软件| 日韩丝袜情趣美女图片| 99久久久国产精品| 久久久久国产成人精品亚洲午夜| 久久精品亚洲精品国产欧美kt∨| 国产精品久久777777| 亚洲激情第一区| 日韩不卡在线观看日韩不卡视频| 色视频成人在线观看免| 国产一区二区影院| 日韩精品影音先锋| 久久久久久9999| 成人免费视频在线观看| 一区二区国产视频| 免费在线观看不卡| 777午夜精品免费视频| 成人av影院在线| 中文字幕乱码久久午夜不卡| 亚洲图片激情小说| 日韩影院免费视频| 在线观看91av| 久久综合狠狠综合| 亚洲精品视频一区| 色综合天天综合在线视频| 国产最新精品免费| 久久久久高清精品| 亚洲欧美国产77777| 蜜臀av性久久久久蜜臀aⅴ| 6080日韩午夜伦伦午夜伦| 91美女片黄在线| 亚洲精品免费视频| 91黄色免费看| 成人97人人超碰人人99| 一区在线观看视频| 色婷婷国产精品综合在线观看| 国产69精品久久99不卡| 国产精品乱子久久久久| 亚洲一级二级三级| 国产成人自拍高清视频在线免费播放| 久久久精品免费观看| 亚洲精品亚洲人成人网| 久久66热re国产| 久久久激情视频| 亚洲国产中文字幕| 丁香五精品蜜臀久久久久99网站| 国产精品女主播av| 污片在线观看一区二区| 成人精品国产一区二区4080| 国产精品成人免费| 欧美主播一区二区三区| 91女厕偷拍女厕偷拍高清| 亚洲一区二区三区中文字幕| 欧美精品一二三| 中文在线免费一区三区高中清不卡| 午夜精品久久一牛影视| 日韩一区二区免费在线观看| 国产精品国产三级国产普通话蜜臀| 日韩精品欧美成人高清一区二区| 日韩视频永久免费| 亚洲精品免费在线| 成人性生交大片免费| 亚洲欧美日韩系列| 欧美一区二区视频在线观看2022 | 国产成人午夜视频| 亚洲欧洲日韩在线| 欧美日韩国产三级| 国产精品女主播在线观看| 久久99精品国产.久久久久| 久久青草欧美一区二区三区| 亚洲一区二区三区在线| 成年人午夜久久久| 亚洲成人免费看| 2023国产精品| 午夜精品久久久久久久久久| 91免费国产在线| 日本成人中文字幕| 日本一区二区三级电影在线观看 | 91久久线看在观草草青青| 久久天天做天天爱综合色| 视频在线观看一区| 国产亚洲一区二区三区在线观看| 午夜精品国产更新| 国产亚洲综合色| 国产综合久久久久久鬼色 | 国产一区二区在线看| 亚洲欧美电影院| 精品美女被调教视频大全网站| 亚洲影院在线观看| 久久久亚洲欧洲日产国码αv| 免费成人在线网站| 国产精品久久久久精k8| 51精品视频一区二区三区| 亚洲精品欧美综合四区| jiyouzz国产精品久久| 日本不卡高清视频| 国产精品久久久久久久久久免费看|