Bing Chat 越來越“傻”,可微軟卻解決不了這個問題
(資料圖片僅供參考)
隨著時間的推移,AI 聊天機器人越來越不好用這件事,似乎已經(jīng)成為了全球用戶的共同體驗。其中例如微軟的 Bing Chat,即使有著 GPT-4 的支持、并打開了創(chuàng)造力模式,也經(jīng)常會出現(xiàn)經(jīng)常回避問題或是無法給出回復(fù)的情況。在海外社交媒體 Reddit 上,就有諸多網(wǎng)友吐槽 Bing Chat 已經(jīng)變得沒有樂趣可言,回答的內(nèi)容不再風(fēng)趣、不再快樂,讓人感覺是冷冰冰、沒有人性的機器。
更有甚者,在有用戶試圖要求 Bing Chat 圍繞某個虛構(gòu)人物進(jìn)行演繹時,在明知相關(guān)討論是無害的情況下,Bing Chat 居然認(rèn)為這一行為存在風(fēng)險。事實上,微軟方面也承認(rèn)了 Bing Chat 性能下降的事實,并在給出的相關(guān)回復(fù)中表示,正在積極監(jiān)測用戶的反饋,并計劃在不久的將來做出改變、以解決相關(guān)問題。其實自今年 2 月初內(nèi)測以來,New Bing 已經(jīng)經(jīng)過了大大小小的幾次更新,從一開始的 " 牛 Bing"、到后來被 " 賽博閹割 " 成 "New 病 ",再到現(xiàn)在提供精準(zhǔn)、平衡、創(chuàng)造力三種模式,微軟方面一直在試圖做一款讓所有人滿意的 AI 大模型。但現(xiàn)在看來,似乎有點適得其反了,而 ChatGPT 這類大語言模型(下文簡稱為 LLM)之所以能夠在 2022 年秋季開始走紅,在 AI 熱退燒之后重新點燃外界對于其未來的熱情,靠的就是 ChatGPT 比以往任何同類產(chǎn)品都更智能,或者說更像人。
無獨有偶,ChatGPT 如今也開始被用戶吐槽逐漸出現(xiàn)了速度變慢、回復(fù)冗長重復(fù)、聊天主題單一無趣等問題。其實這類聊天機器人產(chǎn)品性能下降并非孤立事件,在不同廠商的 LLM 中都有發(fā)生。事實上,業(yè)界也早已關(guān)注到這一現(xiàn)象。例如為了驗證 ChatGPT 的行為如何隨時間變化,斯坦福大學(xué)和加州大學(xué)伯克利分校的研究人員就測試了 GPT-4 在今年 3 月和 6 月的兩個版本,測試內(nèi)容橫跨數(shù)學(xué)問題、回答敏感問題、代碼生成和視覺推理四個部分。
最終的測試結(jié)果也確實證明了 ChatGPT 能力的衰減,例如在數(shù)學(xué)和視覺推理部分,研究人員使用了思維鏈(chain-of-thought,CoT)技術(shù),讓 LLM 來模擬人類思考的過程,并幫助其生成一個推理路徑,將復(fù)雜的推理問題分解為多個簡單的步驟,而不僅僅只是從語料庫中直接擬合出最終答案。
然而結(jié)果顯示,GPT-4 的性能發(fā)生了顯著的漂移,從 3 月到 6 月,GPT-4 關(guān)于數(shù)學(xué)問題的準(zhǔn)確率一路從 97.6% 降至 2.4%,同時回答長度也減少了超過 90%。而在視覺推理方面,6 月的 GPT-4 在部分此前在 3 月曾正確回答的查詢上,反而又出現(xiàn)了錯誤。即對于 3 月能給出正確結(jié)果的問題,6 月反而就做不到了。
如今相當(dāng)多程序員每天都在使用的 AI 編寫代碼,但研究人員發(fā)現(xiàn),在 3 月時 GPT-4 輸出的代碼中有超過 50% 是可直接執(zhí)行的,可這一數(shù)字到了 6 月就僅有 10%。而且這還不是最夸張的,在回答敏感問題方面,GPT-4 的直接回答率已經(jīng)從 21% 降至 5%,甚至在拒絕回答不當(dāng)問題時,6 月版本的 GPT-4 也傾向于不向用戶提供解釋。
通常來說,事物的發(fā)展往往是呈螺旋形上升,具體到信息技術(shù)領(lǐng)域更呈現(xiàn)出了跨越式前進(jìn)的狀態(tài)," 今不如古 " 的情況可以說是絕無僅有。那么問題就來了,出現(xiàn) " 科研靠考古 " 這種情況只有一種可能,那就是行業(yè)整體曾崩潰過、如今又在重建。但 AI 大模型可是純粹的前沿科技,并不存在類似的問題,所以這其中肯定是有蹊蹺的。目前在網(wǎng)絡(luò)上最主流的聲音,是 ChatGPT、Bing Chat 能力下降是為了平衡用戶體驗的結(jié)果。畢竟 ChatGPT 生成的內(nèi)容是需要消耗算力的,用戶越多需要的算力就會隨之增加,但 OpenAI、微軟購買算力資源的速度在這半年以來,卻無法與用戶增長相匹配,所以就導(dǎo)致了響應(yīng)速度的下降,用戶得排隊向這類產(chǎn)品提問,而且提問數(shù)量被限制的情況也早已發(fā)生。所以在這種情況下,降低性能來平衡響應(yīng)速度就是不難想到的一種解決方案。
當(dāng)然,更深層次的核心矛盾是 AI 倫理問題,也就是數(shù)月前曾引起諸多討論的 "AI 可能給人類帶來滅絕風(fēng)險 ",對于 AI 的擔(dān)憂甚至讓 OpenAI 創(chuàng)始人奧特曼走上了美國參議院的聽證會,更讓他這幾個月來一直在全球各地 " 布道 "。不受控制的 AI 會成為毀滅人類文明的罪魁禍?zhǔn)祝@無疑是科幻小說的一個重要題材,因此對于 AI 失控的擔(dān)憂也是這一技術(shù)自誕生以來就存在的。由此也衍生出了一個控制 AI 的概念 "AI 對齊 ",即要求 AI 系統(tǒng)的目標(biāo)要與人類的價值觀和利益對齊,使其符合設(shè)計者的利益預(yù)期,不會產(chǎn)生意外的有害后果,比如生成各種不當(dāng)言論等內(nèi)容。事實上,微軟、OpenAI 這列企業(yè)搞 AI 對齊是必然,例如微軟在 2016 年發(fā)布的聊天機器人 Tay 就曾出現(xiàn)過發(fā)表種族歧視內(nèi)容的情況,也直接導(dǎo)致它出師未捷身先死。
但強行讓 AI 遵守人類的價值觀本身就是反直覺的事情,想要讓 AI 與人類對齊,開發(fā)者就需要指定正確的目標(biāo)函數(shù),需要證實應(yīng)當(dāng)提供什么樣的反饋才能正確引導(dǎo) AI。此外甚至還需要證明提供這些反饋是合理的,而這無疑堪稱是當(dāng)下難以解決的技術(shù)難題。那么問題也就來了,如果想要讓一個人不胡思亂想,并矯正其思維模式,最直接的方式是什么?當(dāng)然是諾貝爾獎中的黑歷史前腦葉白質(zhì)切除術(shù)了,直接就把人類的思維能力從物理層面消滅。回到 AI 領(lǐng)域也是一樣,由微軟研究院發(fā)布的一篇論文證實對 AI 大模型所進(jìn)行的任何 AI 對齊行為,都會損失其準(zhǔn)確性和性能,因為 ChatGPT 這類產(chǎn)品是基于人類反饋的強化學(xué)習(xí)來構(gòu)建智能,人工強行干預(yù)的 AI 對齊會阻礙大模型對任務(wù)理解的真實程度。所以自然而然的,AI 大模型的性能就出現(xiàn)了開局即巔峰的情況。
但無論是算力緊張、還是 AI 倫理限制,短時間來看幾乎都是無解的,因此用戶體驗高開低走也是必然,相關(guān)企業(yè)也不太可能解決得了這一問題。【本文圖片來自網(wǎng)絡(luò)】
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
3 年投入 10 億,淘寶天貓死磕互聯(lián)網(wǎng)家裝
淘寶天貓聯(lián)合菜鳥加碼家居供應(yīng)鏈對阿里來說,互聯(lián)網(wǎng)家裝這塊骨頭,再硬
2023-08-16
相關(guān)閱讀
-
Bing Chat 越來越“傻”,可微軟卻解決不了這個問題
隨著時間的推移,AI聊天機器人越來越不好用這件事,似乎已經(jīng)成為了全球
-
3 年投入 10 億,淘寶天貓死磕互聯(lián)網(wǎng)家裝
淘寶天貓聯(lián)合菜鳥加碼家居供應(yīng)鏈對阿里來說,互聯(lián)網(wǎng)家裝這塊骨頭,再硬
-
消息稱富士康開始在印度生產(chǎn)蘋果 iPhone 15 手機
IT之家8月16日消息,據(jù)媒體報道,蘋果公司的代工廠富士康已經(jīng)在印度南
-
“寧王”競拍落敗的 63 小時,鋰電行業(yè)已變了天!
圖片來源@視覺中國文|華夏能源網(wǎng)上次競拍如此激烈,恐怕還是在房地產(chǎn)如
-
波音任命柳青為波音中國總裁
IT之家8月16日消息,波音公司今日宣布柳青將擔(dān)任波音中國總裁,該任命
-
反腐風(fēng)暴下的醫(yī)藥 IPO:年內(nèi) 13 家企業(yè)終止上市,ipo 進(jìn)度放緩,規(guī)則調(diào)整
本文來源:時代周報作者:金子莘一場聲勢浩大的醫(yī)藥反腐風(fēng)暴正席卷全國
-
股民不買賬!吉比特擬 10 派 70 元,真是大手筆嗎?
追蹤市場熱點,歡迎關(guān)注中新經(jīng)緯《董秘請回答》欄目中新經(jīng)緯8月16日電(
-
高端新能源車集體降價!Model Y 長續(xù)航版殺入 30 萬以內(nèi),不到 27 萬能買極氪 001
本文來源:時代周報作者:王賀沒人能買到最便宜的特斯拉。8月14日,特
-
短劇涌向小程序
圖片來源@視覺中國文|文娛價值官,作者丨劉娜娜,編輯丨美圻短視頻平臺
-
8 月 16 日 A 股分析:滬指跌 0.82%,房地產(chǎn)板塊逆勢走強
2023年8月16日,截止收盤,滬指跌0 82%,報收3150 13點;深成指跌0 94%
-
小孩子意外險怎么報銷?報銷要注意什么?
當(dāng)孩子發(fā)生意外事故后,家長需要第一時間將孩子送往醫(yī)院進(jìn)行治療,并在
-
重疾險和社保的區(qū)別是什么?重疾險應(yīng)該怎么買?
重疾險和社保是兩種不同的保險制度,它們在保障范圍、保障金額、理賠條
-
支付寶重疾險怎么買最合適?怎么樣?
首先,購買支付寶重疾險前,我們需要了解自己的保險需求。不同的人有不
-
兒童保險報銷需要哪些資料?報銷多久到賬?
在進(jìn)行兒童保險報銷時,家長需要準(zhǔn)備一些必要的資料。首先,需要提供孩
-
橫琴一號增額終身壽險有風(fēng)險嗎?在哪買?
任何一種投資都存在一定的風(fēng)險,橫琴一號增額終身壽險也不例外。但是相
-
誰能實現(xiàn)造車夢?賈躍亭親手交付一輛車,恒大汽車中東“金主”三年零營收
8月14日,命運多舛的法拉第未來(FF)與恒大汽車雙雙傳來消息。法拉第
-
特斯拉中國ModelS/X再降價,最高優(yōu)惠7萬
特斯拉中國ModelS X再降價,最高優(yōu)惠7萬8月16日,從特斯拉官方處獲悉,
-
阿聯(lián)酋金主身份被起低,恒大汽車5億美金戰(zhàn)投水月鏡花
阿聯(lián)酋金主身份被起低,恒大汽車5億美金戰(zhàn)投水月鏡花8月14日宣布對中國
-
高溫下,那些奮戰(zhàn)一線的“勞動剪影”
立秋已過,多地氣溫仍居高不下。許多勞動者默默奮戰(zhàn)在崗位一線,用堅守
-
茶百道向港交所提交上市申請
截至2023年8月8日,茶百道在全國共有7117家門店,遍布全國31個省市,實
-
特斯拉再降價,純電市場再現(xiàn)“價格戰(zhàn)”
特斯拉將年初掀起的價格戰(zhàn)延續(xù)到了下半年。8月14日,特斯拉宣布對旗下
-
00 后暑假打工生存指南:一小時 4 塊錢,玩轉(zhuǎn)資本家
圖片來源@視覺中國文|五環(huán)外OUTSIDE,作者|劉奕然,編輯|車卯卯經(jīng)濟(jì)獨
-
134 億歲,天文學(xué)家測量 Maisie 星系生成于大爆炸 3.9 億年后
IT之家8月16日消息,詹姆斯韋伯太空望遠(yuǎn)鏡于2022年6月發(fā)現(xiàn)了Maisie星系
-
比亞迪汽車鼓勵舉報腐敗行為,獎金可達(dá) 500 萬元甚至更高
IT之家8月16日消息,廉潔比亞迪公眾號今日發(fā)布消息稱,公司鼓勵全體員
-
騰訊音樂付費用戶破億,直播風(fēng)險管控使社交娛樂收入大幅下滑
圖片來源:視覺中國用戶為音樂版權(quán)的付費的意識正在增強,無論是在為他
-
傳承文明之光,陶醉魅力東方!仰韶彩陶坊酒登陸CCTV1-《大國品牌》!
8月15日,仰韶酒業(yè)品牌片正式登陸CCTV-1。仰韶品牌故事片集中展現(xiàn)了
-
業(yè)界認(rèn)為有兌付風(fēng)險的信托公司仍是少數(shù)
近期,部分上市公司持有的中融信托產(chǎn)品逾期兌付事件持續(xù)發(fā)酵。一家信托
-
最近一個月 19 只基金大額贖回
8月15日,又有基金公告旗下產(chǎn)品出現(xiàn)大額贖回,華富恒利C宣布提高凈值精
-
上半年 20 萬場演出,票房收入 170 億, “演唱會經(jīng)濟(jì)”還不止這些
圖片來源@視覺中國文|鏡象娛樂,作者丨栗子酒2023年,井噴的演唱會徹底
-
比亞迪審計監(jiān)察處:鼓勵舉報腐敗行為 最高獎 500 萬元
比亞迪審計監(jiān)察處通過廉潔比亞迪微信公眾號發(fā)文稱,公司鼓勵全體員工、
精彩推薦
閱讀排行
精彩推送
- “寧王”競拍落敗的 63 小時,...
- Zb建模blender綁定(zb建模)
- 保薦機構(gòu)“撤單” 大洋世家沖擊...
- 如何替父母查詢養(yǎng)老保險?如何查...
- 中英人壽重疾保險有哪些類別?銀...
- 60歲可以買商業(yè)養(yǎng)老保險嗎?怎么買?
- 一年意外險保費多少?保障范圍有...
- 瑞泰超級瑪麗重疾險怎么樣?購買...
- Lordstown與Karma達(dá)成4,000萬美元和解協(xié)議
- 恒大回應(yīng)許家印離婚傳聞:不清楚...
- 你每天用來打卡的釘釘,居然藏著...
- 中國足協(xié)開罰單:鎖喉對手,辱罵...
- 宏利重疾險保什么?報銷范圍有哪...
- 國泰健康福重疾險怎么樣?怎么買?
- 團(tuán)建意外險怎么買?賠償多少?
- 男公務(wù)員有沒有生育險?怎么報銷?
- 意外險作用和功用有哪些?如何選...
- 反腐風(fēng)暴下的醫(yī)藥IPO:年內(nèi)13家...
- 又來了一個新品牌
- 國機重裝:公司在柬埔寨擁有售電...
- 華大基因2023中報解讀:營收凈利雙降
- 陽光100中國:海通國際證券針對...
- 賈躍亭:FF 品牌永遠(yuǎn)不會推出低...
- 天天問我七夕禮物送什么,抄我同...
- 華為 MateBook 眾多新品升級 ...
- 央視曾銳評視覺中國:知識產(chǎn)權(quán)市...
- 印度不再從中國進(jìn)口智能手機 “...
- 水井坊,解決渠道庫存已到關(guān)鍵時...
- 子彈上膛!“全球貨幣保衛(wèi)戰(zhàn)”正...
- 騰訊音樂:罕見暴雷,又回磨底期





