在线欧美精品国产综合五月_国产精品免费久久久久影院_国产精品久久久久无码av_a级毛片黄免费a级毛片

首頁 > 新聞 > 智能 > 正文

天天訊息:「大一統」大模型論文爆火,4 種模態任意輸入輸出,華人本科生 5 篇頂會一作,網友:近期最不可思議的論文

2023-05-28 13:22:18來源:ZAKER科技  

多模態大模型,終于迎來 " 大一統 " 時刻!


(相關資料圖)

從聲音、文字、圖像到視頻,所有模態被徹底打通,如同人腦一般,實現了真正意義上的任意輸入,任意輸出

要知道,多模態一直是學術界公認要達到更強智能的必經之路,連GPT-4都在往這個方向發展。

也正是因此,這項來自微軟、北卡羅來納大學教堂山分校的新研究一經 po 出,立即在社交媒體上爆火,有網友驚嘆:

這是我最近見過最不可思議的一篇論文!

究竟有多不可思議?

只需告訴大模型,想要 " 一只玩滑板的泰迪熊 ",并輸入一張照片 + 一段聲音:

它立刻就能精準 get 要點,生成一段在下雨天在城市里玩滑板的心碎小熊錄像,仔細聽還會發現配上了新的雨聲

效果太過于鵝妹子嚶,以至于不少網友表示 " 有被嚇到 ":

還有網友感嘆 " 新時代的到來 ":

等不及看到創作者們用這些 AI 工具制作各種沉浸式故事體驗了。這簡直給 RPG 角色扮演游戲賦予了全新的意義。

值得一提的是,一作 Zineng Tang 雖然本科還沒畢業,但他已經在 CVPR、發了 6 篇頂會論文,其中5 篇都是一作

所以,這個號稱能夠 " 轉一切 "(any-to-any)的大一統大模型,實現效果究竟如何?

4 種模態隨意選,打出 " 組合拳 "

大模型 CoDi,具有任意輸入和輸出圖、文、聲音、視頻 4 種模態的能力。

無論是單模態生成單模態(下圖黃)、多模態生成單模態(下圖紅)、還是多模態生成多模態(下圖紫),只要指定輸入和輸出的模態,CoDi 就能理解并生成想要的效果:

先來看單模態生成單模態

輸入任意一種模態,CoDi 都能聯想并輸出指定的模態,例如,輸入一張風景圖像,就能輸出 " 山景,日出 " 這樣的文字提示詞:

或是輸入一段鐵軌碰撞聲,就能生成一張地鐵圖像:面對多模態生成單模態時,CoDi 威力同樣不減。

輸入一張 " 熊貓吃竹子 " 圖像,加上一段 " 在咖啡桌上吃 " 的文字要求:

CoDi 就能生成一段大熊貓坐在咖啡桌旁吃竹子的視頻:或是輸入一組文字提示詞 " 油畫,恐怖畫風,優雅復雜的概念藝術,克雷格 · 穆林斯(CG 繪畫之父)風格 ",加上一段拍打木板的水聲:

CoDi 在經過聯想后,就能輸出一張精致的、氣勢恢宏的黃昏時分海盜船畫像:

最后來看看多模態生成多模態的效果。

給 CoDi 提供一段鋼琴聲,加上一張森林中的照片:

CoDi 就能想象出一段 " 在森林中彈鋼琴 " 的文字,并配上對應的插圖:要知道在這之前,AI 生成的視頻不少都沒有配音,停留在老式的 " 無聲電影 " 階段。

然而 CoDi 不僅能生成視頻,還能生成搭配視頻食用的聲音。

例如根據一個 " 天空中的花火 " 文字提示詞 + 一段對應的音頻,就能生成一個帶有爆炸聲音的煙花錄像:

所以,CoDi 究竟是如何做到理解不同的模態,并 " 打出組合拳 " 的?

用 " 對齊 " 來節省大模型訓練數據

事實上,CoDi 的打造面臨兩個難點。

首先是缺少訓練數據的問題,以作者們能收集到的數據集為例:

無論是像 Laion400M 這樣的文圖數據集、還是像 AudioSet 之類的音頻文字數據集,或是油管上的圖像音視頻數據集,以及 Webvid10M 之類的視頻數據集,都屬于 " 單模態生成單個或兩個模態 " 的類型。

然而,多模態大模型的訓練數據需求,隨著模態數量的增加呈指數級增長,許多輸入輸出組合,往往缺少對應的訓練數據集。

其次,已有的擴散模型大多是 1v1 的類型,如何設計并訓練模型,確保多模態輸入輸出的效果,同樣是個問題。

針對這兩個問題,作者們決定分兩個階段打造 CoDi,讓它不僅能實現單模態 " 完美輸出 "、還能做到多模態 "1+1>2"。

階段一,組合條件訓練,給每個模態都打造一個潛在擴散模型(LDM),進行組合訓練。

針對 A 模態生成 B 模態數據集缺失的問題,作者們提出了一種名為橋接對齊(Bridging Alignment)的策略。

具體來說,就是以帶文本模態的數據集為 " 中介 ",對齊另外幾種模態的訓練效果。

以音頻生成圖像為例。

雖然音頻生成圖像數據集不多,但文本生成音頻、文本生成圖像的數據集卻有不少,因此可以將這兩類數據集合并起來,用于訓練文本 + 音頻生成圖像的效果。

在此期間,文本和音頻輸入經過模型處理,會被 " 放置 " 進一個共享特征空間,并用輸出 LDM 來處理輸入輸入的組合特征,輸出對應的圖像結果。

階段二,進一步增加生成的模態數量。

在階段一的基礎上,給每個潛在擴散模型和環境編碼器上增加一個交叉注意力模塊,就能將潛在擴散模型的潛變量投射到共享空間中,使得生成的模態也進一步多樣化。

最終訓練出來的模型,雖然訓練數據類型不是 " 全能的 ",但也具備了多模態輸入、多模態輸出的能力。值得一提的是,可別以為這種方法會降低模型生成的質量。

事實上,在多種評估方法上,CoDi 均超越了現有多模態大模型的生成效果。

華人本科生,5 篇頂會論文一作

一作Zineng Tang,本科就讀于北卡羅來納大學教堂山分校,也是微軟研究院的實習生,今年 6 月將進入加州大學伯克利分校讀博。

他的研究興趣在于多模態學習、機器學習和 NLP 領域,而從大一開始,他就在 NeurIPS、CVPR、ACL 和 NAACL 等頂會上相繼發了 6 篇文章,其中 5 篇一作。

就在今年 1 月,Zineng Tang 還獲得了 2023 年的美國計算機研究學會(CRA)設立的優秀本科生研究員獎。

每年全美國能獲得這個獎項的本科生,只有 4 人

這一獎項旨在表彰在計算機研究領域有杰出研究潛力的本科生,包括 MIT、斯坦福、哈佛和耶魯大學等不少北美名校在內,每年都會提名一些優秀學生,經過層層篩選后決定獲獎者。

通訊作者Ziyi Yang,目前是微軟 Azure 認知服務研究團隊(CSR)的高級研究員,研究方向是多模態理解和生成,文檔智能和 NLP 等。

在加入微軟之前,他本科畢業于南京大學物理系,并于斯坦福大學獲得電氣工程碩士和機械工程博士學位。

通訊作者Mohit Bansal,是北卡羅來納大學教堂山分校計算機系教授。他于加州大學伯克利分校獲得博士學位,目前研究方向是 NLP 和多模態機器學習,尤其側重語言生成問答和對話、以及可解釋深度學習等。

你感覺多模態大模型發展的下一階段,會是什么樣子?

論文地址:

https://arxiv.org/abs/2305.11846

項目地址:

https://github.com/microsoft/i-Code/tree/main/i-Code-V3

參考鏈接:

[ 1 ] https://twitter.com/AviSchiffmann/status/1660771055676588033

[ 2 ] https://twitter.com/ZinengTang/status/1660726736642887681

[ 3 ] https://cra.org/2023-outstanding-undergraduate-researcher-award-recipients/

[ 4 ] https://codi-gen.github.io/

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

在线欧美精品国产综合五月_国产精品免费久久久久影院_国产精品久久久久无码av_a级毛片黄免费a级毛片

      
      

        亚洲欧美日韩成人高清在线一区| 日韩一区二区三区免费观看| 欧美精品一区二区三区一线天视频| 综合精品久久久| 久久国产乱子精品免费女| 久久毛片高清国产| 五月天欧美精品| 久久久久久久精| 日韩在线一区二区| 97超碰欧美中文字幕| 亚洲一区二区视频在线观看| 日韩你懂的在线观看| 亚洲影视在线播放| jizz一区二区| 亚洲va欧美va人人爽午夜| 久久久久久亚洲综合影院红桃| 石原莉奈一区二区三区在线观看| 99免费精品视频| 亚洲va天堂va国产va久| 国产清纯白嫩初高生在线观看91| 日产国产欧美视频一区精品| 久久久亚洲精品石原莉奈| 色婷婷综合在线| 国产日本亚洲高清| 国产中文字幕一区| 亚洲欧美区自拍先锋| 日韩免费性生活视频播放| 亚洲成人自拍网| 久久免费的精品国产v∧| 欧美色综合网站| 亚洲美女淫视频| 成人美女在线视频| 五月婷婷另类国产| 国产精品高清亚洲| 国产白丝网站精品污在线入口| 亚洲综合一区二区| 国产日韩高清在线| 国产一区二区主播在线| 一区二区三区中文字幕电影| 久久人人爽人人爽| 久99久精品视频免费观看| 1000部国产精品成人观看| 精品捆绑美女sm三区| 免费高清在线视频一区·| 亚洲色欲色欲www在线观看| 欧美大肚乱孕交hd孕妇| 毛片av一区二区三区| 亚洲色图.com| 国产欧美视频一区二区| 国产精品一区二区久久不卡| 亚洲午夜久久久久久久久久久| 国产精品久久国产精麻豆99网站| 成人一区二区三区在线观看| 91久久精品一区二区| 亚洲激情五月婷婷| 国产日韩欧美高清在线| 日韩一区二区精品在线观看| 麻豆成人91精品二区三区| 一区二区三区四区国产精品| 欧美高清在线视频| av在线这里只有精品| 欧美日本韩国一区二区三区视频 | 亚洲成人1区2区| 国产精品久久久爽爽爽麻豆色哟哟 | 337p日本欧洲亚洲大胆精品 | 青青草精品视频| 亚洲精品视频免费看| 国产精品欧美精品| 91麻豆免费视频| 日韩欧美久久久| 国产在线精品一区二区夜色| 婷婷国产在线综合| 一区二区三区不卡视频| 国产精品家庭影院| 中文字幕精品一区二区精品绿巨人| www.亚洲精品| 日韩一区二区影院| 国产精品一卡二| 欧美日韩一级视频| 蜜桃av一区二区三区电影| 亚洲自拍偷拍欧美| 亚洲一区二区三区四区在线观看| 自拍偷拍亚洲综合| 亚洲三级电影网站| 中文字幕日韩欧美一区二区三区| 国产精品乱码一区二三区小蝌蚪| 久久久久亚洲蜜桃| 国产亚洲欧洲一区高清在线观看| 成人午夜精品一区二区三区| 欧美一级日韩一级| 国产成a人亚洲| 日韩一区二区免费在线观看| 成人性生交大片免费| 欧美一区二区人人喊爽| 福利电影一区二区| 欧美xxxxxxxx| 99re热这里只有精品视频| 久久网这里都是精品| 久久这里只有精品6| 国产三级一区二区三区| 久久久91精品国产一区二区三区| 久久精品视频一区| 国产午夜亚洲精品不卡 | 久久先锋资源网| 国产免费久久精品| 国产欧美日韩激情| 亚洲私人影院在线观看| 亚洲精选一二三| 午夜影院久久久| 色狠狠av一区二区三区| 久久超碰97中文字幕| 538在线一区二区精品国产| 成人精品国产福利| 久久久亚洲欧洲日产国码αv| 久久久不卡影院| 日韩码欧中文字| 一区二区三区四区在线播放| 亚洲不卡av一区二区三区| 午夜精品成人在线| 激情综合网最新| 欧美一区二区久久| 久久夜色精品国产欧美乱极品| 国产精品少妇自拍| 亚洲日本在线视频观看| 丝袜美腿成人在线| 欧美无砖专区一中文字| 国产成人免费av在线| 久久久国产精华| 一区在线观看视频| 午夜精品久久久久久久久久久 | 国产精品996| 亚洲精品一区二区三区香蕉| 日本一区二区综合亚洲| 一区二区三区四区高清精品免费观看 | 欧美精品乱码久久久久久| 成人av资源下载| 国产精品久久影院| 亚洲综合激情另类小说区| 精品一区二区三区的国产在线播放| 日韩欧美国产一区二区在线播放| 久久久精品人体av艺术| 有码一区二区三区| 欧美在线免费视屏| eeuss影院一区二区三区 | 全国精品久久少妇| 日韩免费看网站| 中文字幕中文字幕在线一区| 日韩精品国产精品| 欧美日韩国产高清一区二区三区| 91美女片黄在线观看| 亚洲综合999| 欧美美女激情18p| 久久精品无码一区二区三区| 亚洲自拍欧美精品| 欧美精品丝袜久久久中文字幕| 久久综合一区二区| 亚洲地区一二三色| 日韩欧美亚洲国产精品字幕久久久| 欧美激情一区二区三区全黄| 婷婷国产v国产偷v亚洲高清| 欧美一区二区三区视频免费播放| 国产精品色婷婷久久58| 蜜臀av性久久久久蜜臀aⅴ | 国产日韩欧美激情| 日韩va欧美va亚洲va久久| 日韩免费看的电影| 亚洲男人天堂av网| 国产乱码精品一品二品| 国产精品久久久久久久久免费相片 | 精品视频1区2区3区| 国产欧美一区二区三区在线看蜜臀 | 久久综合九色综合欧美亚洲| 亚洲精品第1页| 国产成人免费视频网站高清观看视频 | 在线观看一区二区视频| 久久亚洲欧美国产精品乐播| 日本视频一区二区三区| 2020国产精品| 午夜精品久久久久久久| 91免费看片在线观看| 偷拍亚洲欧洲综合| 久久精品视频在线看| 在线一区二区三区四区五区 | 亚洲国产高清aⅴ视频| 色成年激情久久综合| 久久久精品天堂| 久久成人18免费观看| 自拍av一区二区三区| 欧美一区二区啪啪| 亚洲一区二区欧美日韩| 92精品国产成人观看免费 | 色婷婷久久综合| 欧美激情一区二区三区在线| 国产一区在线看| 亚洲激情一二三区| 精品国产91乱码一区二区三区| 亚洲国产精品视频| 国产欧美日韩在线视频| 国产精品一级在线| 亚洲国产视频a|