在线欧美精品国产综合五月_国产精品免费久久久久影院_国产精品久久久久无码av_a级毛片黄免费a级毛片

首頁 > 新聞 > 智能 > 正文

熱門:用 GPT-4 實現可控文本圖像生成,UC 伯克利 & 微軟提出新框架 Control-GPT

2023-05-31 13:11:32來源:ZAKER科技  

機器之心報道


(相關資料圖)

編輯:小舟、梓文

擴散模型雖好,但如何保證生成的圖像準確高質量?GPT-4 或許能幫上忙。

文本到圖像生成領域近兩年取得了很大的突破,從 GAN 到 Stable Diffusion,圖像生成的速度越來越快,生成效果越來越好。然而,AI 模型生成的圖像在細節上還有很多瑕疵,并且使用自然語言指定對象的確切位置、大小或形狀存在一定的困難。為了生成精準、高質量的圖像,現有方法通常依賴于廣泛的提 prompt 工程或手動創建圖像草圖。這些方法需要大量的人工工作,因此非常低效。

最近,來自加州大學伯克利分校(UC 伯克利)和微軟研究院的研究者從編程的角度思考了這個問題。當前,用戶能夠使用大型語言模型較好地控制代碼生成,這讓該研究看到了編寫程序來控制生成圖像細節的可能,包括物體的形狀、大小、位置等等。基于此,該研究提出利用大型語言模型(LLM)生成代碼的功能實現可控型文本到圖像生成。

論文地址:https://arxiv.org/pdf/2305.18583.pdf

該研究提出了一個簡單而有效的框架 Control-GPT,它利用 LLM 的強大功能根據文本 prompt 生成草圖。Control-GPT 的工作原理是首先使用 GPT-4 生成 TikZ 代碼形式的草圖。如下圖 1 ( c ) 所示,程序草圖(programmatic sketch)是按照準確的文本說明繪制的,隨后這些草圖被輸入 Control-GPT。Control-GPT 是 Stable Diffusion 的一種變體,它能接受額外的輸入,例如參考圖像、分割圖等等。這些草圖會充當擴散模型的參考點,使擴散模型能夠更好地理解空間關系和特殊概念,而不是僅僅依賴于文本 prompt。這種方法使得 prompt 工程和草圖創建過程不再需要人為干預,并提高了擴散模型的可控性。

我們來看一下 Control-GPT 方法的具體細節。

方法

對圖像生成來說,訓練過程的一個較大挑戰是缺乏包含對齊文本和圖像的數據集。為了解決這個難題,該研究將現有實例分割數據集(例如 COCO 和 LVIS)中的實例掩碼轉換為多邊形的表示形式,這與 GPT-4 生成的草圖類似。

然后,該研究構建了一個包含圖像、文本描述和多邊形草圖的三元數據集,并微調了 ControlNet。該研究發現這種方法有助于更好地理解 GPT 生成的草圖,并且可以幫助模型更好地遵循文本 prompt 指令。

ControlNet 是擴散模型的一種變體,它需要額外的輸入條件。該研究使用 ControlNet 作為基礎圖像生成模型,并通過編程草圖和 grounding token 的路徑對其進行擴展。

框架

如下圖 2 所示,在 Control-GPT 中,首先 GPT-4 會根據文本描述生成 TikZ 代碼形式的草圖,并輸出圖像中物體的位置。然后該研究用 LATEX 編譯 TikZ 代碼,將草圖轉換為圖像格式,再將編程草圖、文本描述和物體位置的 grounding token 提供給經過調優的 ControlNet 模型,最終生成符合條件的圖像。

使用 GPT-4 生成的草圖訓練 ControlNet 是必要的,因為預訓練的 ControlNet 不理解生成的草圖,不能將其轉換為現實圖像。為了 prompt GPT-4,該研究要求用戶遵循如下的 prompt 樣本,以讓 GPT-4 請求 TikZ 代碼片段的結構化輸出,以及相關物體的名稱和位置。然后,該研究使用 GPT-4 的輸出來編譯草圖圖像并獲得 grounding token。LLM 繪制草圖的準確性如何

Control-GPT 的精度取決于 LLM 生成草圖時的準確性和可控性。因此,該研究對 LLM 在草圖生成方面的性能進行了基準測試。實驗結果表明 GPT 系列模型在草圖生成方面明顯優于 LLaMa 等開源模型,并且 GPT-4 在遵循文本指令方面表現出驚人的高準確性(約 97%)。

該研究對 Control-GPT 和一些經典模型的生成結果進行了人工評估,結果表明當圖像中包含兩個不相關的罕見物體組合時,一些模型的生成效果比較差,而 Control-GPT 的生成結果相對較好,如下表 2 所示:

查詢 LLMs,生成一個 TikZ 代碼片段來描述給定的文本,進而檢查 LLMs 的性能。如下表 1 所示,GPT-series 模型的大多數代碼片段都可以編譯為有效的草圖,而 LLaMA 和 Alpaca 的輸出要么是空的,要么不可運行。在 GPT-series 模型中,最新的 GPT-4 在 95 個查詢中只有 3 次失敗,這些查詢成功地生成了有效草圖,在遵循文本指令方面的成功率大約有 97%。ChatGPT 是 GPT-3.5 的 RLHF 微調版本,其性能明顯低于原始 GPT-3.5。在調優過程中,聊天能力和代碼生成之間可能存在著權衡。在下圖 4 中,研究者提供了一個來自 GPT 系列模型的可視化草圖例子。雖然生成的草圖不如照片那樣逼真,但它們往往能捕捉到語義,并正確推理出物體的空間關系。生成的草圖經常出人意料地通過簡單的代碼片斷來正確處理物體形狀。

下圖最后一行展示了 GPT-4 的一個失敗案例,即模型無法生成物體形狀,而 GPT-3.5 卻能給出一個正確的草圖。GPT-4 在草圖生成方面的高精度帶來的啟發是:可以使用它來提高圖像生成模型的可控性。

實驗

基于 Visor 數據集,研究者對 Control-GPT 進行了一系列實驗設置的評估,測試其在空間關系、物體位置和大小方面的可控性。他們還將評估擴展到多個物體和分布外的 prompt。廣泛的實驗表明,Control-GPT 可以大大提升擴散模型的可控性。

下表 3 中列出了定量評估結果。可以看到,Control-GPT 模型可以在給定的一些規格下更好地控制物體的大小和位置。與幾乎無法控制物體位置和尺寸的 Stable Diffusion 模型(SD-v1.5)相比,Control-GPT 將總體精度從 0% 提高到 14.18%。與現成的 ControlNet 相比,Control-GPT 在所有指標上也取得了更好的表現,獲得了從 8.46% 到 4.18% 的整體改善。這些結果展示了本文的 LLM 集成框架在更細化和精確控制圖像生成過程方面的潛力。

視覺化。下圖 6 展示了定性評估結果,可以看到,ControlGPT 可以按照物體位置和尺寸的規范繪制物體。相比之下,ControlNet 也能遵循,但卻很難生成正確的物體,而 Stable Diffusion 則無法遵循規范。對空間關系的消融實驗。研究者還探討了模型是否對不同類型的空間關系(如左 / 右 / 上 / 下)有偏好,作為空間關系基準分析的一部分。從下表 4 中可以看出,Control-GPT 在 Visor Score 和物體準確性方面一直比所有的基線模型工作得更好。多個物體之間的關系。研究者對 Control-GPT 生成多個物體的能力進行了進一步的評估,這些物體的空間關系由 prompt 指定。下圖 7 展示了一些例子,Control-GPT 能理解不同物體之間的空間關系,并在 GPT-4 的幫助下將它們放入布局中,表現出了更好的性能。可控性與圖像逼真度。通常,在生成逼真圖像與遵循精確布局之間往往存在著妥協,特別是對于分布外的文字 prompt。如下圖 8 所示,(a)是一個例子,生成的圖像完全遵循布局,但這導致了圖像中的一些偽影;而在(b)中,照片往往看起來很逼真,但沒有很好地遵循草圖。更多研究細節,可參考原論文。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

在线欧美精品国产综合五月_国产精品免费久久久久影院_国产精品久久久久无码av_a级毛片黄免费a级毛片

      
      

        亚洲影视资源网| 久久综合网色—综合色88| 国产日韩亚洲欧美综合| 亚洲超碰精品一区二区| 岛国av在线一区| 一区二区免费视频| 日韩色视频在线观看| 一区二区三区在线观看国产| 国产精品一区2区| 亚洲欧美日韩久久| 日韩午夜激情视频| 一区二区国产盗摄色噜噜| 东方欧美亚洲色图在线| 一区二区三区在线免费播放 | 一区二区国产视频| 国产不卡视频一区| 亚洲激情网站免费观看| 日韩欧美国产三级电影视频| 亚洲午夜精品在线| 99国产精品国产精品久久| 婷婷久久综合九色综合绿巨人| 国产欧美一区二区三区在线看蜜臀 | 久久新电视剧免费观看| 日本成人中文字幕在线视频| 国产偷v国产偷v亚洲高清 | 日本不卡视频在线| 中文字幕+乱码+中文字幕一区| 欧美日韩国产综合久久| 依依成人综合视频| 99国产精品国产精品毛片| 色老头久久综合| 国产精品灌醉下药二区| 国产成人精品亚洲日本在线桃色| 亚洲一区在线电影| 欧美激情在线看| 国产成人av一区二区三区在线观看| 亚洲欧美另类综合偷拍| 久久综合九色综合欧美98| 麻豆精品新av中文字幕| 国产精品成人免费| 精品国精品国产| 激情文学综合丁香| 亚洲一区二区四区蜜桃| 亚洲欧美在线观看| 99精品欧美一区二区三区小说| 色乱码一区二区三区88| 亚洲精品视频观看| 久久久久久久久免费| 91精品国产综合久久福利软件| 日韩av中文字幕一区二区| 国产精品久久久久久妇女6080| 精品国产免费视频| 国产在线精品视频| 亚洲一区二区三区美女| 中文字幕中文在线不卡住| 不卡的av中国片| 欧美性xxxxxx少妇| 婷婷丁香久久五月婷婷| 亚洲你懂的在线视频| 欧美激情一区二区三区不卡| eeuss鲁一区二区三区| 欧美高清你懂得| 男女男精品视频网| 亚洲一区二区在线视频| 亚洲日本韩国一区| 久久精品亚洲国产奇米99| 精品国产污网站| 国产成人精品三级麻豆| 欧美日本韩国一区二区三区视频| 日韩av一二三| 午夜精品福利在线| 亚洲主播在线播放| 综合久久久久久久| 18成人在线观看| 国产偷国产偷亚洲高清人白洁| 337p日本欧洲亚洲大胆精品| 国产乱码字幕精品高清av| 欧美日韩一二三区| 久久福利视频一区二区| 色菇凉天天综合网| 性欧美疯狂xxxxbbbb| 依依成人综合视频| 一区二区在线免费| 亚洲精品乱码久久久久久久久| 自拍视频在线观看一区二区| 日本一区二区免费在线观看视频| 久久精品免费在线观看| 99精品视频在线播放观看| 2欧美一区二区三区在线观看视频| 福利电影一区二区三区| 日韩女优视频免费观看| 成人综合日日夜夜| 日韩你懂的电影在线观看| 成人动漫视频在线| 久久综合久久99| 久久亚洲精品国产精品紫薇| 久久青草欧美一区二区三区| 96av麻豆蜜桃一区二区| 久久精品亚洲精品国产欧美kt∨| 99久久伊人精品| 久久嫩草精品久久久精品一| 久久综合色天天久久综合图片| 国产校园另类小说区| 久久久美女毛片| 国产精品不卡在线| 亚洲色图欧美偷拍| 亚洲午夜精品17c| 亚洲成人综合在线| 另类小说欧美激情| 欧美绝品在线观看成人午夜影视| 国产成人日日夜夜| 久久综合99re88久久爱| 国产亚洲综合性久久久影院| 中文字幕中文字幕在线一区 | 亚洲美女淫视频| 洋洋av久久久久久久一区| 无吗不卡中文字幕| 欧美午夜寂寞影院| 国产高清精品久久久久| 久久综合九色综合欧美就去吻| 国产日韩欧美一区二区三区综合| 国产精品国产馆在线真实露脸| 亚洲视频一区在线| 秋霞影院一区二区| 欧美精品1区2区| 99re这里都是精品| 国产精品欧美经典| 亚洲九九爱视频| 麻豆91在线看| 精品日韩在线观看| 国产精品污www在线观看| 亚洲一区二区三区小说| 欧美在线免费观看视频| 国产91精品一区二区麻豆亚洲| 国产三级一区二区| 一区二区三区在线观看国产| 美国av一区二区| 日韩午夜激情电影| 中文字幕精品三区| 性欧美疯狂xxxxbbbb| 欧美精品自拍偷拍动漫精品| 91伊人久久大香线蕉| 亚洲人成网站色在线观看| 午夜不卡av在线| 风间由美一区二区三区在线观看 | 国产精品你懂的在线| 亚洲精品水蜜桃| 精品在线免费观看| 久久这里只有精品首页| 最新成人av在线| 久久精品国产澳门| 久久美女艺术照精彩视频福利播放| 国产精品国产精品国产专区不蜜| 日本不卡一区二区三区高清视频| 日韩女优毛片在线| 亚洲欧美一区二区不卡| 久久精品国产亚洲高清剧情介绍| 久久综合狠狠综合| 亚洲一本大道在线| 成人精品视频一区| 亚洲欧美精品午睡沙发| 欧美日韩一区二区三区免费看 | 亚洲黄色免费电影| 欧美美女黄视频| 国产精品美女久久久久aⅴ| 奇米一区二区三区| 久久精品夜色噜噜亚洲a∨| 伊人色综合久久天天人手人婷| 国产精品一二三区在线| 中文字幕亚洲不卡| 欧美日韩久久久| 国产精品福利一区| 韩日精品视频一区| 自拍偷拍欧美精品| 欧美高清精品3d| 成人免费在线视频观看| 国产一二三精品| 亚洲欧美日韩系列| 欧美精品亚洲二区| 国产精品国产三级国产aⅴ中文| 经典一区二区三区| 亚洲婷婷综合久久一本伊一区 | 亚洲黄色片在线观看| 日韩一区二区三区免费看 | 老司机免费视频一区二区| 中文字幕不卡在线播放| 在线免费一区三区| 国产精品美女久久久久久久| 国产真实乱偷精品视频免| 亚洲欧美另类久久久精品2019| 欧美一区二区成人6969| 亚洲精品伦理在线| 91在线免费视频观看| 日本不卡一二三区黄网| 国产精品免费视频网站| 欧美久久一区二区| 尤物在线观看一区| 久久影院视频免费| 九九视频精品免费| 一区二区成人在线观看|