Google Imagen文本生成圖像AI工具 有限度公開到AI Test Kitchen

Google 繼推出文本生成圖像 AI 工具「Imagen」,公開了一系列 Imagen 生成的圖片後,早前正式有限度地亮相並公開給大眾。Google 產品管理高級總監 Josh Woodward 表示,將會以有限的方式將 Imagen 新增到 Google 的 AI Test Kitchen 應用程式中,主要用作技術團隊收集意見,從而了解人工智能模型的能力和局限。

Google 繼推出文本生成圖像 AI 工具「Imagen」,公開了一系列 Imagen 生成的圖片後,早前正式有限度地亮相並公開給大眾。Google 產品管理高級總監 Josh Woodward 表示,將會以有限的方式將 Imagen 新增到 Google 的 AI Test Kitchen 應用程式中,主要用作技術團隊收集意見,從而了解人工智能模型的能力和局限。

Imagen 是什麼?

Imagen 是文字生成圖像的擴散模型(Diffusion Model),可以解析用家輸入的文字,深度理解文字意義,然後輸出像相片般的寫實圖像。Imagen 由 Google 旗下深度學習與人工智慧科研專案團隊 Google Brain 負責,建於大型 Transformer 語言模型之上,因此擁有強大的文字理解能力,透過擴散模型便能生成高畫質的圖像。

如何與 Imagen 互動?

Imagen 怎麼用?目前為止,有兩種方式與 Imagen 互動,包括:City Dreamer 和 Wobble。

    • City Dreamer:這與 SimCity 中看到畫像類似,用戶可以在這模式中輸入圍繞城市設計的不同元素,例如南瓜、牛仔布或顏色等。Imagen 便會隨之創建與之相乎的城鎮廣場、公寓樓、機場等不同建築物和土地。

    • Wobble:這與 Pixar 中的 Monsters 類似,用戶現要創作一個小怪物,可以 可以先選擇粘土、毛氈、杏仁糖、橡膠不同材質,然後選擇衣服,Imagen 模型便會根據文字生成小怪物。你還可為它起名字,戳戳小怪物讓它動起來。

Imagen 與 DALL-E 2 比較

Google 利用 DrawBench 圖像模型基準測試,評估 Imagen 的文字生成圖像能力。結果顯示,比較 VQ-GAN、LDM 及 DALL-E 2 等不同類型工具,Imagen 生成的圖像逼真度更高,語言理解能力更好,亦較符合輸入的文字,偏好率更高達 50%。簡單而言,DALL-E 2 容易混淆多個顏色指令的文字,相反 Imagen 則能準確地為圖像配色。

Imagen 發展與挑戰

1. 社會影響

Imagen 與其他文字生成圖像系統一樣,都存有被誤用的潛在風險,所以社會各界都有要求開發商提供負責任的原始碼的聲音

2. 嚴重依賴數據庫

目前市場上文字生成圖像模型對數據的要求,導致研究人員過份依賴大型、大部分未經整理的、網路抓取的數據集。縱使近年演算法快速進步,但這種性質的數據庫往往帶有社會刻板印象、壓迫性觀點、對邊緣群體有所貶損等「有毒」資訊。

資料來源:ImagenThe VergeITdaily、Google

AI AI Test Kitchen Diffusion Model Google Google AI 人工智能 文字生成圖像 谷歌
ad_20240416_summer2024_b
ad_20231005_future_design_b
ad_20231006_kids_trial_class_b
Related Posts:

商湯科技近日推出「商量」SenseChat AI,主打粵語能力和香港在地化體驗。到底 SenseChat App 如何下載,與 ChatGPT 比較起來又有甚麼過人之處?讓 Preface TechBites 為你仔細分析!

提到 AI 工具,除了 ChatGPT 和 Claude 以外其實還有更多選擇。讓 Preface TechBites 為你介紹 Perplexity AI,一款無須 VPN 即可使用的 AI 搜尋引擎,更有力挑戰 Google 的王者地位!

由 ChatGPT 推出以後,AI 的發展一日千里,我們該如何展望行業發展前景?就讓 Preface 與你拆解 2024 年 AI 的最新趨勢!

OpenAI 近日正式發布了名為 Sora 的全新文字生成短片 AI 模型。雖然 Sora 尚未開放於香港或其他地區公開試用,但 Preface 將會帶你了解更多資訊,由 Sora 教學到收費均一應俱全!

卡塔爾世界盃2022揭幕,FIFA引入SAOT助理球證判斷越位之外,足球賽場內外都有各種科技應用,包括「智慧城市」管理系統、AI人工智能檢查人群、AR擴增實境轉播賽事等。Preface馬上介紹今屆卡塔爾世界盃中的3大科技應用!