About Us

Blog

Sign In

Google Imagen文本生成圖像AI工具有限度公開到AI Test Kitchen

Google 繼推出文本生成圖像 AI 工具「Imagen」，公開了一系列 Imagen 生成的圖片後，早前正式有限度地亮相並公開給大眾。Google 產品管理高級總監 Josh Woodward 表示，將會以有限的方式將 Imagen 新增到 Google 的 AI Test Kitchen 應用程式中，主要用作技術團隊收集意見，從而了解人工智能模型的能力和局限。

Google 繼推出文本生成圖像 AI 工具「Imagen」，公開了一系列 Imagen 生成的圖片後，早前正式有限度地亮相並公開給大眾。Google 產品管理高級總監 Josh Woodward 表示，將會以有限的方式將 Imagen 新增到 Google 的 AI Test Kitchen 應用程式中，主要用作技術團隊收集意見，從而了解人工智能模型的能力和局限。

Imagen 是什麼？

Imagen 是文字生成圖像的擴散模型（Diffusion Model），可以解析用家輸入的文字，深度理解文字意義，然後輸出像相片般的寫實圖像。Imagen 由 Google 旗下深度學習與人工智慧科研專案團隊 Google Brain 負責，建於大型 Transformer 語言模型之上，因此擁有強大的文字理解能力，透過擴散模型便能生成高畫質的圖像。

如何與 Imagen 互動？

Imagen 怎麼用？目前為止，有兩種方式與 Imagen 互動，包括：City Dreamer 和 Wobble。

Imagen 與 DALL-E 2 比較

Google 利用 DrawBench 圖像模型基準測試，評估 Imagen 的文字生成圖像能力。結果顯示，比較 VQ-GAN、LDM 及 DALL-E 2 等不同類型工具，Imagen 生成的圖像逼真度更高，語言理解能力更好，亦較符合輸入的文字，偏好率更高達 50%。簡單而言，DALL-E 2 容易混淆多個顏色指令的文字，相反 Imagen 則能準確地為圖像配色。

Imagen 發展與挑戰

1. 社會影響

Imagen 與其他文字生成圖像系統一樣，都存有被誤用的潛在風險，所以社會各界都有要求開發商提供負責任的原始碼的聲音

2. 嚴重依賴數據庫

目前市場上文字生成圖像模型對數據的要求，導致研究人員過份依賴大型、大部分未經整理的、網路抓取的數據集。縱使近年演算法快速進步，但這種性質的數據庫往往帶有社會刻板印象、壓迫性觀點、對邊緣群體有所貶損等「有毒」資訊。

資料來源：Imagen、The Verge、ITdaily、Google

AI AI Test Kitchen Diffusion Model Google Google AI 人工智能文字生成圖像谷歌

ad_202450507_summer2025_exp_day_b

Related Posts:

Related Posts Cover Image 0

Just Start 啟動香港．重新學習｜AI 時代．為何每一位香港人都應該「主修 AI」？｜領袖的全城推動．AI 實踐之旅

在全球 AI 化的關鍵轉折點，率先公開表態「決心投入 AI 學習」的，不是科技公司工程師，而是來自金融、教育、創科與專業服務等不同領域的企業領袖與行業決策者。他們深知 AI 將重塑商業競爭力與整個城市的未來，因此選擇以行動示範——主動學習、主動轉型、主動擁抱新科技。作為香港推動 AI 教育的先行者，Preface 積極聯繫大型企業、學校及社會機構，邀請他們成為推動 AI 素養（AI Literacy）的「首批示範者」。透過跨界合作，我們希望讓領袖們以身作則，向全港學生與大眾展示。

Related Posts Cover Image 1

Poe APP、Website全中文使用教學、優缺點及收費 |和 ChatGPT 有何分別?

眾多基於AI語言模型所開發的應用之中，Poe為何能脫穎而出受到大眾的青睞呢？如果你還不知道Poe，並且躍躍欲試，那麼本文亦會提供詳細的教程，讓你了解Poe的優缺點，並知曉如何透過Poe使用並體驗最新的AI語言模型。

Related Posts Cover Image 2

OpenAI's 5 Steps Towards Artificial General Intelligence (AGI)

We first provided an overview of how OpenAI, the leading AI organisation that created ChatGPT, envisions a progression towards AGI through five distinct stages: Conversational AI, focused on language understanding and generation; Reasoning AI, enabling complex problem-solving and decision-making; Autonomous AI, acting independently within environments; Innovator AI, driving new discoveries and technologies; and Organisational AI, capable of coordinating and optimising complex systems.

Related Posts Cover Image 3

商湯科技粵語版 AI「商量 SenseChat」下載教學｜主打香港市場的 AI App｜實測比較 ChatGPT｜TechBites

商湯科技近日推出「商量」SenseChat AI，主打粵語能力和香港在地化體驗。到底 SenseChat App 如何下載，與 ChatGPT 比較起來又有甚麼過人之處？讓 Preface TechBites 為你仔細分析！

Related Posts Cover Image 4

Perplexity AI 香港中文介紹及教學｜比 ChatGPT 更方便的 AI 搜尋引擎｜Preface TechBites

提到 AI 工具，除了 ChatGPT 和 Claude 以外其實還有更多選擇。讓 Preface TechBites 為你介紹 Perplexity AI，一款無須 VPN 即可使用的 AI 搜尋引擎，更有力挑戰 Google 的王者地位！

Kids

Adults

Corporates & Schools

Lifestyle

© 2026 Preface

Privacy Terms Shop G07, G/F - 2/F Tower 535, 535 Jaffe Road, Causeway Bay, HK hello@preface.ai