更多CG新聞
MORE CG News
Introducing ERNIE‑Image by Baidu
【百度開源 ERNIE-Image:文本生成圖像新突破】
百度 ERNIE 團隊宣布推出開源文本生成圖像模型 ERNIE-Image及 ERNIE-Image-Turbo . 該模型具備 100 億參數規模 , 利用混合專家架構顯著強化了對複雜描述的理解力, 能精準創造出細節豐富且符合邏輯的高品質圖片. 效果針對“插圖”、“短漫畫”及“海報”類型的圖片生成 .
該模型基於 Diffusion Transformer (DiT) 架構, 僅 8B 參數即在 GenEval、OneIG、LongTextBench 等基準測試中奪得開源模型第一名 .
ERNIE-Image 特別強調 Precise Text Rendering 與 Structured Visual Generation, 能在中文與英文場景下生成 高可讀文字, 並精準處理海報、漫畫分鏡等複雜結構. 其 Prompt Enhancer (PE) 技術可將簡短輸入轉化為更完整的提示, 顯著提升生成品質.
ERNIE-Image模型提供 SFT 與 Turbo 版本, 支援消費級 GPU 運行, 並已於 GitHub 開源, 採用 Apache-2.0 授權 .

Pixie – AI-Powered Local Image Organizer
【Pixie 推出 AI 本地圖像管理工具】
Pixie 由 Bogdan Bogdanović 開發, 已於 Gumroad上架, 售價 25 美元
這款 AI-powered image organizer 主打「完全本地運行」, 確保使用者的圖片資料不會外洩
Pixie 提供 AI Auto-Tagging、Smart Organization、Instant Search 及 Batch Processing 等功能, 並支援 PNG、JPG、GIF、WebP 等多種格式. 其最大特點是與 Adobe Photoshop 的整合, 讓設計師能直接將圖片導入 Smart Object.
而Pixie 檔案大小僅 168 MB, 支援 Windows 系統, 定位為專業創作者的高效工具.
FLUX.2 [klein]: Towards Interactive Visual Intelligence
【輕巧版本FLUX.2 – FLUX.2[klein]推出】
Black Forest Labs推出 FLUX.2[klein] , 基於FLUX.2的一款全新高速整合AI模型, 此模型體積相對較小, 優先考慮低延遲, 可在不到一秒的時間內完成影像生成, 可在配備 13GB 顯存的家用電腦上運行, Black Forest Labs 聲稱, 在最新的消費級硬體上, 它可以在不到半秒的時間內生成或編輯圖像.
– 速度:Sub-second inference 提供即時生成與編輯能力.
– 品質:Photorealistic outputs + 高多樣性,提升影像真實感.
– 整合性:Unified generation and editing 支援多種工作流程.
– 硬件需求:4B model 適合 consumer GPUs 降低門檻.
– 開放性:Apache 2.0、open weights 讓開發者可自由使用與調整.
– 部署彈性:API 或本地運行皆可, 適合不同場景.

Qwen-Image-Edit-2511: Improve Consistency
【Qwen-Image編輯圖像又升級】
中國科技巨頭阿里巴巴旗下的Qwen系列AI模型發布了“ Qwen-Image-Edit-2511” 一致性再提升, 相較於Qwen-Image-Edit-2509, 進行了包括一致性提昇在內的多項增強
Qwen-Image-Edit-2511 的主要特性包括:
– 提升了角色一致性
– 整合了Lora能力,例如打光、多場景
– 提升了工業設計能力
– 提升了幾何推理能力

The new ChatGPT Images is here
【全新 ChatGPT Images 現已推出】
OpenAI發布了新版 ChatGPT Images– 其中包含全新的圖像生成模型 GPT Image 1.5. 該模型旨在更可靠地反映用戶意圖 , 由不論是從零開始創作, 還是編輯照片, 都能得到用戶想像中的輸出.
它能精準進行編輯同時保留細節, 並將生成速度提升最高 4 倍 , 同時, OpenAI在 ChatGPT 中引入全新 Images 功能, 旨在讓影像生成變得愉快——激發靈感, 並讓創意探索變得輕而易舉. 全新 Images 模型已在 ChatGPT 中向所有用戶推送, 並以 GPT Image 1.5 名稱在 API 中提供 .
新版 ChatGPT Images 體驗亦已開始向大多數用戶推送 . Business 與 Enterprise 版本稍後開放 !!
FLUX.2 is here
【免費下線AI生成模型 FLUX.2 推出】
自Black Forest Labs推出 FLUX.1 推出以來, 已成免費離線AI生成圖像及影片定下了高品質的標準, 到日前終於推出最新 FLUX.2 , 官方表示這是專為真實世界創作工作流程而設計, 而非僅限於展示或娛樂用途. 它能生成高品質影像, 同時維持跨多張參考影像的角色與風格一致性, 遵循結構化提示、讀寫複雜文字、遵守品牌指南, 並可靠處理燈光、布局與Logo . FLUX.2 更能在高達 4 megapixels 的解像度下編輯影像, 同時保留細節與一致性 !
FLUX.2 主要特點包括 Multi-Reference 支援 , 更高的細節、更銳利的紋理 , 複雜排版文字生成, 加強 Prompt改善 , 更接地於真實世界知識 及 影像編輯支援高達 4 megapixels 解像度等等 !!
現提供FLUX.2 [pro] / FLUX.2 [flex] 及FLUX.2 [dev] 三個模型下載 , 亦表示即將推出輕量級模型版本 FLUX.2 [klein]