Google 旗下 DeepMind 於 8 月 26 日推出全新圖像編輯模型 Gemini 2.5 Flash Image,代號 Nano Banana,引爆全球熱潮。
Watch this Gemini 2.5 Flash Image (aka Nano Banana 🍌) tutorial from @GoogleDeepMind DevRel Engineer @patloeber, and start integrating the model into your apps.
— Google AI Developers (@googleaidevs) September 5, 2025
Key moments:
00:00 Introduction
00:32 AI Studio
01:25 Project Setup
03:16 Image creation
05:47 Image editing
06:58… pic.twitter.com/g9WLYVzLhY
Nano Banana 更進一步登陸 Leonardo.Ai 平台,讓更多創作者能直接體驗這款模型的強大功能。與此同時,社交媒體亦掀起「3D 公仔」洗版潮,網民爭相將自拍或寵物相片轉換成迷你公仔模型,成為最新的 AI 爆紅玩法。
用戶實測:快又細緻
在多間科技媒體的實測中,Tom’s Guide 以九個不同提示詞同時比較 ChatGPT-5 與 Nano Banana,結果顯示 Nano Banana 在奇幻動物、魔法場景等題材更具故事感和能量感,不過 ChatGPT 在古市集等需要寫實細節的場景依然較勝一籌。
How to generate the current trending Gemini AI action figures:
— Dr.Thillli PhD 🎷🧬🎸🧬🎺🧬🎤🧬🥁🧬 (@thil_sek) September 10, 2025
Upload ur photo and select #NanoBanana mode and give the prompt accordingly.
Some prompts:
ORIGINAL: Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real… pic.twitter.com/tUQmfe2dGG
簡單指令也能做到
另有文章形容,Nano Banana 在執行文字指令時相當精準,用一句「make the jacket red」就能立即改變效果,但仍有局限,例如細面孔表現不佳、解析度仍限制在 1024×1024,以及多角色場景有時會出現不穩定。有概覽文章亦提到,它在語境編輯、人像一致性同空間邏輯上有優勢,每日更提供免費使用名額,對 casual 用戶相當吸引,但未算全面碾壓其他平台。
X@akiramenaiwoman
社群聲音:驚喜與不滿並存
不少設計師分享實測經驗,有人認為 Nano Banana 在換衣服等任務表現「一流」,但質素大致只與 Midjourney 相若,未必比 ChatGPT 明顯更強。有用戶更抱怨,約一半時間模型聲稱已完成修改,但實際輸出卻毫無變化,需要反覆嘗試。有人指出,只要提示詞夠細緻,成品細節會更好,有時候經過多輪對話修正,反而能解決初期的錯位問題。
X@@thil_sek
普通玩家最在意的地方
速度和易用性是最多人提到的優點。Nano Banana 只需十秒左右即可生成圖像,對於想快速做社交平台貼文的用戶特別方便。不過,人物或物件的一致性仍然是痛點,如果角色在不同場景「走樣」,體驗就會大打折扣。另一個常見問題是,有時候生成結果沒有任何改動,用戶唯有轉回手動修圖。至於價錢,很多人未必願意長期訂閱,因此免費或低成本選項仍然有市場。
APP STORE截圖
工具箱的一員,而非唯一答案
綜合現時的評測和玩家回饋,Nano Banana 的確帶來幾個驚喜:生成速度快、人物唔易跑樣、而且對自然語言 prompt 相當友好。但要留意,它並不是 Photoshop 的替代品,仍有輸出不穩定的時候。對一般用戶而言,最理性的做法或許是將它視為工具箱的一員:要玩社交貼文可以用 Nano Banana,要追求藝術風格就用 Midjourney,需要高自由度就試 Stable Diffusion,而重視寫實與細節控制的情況下,ChatGPT 仍然有一席位。
AP圖片