全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

哈啰大家好,好久不見啦~~2025 年好呀~~這里是和你一起探索 AIGC 美學邊界的戲呱皮 DC。大家可以叫我呱呱。最近網上爆火的巨物卡通 IP 占領人類城市系列的視頻,大家有看過嗎?呱呱也在小紅書發布了這個內容的創意視頻~

相關教程:

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱在視頻介紹中附上了步驟,其中最重要的一步就是在一個叫 Whisk 的 AI 網站上,先生成一張超現實的創意圖片。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

然后再通過類似可靈、海螺這些視頻類的 AIGC 工具,將圖片轉成視頻并剪輯優化而成,關于這個方向的案例呱呱會在后面詳細展示實操步驟。但是呱呱本次文章教程并不單單只是講清楚這個案例的做法,今天呱呱會給大家帶來關于這個 whisk 的全方位攻略。呱呱會從 10 個案例入手,帶大家一起認識和玩轉這個免費的、好玩的 AI 網站。仍然是一如既往的又干又充實,記得點贊+收藏啦~~話不多說,直接開始今天的攻略學習吧~~

什么是 Whisk

在開始實操之前,我們先簡單介紹一下 whisk。

Whisk 呢是谷歌推出的 AI 圖像生成工具,支持用戶上傳圖像指定生成圖像的主題、場景和風格,無需長文本提示。 用戶能為每個類別提供多張圖像,或用谷歌自動填充的 AI 生成圖像作為提示。Whisk 能快速視覺探索,支持用戶編輯底層提示優化結果。說白了呢,就是一款不需要調節參數無腦上手的創意出圖網站。

Whisk 的主要功能

  1. 圖像提示生成:用戶能上傳圖像提示,AI 生成新圖像。
  2. 多圖像輸入:用戶能為主題、場景和風格分別提供多張圖像,指導 A1 生成具有特定特征的圖像。
  3. 自動圖像提示:如果沒有合適的圖像,用戶用谷歌自動填充的 AI 生成圖像作為提示。
  4. 額外細節添加:用戶在生成流程的最后階段用文本框輸入額外的文字細節,進一步指導圖像的生成。
  5. 圖像生成與調整:Whisk 生成圖像后,用戶能對結果進行查看和調整。

Whisk 的生圖原理

Whisk 的原理并不復雜,它會根據你提供的圖片生成對應的文字描述,再將這段描述作為提示文字返回給 AI,從而生成相應的新圖片,完成“圖生圖”的過程。

在技術層面上,Whisk 的后端使用 Gemini 模型自動為輸入的圖片生成詳細描述,之后將這些描述輸入到 Google 最新的圖像生成模型 Imagen 3 中,這一過程并非對原圖的簡單復制,而是通過捕捉圖像的特點,在風格與內容上進行重塑,從而幫助用戶實現主題、場景和風格的自由混合與創新。

Google 在官網中表示,Whisk 的設計初衷是“快速進行視覺探索,而非像素級的精準編輯”。這種定位使 Whisk 更適用于創意發散的初期階段,幫助用戶快速試驗不同的視覺風格與構圖。同時,Google 也承認 Whisk 有時可能“未能完全達到預期”,因此提供了編輯提示輸入的功能,確保用戶能夠輕松地修正優化生成結果。
通過不同設計方向的使用測試,Whisk 給了呱呱很大的驚喜。呱呱相信隨著 Google 不斷優化其 AI 模型,Whisk 有望成為提升設計師創意效率的 AIGC 工具。

Whisk 的官網地址

網址:https://labs.google/fx/zh/tools/whisk

Whisk 的使用要求和費用

  1. 使用要求:需要用谷歌賬號進行登錄,且只有美區的上網節點才可以打開
    (這一點只要你能魔法上網,選擇區服是美國區域的即可)
  2. 費用說明:免費的

Whisk 的實操案例

案例一:萬物皆可變玩偶

① 進入whisk生圖主頁面

whisk 的生圖頁面非常簡單和直接,可以看到主頁面只有三個區域:樣式設定區、圖片添加和生成區、可選圖片區。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

whisk 網站樣式設定區默認是 3 個選項:貼紙、琺瑯徽章和長毛絨。(至于如何設定其他樣式,后面呱呱會講到)

咱們打開網站后,可以看到左側是一張玩偶的預覽圖,對應的就是網站的 PLUSHIE(長毛絨)的樣式。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱碎碎念:

你可以理解為樣式選擇“長毛絨”后,放置在主題位置的任何圖片,都會被 whisk 轉換為長毛絨質感,即「萬物即可長毛絨」。

②選擇主題圖并直出玩偶效果

這一步,我們可以先拿 whisk 網站已有的素材圖,測試下效果。(拿 whisk 提供的粉色咖啡杯為例)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱注釋:

whisk 這個頁面中,不需要找提交或者什么按鈕,就把圖片拖動到對應位置后。該圖片周邊一圈變成滾動的螞蟻線就是在運行了。也就是說只要咱們把圖拖上到指定位置,whisk 就默認你要生圖就直接運行了。(不能取消的哦,免費的取消它干啥~~)

那么如何上傳自己的圖呢?(步驟見下圖↓)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

③進入圖片優化頁面

回到前面我們轉化的那張粉色咖啡杯的圖,可以看到生成的預覽圖中,我們的粉色杯子確實轉化成了長毛絨質感的。但是紋路圖案不太對,這時候怎么辦呢?如何優化修正呢?如圖,咱們就點擊預覽圖下方的功能按鈕“在工具中打開”,我們會跳轉到一個新的頁面。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

可以看到新頁面中簡單明了的劃分了 3 個操作區:生成圖預覽區、關鍵詞輸入區(支持中文輸入)和設定區。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱注釋:

關鍵詞輸入框處如果是做的 IP 類的或者細節很多的內容建議還是用 deepl 的英文翻譯比較好。谷歌的翻譯有些內容不準確,呱呱實測。

④優化生成的圖片

把鼠標移動到咱們生成的其中一張圖上,可以看到圖片上浮現了幾個功能按鈕。

左上角有:優化和編輯圖像

右上角是:點贊、下載和刪除

左下角是:標記

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

此時,如果選中的圖中沒有我們想要的某部分,我們可以選擇左上角第一個功能“優化”,去添加對應的提示詞生成新的圖。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

比如此處呱呱想在左側圖片上添加這樣的內容:

碟子是長毛絨質感的,背景有長毛絨質感的蓬松的云朵。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

可以看到圖中,背景有了長毛絨質感的蓬松云朵,但是杯子和碟子全部沒有了長毛絨質感。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑤編輯生成圖的提示詞

此時,咱們直接選擇左上角第二個功能按鈕:“編輯圖像”。

當我們點擊這個“編輯圖像”,并進入提示詞后,我們會看到我們生成圖所對應的一大串提示詞內容。咱們翻譯過來看下都寫的什么~

A pastel pink teacup and saucer, appearing to be made of a soft, plush material, sits against a background of similarly textured, fluffy pink clouds. The teacup is round with a slightly flared rim and a curved handle, decorated with small, evenly spaced, slightly raised pastel blue-lavender circles on a pastel pink background. The saucer is round, with an iridescent finish displaying subtle rainbow-like shifts in color. The teacup contains a pale, almost transparent liquid.

粉紅色的茶杯和茶托似乎由柔軟的毛絨材料制成,背景是質地相似、蓬松的粉紅色云朵。茶杯呈圓形,杯沿略微外擴,杯柄呈弧形,粉色背景上飾有均勻分布、微微凸起的粉藍色-淡紫色小圓圈。茶托是圓形的,表面有彩虹般的微妙色彩變化。茶杯中裝有淡淡的、幾乎透明的液體。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

從圖片對應的提示詞中可以看到,關于杯子的長毛絨質感并沒有那么明確和細節。所以此時呱呱把提示詞按照需要的效果內容進行調整,并復制到輸入框中(此處呱呱用的是 deepl 翻譯網站,比較準確):

網址:https://www.deepl.com/zh/translator

中文:

一個淡粉色的茶杯和茶碟,是由柔軟的長毛絨材料制成的,坐落在同樣紋理蓬松的粉紅色云的背景上。這款長毛絨材質的茶杯是圓形的,邊緣微微張開,手柄彎曲,在淡粉色的背景上裝飾著間距均勻、密集的、微微凸起的淡藍色薰衣草長毛絨小圓圈。長毛絨材質的碟子是圓形的,帶有彩虹色的飾面,在顏色上呈現出微妙的彩虹般的變化。茶杯里的液體也是長毛絨質感的。整個場景都是長毛絨質感的。

Deeple 翻譯:

A pale pink teacup and saucer, made of soft plush material, sits against a background of similarly textured fluffy pink clouds. Rounded with slightly splayed edges and curved handles, the plush teacup is decorated with evenly spaced, dense, slightly raised pale blue lavender plush circles against a pale pink background. The plush-material saucer is round with a rainbow-colored finish that presents a subtle rainbow of variations in color. The liquid in the teacup is plush. The whole scene is plush.

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱碎碎念:

此時看到這張圖片對應的提示詞,以及可以編輯的這個操作。有沒有悟了~谷歌的 whisk 就是把咱們的主題圖片和樣式圖片進行了讀取和對應提示詞的提取,并綜合在一起去出了一張圖。悟了吧~原理是很簡單粗暴好理解的~

⑥效果過程展示

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑦其他主題圖轉化嘗試

前面我們以“whisk 平臺提供的圖片”+“長毛絨樣式”的組合方式,詳細拆解了如何使用 whisk 進行毛絨玩偶化的步驟和優化操作。現在讓我們看看建筑、人物照片、插畫等不同出圖條件下 whisk 的表現:

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑧億點技巧

前面呱呱給大家展示了關于「萬物皆可變毛絨玩偶」的很多圖片轉化案例,這里呱呱總結了一點小技巧分享給大家:

1) 進入首頁后,點擊功能按鈕“從頭開始”,使用圖片+提示詞來綜合控制出圖效果。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

2) 簡單畫面建議沒有提示詞直出。

3) 復雜畫面則建議除了提供參考圖,還需要輸入盡量準確詳細的提示詞。

如果細節很多,還是要仔細描述清楚的,不然 whisk 自行掃描提取語義信息肯定會有不理想的情況。

4) IP 類內容的提示詞盡量用自己翻譯檢查后的英文。

從最后一個派大星的案例中可以看出,我們直接輸入中文,讓 whisk 后臺自行翻譯的英文輸出的圖片效果不理想。而當我們把內容自行用網易有道或者 deepl 翻譯成英文再復制過來使用的時候,派大星的形象才是對的。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

案例二:萬物皆可變貼紙

從這個案例開始,呱呱就帶大家直接進入可編輯可控制效果的生圖頁面進行操作了。

① 進入whisk生圖可編輯頁面

在 whisk 主頁下方,找到“從頭開始”,點擊進入更自主化的生圖頁面。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

② 設定樣式和尺寸

選擇左上角的三條杠,調出樣式設定和尺寸設定,設定自己需要的尺寸和樣式。

此處呱呱設定的樣式是 Sticker(貼紙),尺寸選擇默認的 Landcape(16:9)的。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

③選擇或者上傳一張設計圖

當我們把樣式選擇好后,生圖頁面上“樣式”區域的參考圖則已經打上“√”了。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

這時候我們需要做的則是把“主題”圖片上傳好或者用文本輸入好,本次示例呱呱選擇使用圖片。第二個類型 SCENE(場景)的圖片可有可無,看個人選擇。如果你選擇上傳一張場景,則生成圖的參考圖為:主題參考圖+SCENE(場景)參考圖。

此處呱呱使用 WHISK 的一個功能“篩子”,讓系統隨機的生成不同的圖來測試效果。

呱呱注釋:“篩子”功能就是搖骰子,系統會隨機給出一張主題圖,一張 SCENE 圖,一張樣式圖。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱碎碎念:

每次點擊篩子按鈕后,主題、SCENE(場景)和樣式都會隨機增加一張圖。

④生成看效果

呱呱只是測試效果此處就不寫提示詞,點擊“→”直接生成合并圖片了。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑤其他圖片轉化貼紙的嘗試效果

如果想用自己的圖片,同時又不想刪除前面的圖。則可以使用 WHISK 的“添加更多”功能。這個功能可以自由的在選擇的類型下添加 1 個空白的圖片框(每次點擊只能選擇一個類型添加,每次一張圖,但可以無限點擊)。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

本次教程呱呱全程都是用的上傳圖片,因為 WHISK 最擅長的就是“圖生圖”。下面是呱呱用其他類型的圖的效果測試,大家可以看下效果。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑥億點技巧

當我們使用場景比較復雜的圖進行圖生圖的時候,不寫提示詞往往畫面很不準確。比如下圖這張國風質感的場景,細節很多,不好描述。直出或者結合原圖的中文提示詞或者英文提示詞效果都差一點。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

這時候我們可以這樣做:

1) 使用 joy1 反推圖片,得到場景的具體提示詞

網址:https://huggingface.co/spaces/fancyfeast/joy-caption-pre-alpha

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

This is a vibrant, digital illustration depicting a serene Asian woman in a traditional Chinese outfit. She is positioned centrally in the image, her eyes closed and her hands pressed together in a prayer-like gesture. Her long, dark hair is styled in an elaborate updo adorned with white and yellow flowers. She wears a white silk robe with intricate green embroidery and a teal sash around her waist, adding a touch of color to her attire.

Surrounding her are two small birds perched on her shoulders, one black with a white breast, and another with a yellow breast. The background features a picturesque village scene with lush greenery and traditional Chinese houses with red-tiled roofs. In the distance, there are several figures, including a man in a blue shirt and a woman in a red dress, suggesting a festive atmosphere. The sky is a bright blue with fluffy white clouds, adding to the idyllic setting. The overall style is detailed and colorful, with a soft, watercolor-like texture that enhances the peaceful and harmonious mood of the illustration.

2) 復制反推得到的英文提示詞到輸入框,結合參考圖生成合成圖片。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

3) 點擊生成圖片的“編輯圖像”功能,把反推的提示詞再次復制進去,再次生成。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

可以看到細節優化了很多,和參考圖更像了。但因為我們在寫提示詞的時候沒有把每部分場景都和“貼紙”進行語言上的結合,所以貼紙的感覺就很弱了,這里大家根據自己需要選擇是優化提示詞還是簡單化。

案例三:萬物皆可變琺瑯別針

① 進入whisk生圖可編輯頁面

同前面步驟一樣的,呱呱就不多贅述了。

② 設定樣式和尺寸

選擇左上角的三條杠,調出樣式設定和尺寸設定,設定自己需要的尺寸和樣式。
此處呱呱設定的樣式是 Sticker(貼紙),尺寸選擇默認的第一個選項:Landcape,也就是(16:9)的。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

③ 使用系統提供的主題圖或者自己上傳一張。

當我們把樣式選擇好后,生圖頁面上“樣式”區域的參考圖則已經打上“√”了。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

接著是上傳主題圖,呱呱是使用 whisk 的“搖色子”功能讓系統隨機給出一張主題圖和一張 SCENE 圖和一張樣式圖。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

④寫提示詞

如果是簡單的內容,可以不寫。此處呱呱是為了給大家演示步驟,就不去仔細編輯提示詞了。此處呱呱直接根據網站提示,點擊“→”生成合并圖片。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑤生成看效果

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

⑥優化圖片提示詞

如果想調整優化效果,可以點擊圖片的“優化”或者“編輯圖像”功能,對提示詞進行優化。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

也可以直接點擊圖片,進入“編輯圖像”頁面,優化提示詞。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

呱呱碎碎念:切記,whisk 的邏輯就是識別圖片生成該圖片的提示詞,圖片+圖片=提示詞+提示詞

④ 其他圖片轉化琺瑯別針的嘗試效果

如果想用自己的圖片,同時又不想刪除前面的圖。則可以使用 WHISK 的“添加更多”功能。這個功能可以自由的在選擇的類型下添加 1 個空白的圖片框(每次點擊只能選擇一個類型添加,每次一張圖,但可以無限點擊)。

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

其他效果如圖:

全網最干喂飯教程!10個案例帶你全方位玩轉WHISK(上)

上篇暫告一段落,想學的記得關注我和優設網哦。

*標題“全網”指代優設網。

收藏 93
點贊 68

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。