前言

Midjourney 是目前世界上社群成長最快的生成藝術(Generative Art)工具,已成為近期的熱門話題。部分的人認為藝術創作已經擁抱了AI人工智慧,生成式AI創作將會是未來藝術發展的方向,而向AI輸入指令這門「詠唱術」甚至也被視為相當需要技巧的管理學問。近期 Midjourney 最新功能,發佈了「描述(describe)」功能,只要向 Midjourney 輸入一張圖片,AI自動幫你寫成 Midjourney 指令,或是看看在 Stable Diffusion 生成的圖片源自哪些材料。

本文就帶你來認識Midjourney的最新功能。

圖/Midjourney

介紹 Midjourney

Midjourney是一款運用人工智慧生成藝術創作的工具。使用者無需學會高超的繪畫技巧或電腦技術,構思好喜歡的美術風格、希望在畫面上的要素,在官方介面上輸人關鍵字,短時間內就可以生成圖像,不但效率高,畫面也相當精緻。

從工程的角度來說,Midjourney 就是結合深度學習的自然語言處理(NLP)及生成對抗網路(GAN)的演算法實現的前端工具。每次輸入關鍵字後,系統會搜尋資料庫中相關的圖片,加以解構重組後生成特定風格與元素的作品。總體而言,比起上一代的工具 Disco Diffusion 和現有的其他工具,MJ 具備更好的可操作性、生成速度、畫面品質。

雖然輸入任何關鍵字都能生成圖片,但若想生成特定風格、構圖的圖像,使用者必須在關鍵字描述上多下功夫,就像是施展魔法前要「詠唱」咒語一般,因此網友也打趣稱擅於使用AI繪圖的人「詠唱師」。

圖/Midjourney

Midjourney 最新功能,從圖片反推到文字「詠唱」更輕鬆

Midjourney 近期發布了一項新的「

描述」

功能,可將圖像轉換為文字。Midjourney 團隊認為這個工具將在創造力和發現方面改變你的語言視覺過程。描述的功能最厲害的地方在於,上傳一張圖片,就可以轉換成文字,而這些字詞可以再輸入Midjourney生成全新、相關聯的圖片。

簡單來說,Midjourney 學會了從圖片反推到提示詞(prompt)。

這項功能也為圖像描述帶來更重要的意義:

  1. 改進的可訪問性:
  2. 圖像描述使得有視覺障礙或閱讀困難的人更容易訪問數字內容。這是通過用於 Web 顯示的 ALT 文本元素完成的。
  1. 增強的可搜索性:
  2. 描述可以通過搜索引擎啟用更好的搜索功能和索引。
  1. 用於字幕:
  2. 字幕可以包含描述,使圖像更加清晰。
  1. 詳細提示:
  2. 描述可用於創建更詳細的提示以製作新變體。它們可以為快速工程提供靈感。

Midjourney 會根據上傳的圖片生成四種不同的描述,並且可以輕鬆生成新的圖片。


Midjourney 最新功能 使用方法

本文透過 Paul DelSignore 的分享,來跟大家介紹最新功能的使用方式:

step1、在文字的區域中輸入/describe,就會出現一個拖放欄位,讓使用者可以上傳一張圖片。


step2、上傳圖片後,點擊進入


step3、Midjourney 會根據圖片生成四個描述,讓使用者選擇最適合的


底部的四個數字是活躍的混合按鈕——每個數字都與相應的描述相匹配,單擊數字將根據新描述重新混合圖像,使用者還可以透過混音修改生成圖片的描述:

生成原始圖片描述:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors

這是 Midjourney 生成的描述的提示之一,並使用混合功能修改描述:

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts 有根的抽像大腦樹的圖像,採用馬克亨森的風格,發光的顏色,黑暗的象徵主義,詳細的解剖結構,大膽的線條,鮮豔的色彩,心理現象插圖,明暗對比木刻

透過混音修改的描述後,使用 Midjourney 產出新的圖片:

圖/ Paul DelSignore 在 Midjourney 製作


Midjourney 的提示詞可以很簡單,也可以是自然語言。但是要產生最符合使用者所想的圖片,就必須使用特有的語法了,因為Midjourney的機器人不像人類那樣理解語法、句子結構或單詞。因此,/describe 對於AI生成圖像的新手而言非常有幫助。

外國網友實測

目前在 Twitter上網友的測試結果看來,最新功能再次生產的圖片都有至少七成以上的相似度。也有網友透過修改 /describe 生成出來的敘述文字,來調整不那麼滿意的圖片;雖然結果可能不完全是使用者想要的產出結果,但從圖像生成文字來描述已經是AI一大突破。


Paul DelSignore 上傳一張 NASA 宇航員的照片,並讓 Midjourney 描述並生成了一個新版本的 AI 宇航員。

原始的照片 Josh Valcarcel/NASA

由 Midjourney 透過敘述生成新的AI圖片/Paul DelSignore


還有人想到,可以用 /describe 來進行品牌 logo 的升級。如此一來,既可以延續此前的品牌辨識度,又帶來了全新的形象。

總結

本篇文章介紹了 Midjourney 最新功能「描述」,讓使用者可以自動根據輸入的圖片生成相關聯的提示詞,進而生成新的圖片。Midjourney 團隊表示,這項功能將在創造力和發現方面改變使用者的語言視覺過程。此外,本文也介紹了 Midjourney 工具的使用方式,讓讀者可以快速了解並體驗最新功能,AI 繪畫也正式進入一個新的階段。