Midjourney 使用 Stable Diffusion 嗎?

Midjourney 使用 Stable Diffusion 嗎?

隨著 AI 的進步,您現在擁有大量服務,可以幫助您從頭開始創造任何東西,甚至是藝術。最近出現的流行工具之一是 Midjourney,這是一種 AI 圖像生成器,可以在幾秒鐘內使用文本提示創建令人驚嘆的藝術品。

Midjourney 使用 Stable Diffusion 嗎?

在網絡上進行簡單的搜索就會發現 DALL-E 和 Stable Diffusion 等圖像生成工具使用了何種技術。例如,Stable Diffusion 使用由慕尼黑 CompVis 小組開發的潛在擴散模型 (LDM) 以及用於對文本進行調節的 CLIP ViT-L/14 文本編碼器。

談到 Midjourney,它的創建者沒有提供任何關於他們使用什麼訓練模型的信息,或者它們是如何組合在一起的,他們也沒有向公眾發布他們的源代碼。在撰寫本文時,該工具目前在其於 2023 年 3 月 15 日發布的 V5 模型上運行。它是對基於全新 AI 架構和代碼庫的 V4 模型的升級。

Midjourney 表示,新模型是他們自己設計的,並在他們自己的 AI 超級集群上進行了訓練。Midjourney 的 V5 模型支持高 Coherency,並提供 V4 模型上的所有其他高級功能,如圖像提示、多重提示,以及為生物、地點和物體添加更小細節的能力。

雖然它沒有聲稱使用 Stable Diffusion,但推測 Midjourney V5 模型中所做的更改導致圖像看起來與通過 Stable Diffusion v2 製作的圖像非常相似。因此,Midjourney 有可能使用不同版本的潛在擴散模型,為 Stable Diffusion 提供支持或共享 Stable Diffusion v2 的某些元素。

Midjourney 與 Stable Diffusion 有何不同

基於各自的操作,Stable Diffusion 鼓勵開源模型,因為它共享其源代碼供其他人使用或開發。任何人都可以使用它的代碼並通過使用 Stable Diffusion 以他們想要的方式微調配置來設計自己的模型。Midjourney 的情況並非如此,因為該公司將其圖像生成工具作為專有產品提供,他們聲稱自己開發和訓練模型並且尚未發布源代碼供其他人使用。

在輸入方面,Midjourney 將使用您的主要概念並添加自己的元素來生成圖像。在此過程中,您輸入的一些關鍵字可能會在生成過程中被忽略,因為該工具將使用相關顏色、照明和其他元素創建自己的迭代。如果您希望在 Stable Diffusion 上複製這些圖像,則必須提供比您在 Midjourney 上輸入的內容更長的提示和更多詳細信息。

在 Stable Diffusion 上創建的圖像可能看起來與您使用 DALL-E 生成的圖像相似且隨機。Midjourney 的輸出有時看起來很獨特,通常傾向於更暗或更戲劇化的背景。您可以在 Midjourney 上使用合適的提示創建外觀獨特的圖像,而如果您希望在 Stable Diffusion 上生成它們,則可能需要添加更多細節並更加具體。這可能是好事也可能是壞事,具體取決於您要利用的自定義級別。

在使用方面,Stable Diffusion 為您提供了創建更多圖像的庫,因為它可以免費使用,而且在大多數情況下,您擁有您生成的圖像的權利。另一方面,Midjourney 只提供有限的試用版,您可以使用它來生成最多 25 個作品。之後,您可能需要訂閱他們的付費套餐,這可能會讓您每月損失 8 至 48 美元,並且您的使用權可能會因您訂閱的計劃而異。

關於 Midjourney 是否使用 Stable Diffusion,您只需了解這些即可。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *