Midjourney 使用 Stable Diffusion 嗎？

2023/04/07

隨著 AI 的進步，您現在擁有大量服務，可以幫助您從頭開始創造任何東西，甚至是藝術。最近出現的流行工具之一是 Midjourney，這是一種 AI 圖像生成器，可以在幾秒鐘內使用文本提示創建令人驚嘆的藝術品。

Midjourney 使用 Stable Diffusion 嗎？

在網絡上進行簡單的搜索就會發現 DALL-E 和 Stable Diffusion 等圖像生成工具使用了何種技術。例如，Stable Diffusion 使用由慕尼黑 CompVis 小組開發的潛在擴散模型 (LDM) 以及用於對文本進行調節的 CLIP ViT-L/14 文本編碼器。

談到 Midjourney，它的創建者沒有提供任何關於他們使用什麼訓練模型的信息，或者它們是如何組合在一起的，他們也沒有向公眾發布他們的源代碼。在撰寫本文時，該工具目前在其於 2023 年 3 月 15 日發布的 V5 模型上運行。它是對基於全新 AI 架構和代碼庫的 V4 模型的升級。

Midjourney 表示，新模型是他們自己設計的，並在他們自己的 AI 超級集群上進行了訓練。Midjourney 的 V5 模型支持高 Coherency，並提供 V4 模型上的所有其他高級功能，如圖像提示、多重提示，以及為生物、地點和物體添加更小細節的能力。

雖然它沒有聲稱使用 Stable Diffusion，但推測 Midjourney V5 模型中所做的更改導致圖像看起來與通過 Stable Diffusion v2 製作的圖像非常相似。因此，Midjourney 有可能使用不同版本的潛在擴散模型，為 Stable Diffusion 提供支持或共享 Stable Diffusion v2 的某些元素。

Midjourney 與 Stable Diffusion 有何不同

基於各自的操作，Stable Diffusion 鼓勵開源模型，因為它共享其源代碼供其他人使用或開發。任何人都可以使用它的代碼並通過使用 Stable Diffusion 以他們想要的方式微調配置來設計自己的模型。Midjourney 的情況並非如此，因為該公司將其圖像生成工具作為專有產品提供，他們聲稱自己開發和訓練模型並且尚未發布源代碼供其他人使用。

在輸入方面，Midjourney 將使用您的主要概念並添加自己的元素來生成圖像。在此過程中，您輸入的一些關鍵字可能會在生成過程中被忽略，因為該工具將使用相關顏色、照明和其他元素創建自己的迭代。如果您希望在 Stable Diffusion 上複製這些圖像，則必須提供比您在 Midjourney 上輸入的內容更長的提示和更多詳細信息。

在 Stable Diffusion 上創建的圖像可能看起來與您使用 DALL-E 生成的圖像相似且隨機。Midjourney 的輸出有時看起來很獨特，通常傾向於更暗或更戲劇化的背景。您可以在 Midjourney 上使用合適的提示創建外觀獨特的圖像，而如果您希望在 Stable Diffusion 上生成它們，則可能需要添加更多細節並更加具體。這可能是好事也可能是壞事，具體取決於您要利用的自定義級別。

在使用方面，Stable Diffusion 為您提供了創建更多圖像的庫，因為它可以免費使用，而且在大多數情況下，您擁有您生成的圖像的權利。另一方面，Midjourney 只提供有限的試用版，您可以使用它來生成最多 25 個作品。之後，您可能需要訂閱他們的付費套餐，這可能會讓您每月損失 8 至 48 美元，並且您的使用權可能會因您訂閱的計劃而異。

關於 Midjourney 是否使用 Stable Diffusion，您只需了解這些即可。

Midjourney 使用 Stable Diffusion 嗎？

Midjourney 與 Stable Diffusion 有何不同

發佈留言 取消回覆

發佈留言取消回覆