Czy Midjourney korzysta ze stabilnej dyfuzji?
Dzięki postępowi w sztucznej inteligencji masz teraz mnóstwo usług, które pomogą Ci stworzyć wszystko od podstaw, nawet dzieła sztuki. Jednym z popularnych narzędzi, które pojawiły się ostatnio, jest Midjourney, generator obrazów AI, który może tworzyć oszałamiające dzieła sztuki za pomocą monitów tekstowych w ciągu kilku sekund.
Czy Midjourney korzysta ze stabilnej dyfuzji?
Proste wyszukiwanie w Internecie ujawniłoby, jakiego rodzaju technologia jest używana w narzędziach do generowania obrazu, takich jak DALL-E i Stable Diffusion. Na przykład Stable Diffusion wykorzystuje model ukrytej dyfuzji (LDM), który został opracowany przez grupę CompVis w Monachium, a także koder tekstu CLIP ViT-L/14 do kondycjonowania tekstu.
Jeśli chodzi o Midjourney, jego twórcy nie oferują żadnych informacji o tym, jakich modeli treningowych używają ani jak to wszystko się łączy, ani nie udostępnili publicznie swojego kodu źródłowego. W chwili pisania tego tekstu narzędzie działa obecnie na modelu V5, który został wydany 15 marca 2023 r. Jest to aktualizacja modelu V4 oparta na zupełnie nowej architekturze AI i bazie kodu.
Midjourney mówi, że nowe modele zostały zaprojektowane przez nich samych i zostały przeszkolone na ich własnej supergromadzie AI. Model V5 firmy Midjourney obsługuje wysoką spójność i oferuje wszystkie inne zaawansowane funkcje, które można znaleźć w modelu V4, takie jak podpowiadanie obrazów, wielokrotne podpowiedzi oraz możliwość dodawania mniejszych szczegółów za pomocą stworzeń, miejsc i obiektów.
Chociaż nie twierdzi, że używa Stable Diffusion, spekuluje się, że zmiany wprowadzone w modelu Midjourney V5 skutkują obrazami, które wyglądają dość podobnie do tych wykonanych za pomocą Stable Diffusion v2. Istnieje więc możliwość, że Midjourney może używać innej wersji ukrytego modelu dyfuzji, który napędza Stable Diffusion lub ma pewne elementy Stable Diffusion v2.
Czym Midjourney różni się od Stable Difusion
W oparciu o odpowiednie operacje, Stable Diffusion zachęca do modelu open source, ponieważ udostępnia swój kod źródłowy innym osobom do wykorzystania lub rozwijania. Każdy może użyć jego kodu i zaprojektować własny model, dopracowując konfigurację w wybrany przez siebie sposób za pomocą stabilnej dyfuzji. Tak nie jest w przypadku Midjourney, ponieważ firma oferuje swoje narzędzie do generowania obrazu jako zastrzeżony produkt, w którym twierdzi, że samodzielnie rozwija i szkoli model i nie udostępniła jeszcze kodu źródłowego do wykorzystania przez innych.
Jeśli chodzi o dane wejściowe, Midjourney wykorzysta Twoją główną koncepcję i doda własne elementy do generowania obrazów. W tym procesie niektóre z wprowadzonych słów kluczowych mogą zostać zignorowane podczas generowania, ponieważ narzędzie utworzy własne iteracje z odpowiednimi kolorami, oświetleniem i innymi elementami. Jeśli chcesz powielić te obrazy w Stable Diffusion, będziesz musiał podać dłuższy monit z większą ilością szczegółów niż te, które mogłeś wprowadzić w Midjourney.
Obrazy utworzone za pomocą Stable Diffusion mogą wyglądać podobnie i losowo do tych, które generujesz za pomocą DALL-E. Twórczość Midjourney może czasami wyglądać wyjątkowo, często opierając się na ciemniejszym lub bardziej dramatycznym tle. Możesz tworzyć wyraźnie wyglądające obrazy w Midjourney z przyzwoitymi monitami, podczas gdy być może będziesz musiał dodać więcej szczegółów i być bardziej szczegółowym, jeśli chcesz je wygenerować w stabilnej dyfuzji. Może to być dobra lub zła rzecz, w zależności od poziomu dostosowania, z którego chcesz skorzystać.
Jeśli chodzi o użytkowanie, to Stable Diffusion zapewnia bibliotekę do tworzenia większej liczby obrazów, ponieważ można z niej korzystać bezpłatnie, a w większości masz prawa do generowanych obrazów. Z drugiej strony Midjourney oferuje tylko ograniczoną wersję próbną, której można użyć do wygenerowania do 25 kreacji. Po tym może być konieczne subskrybowanie płatnego poziomu, który może obniżyć koszt o 8–48 USD miesięcznie, a Twoje prawa użytkowania mogą się różnić w zależności od subskrybowanego planu.
To wszystko, co musisz wiedzieć o tym, czy Midjourney korzysta ze stabilnej dyfuzji.
Dodaj komentarz