Wielka Brytania wita premierę zaawansowanego modelu generacji obrazów, Stabilna Dyfuzja 3 Medium

Stability AI przedstawia swoje najbardziej zaawansowane otwarte źródło modelu konwersji tekstu na obraz—Stable Diffusion 3 Medium, dostępny dla klientów w Wielkiej Brytanii. SD3 Medium, z 2 miliardami parametrów, zaprojektowany jest tak, aby dostarczał fotorealistyczne rezultaty, omijając złożone procesy. Model działa efektywnie na systemach indywidualnych klientów i radzi sobie z typowymi artefaktami w obrazach rąk i twarzy, zgodnie z informacjami firmy.

Stability AI zwiększa precyzję generowania tekstu dzięki Architekturze Transformer Diffusion. Pomimo ogromnej liczby parametrów, SD3 Medium pozostaje kompaktowy, zajmując mniej pamięci niż konkurencyjne modele o liczbie parametrów od 800 milionów do 8 miliardów. Rozmiar ten sprawia, że model jest „idealny” do pracy na standardowych GPU konsumenckich bez pogorszenia wydajności, pozwalając na absorpcję szczegółów nawet z małych zbiorów danych.

Christian Laforte, współ-CEO Stability, podzielił się z TNW ich zaangażowaniem w dalsze doskonalenie modelu, z zamiarem utrzymania wiodącej pozycji w generowaniu obrazów. Treści i obrazy SD3 Medium są dostępne za pośrednictwem API Stability. Wagi modelu są dostępne na zasadach niekomercyjnej licencji otwartej oraz ekonomicznej licencji Creator—użytkownicy komercyjni mogą skontaktować się ze startupem w celu uzyskania szczegółów dotyczących licencjonowania.

SD3 Medium pojawia się w trudnym okresie dla Stability AI. Startup założony w 2020 roku i szybko rozpoznany jako lider w dziedzinie sztucznej inteligencji generatywnej, obok Midjourney i Dall-E z OpenAI, zdobył wysoką pozycję w branży. Inwestorzy wycenili firmę na 1 miliard dolarów w 2022 roku. Niemniej jednak, był to burzliwy okres z lawiną procesów sądowych i problemami finansowymi. Artyści oskarżyli firmę o nielegalne szkolenie modeli AI na ich pracach. W obliczu trudności finansowych pojawiły się rozmowy o sprzedaży, a w marcu CEO Emad Mostaque zrezygnował, aby zbadać możliwość zastosowania zdecentralizowanych modeli AI.

Jednakże wydajność oprogramowania nadal imponuje, a SD3 Medium wykazuje znaczne ulepszenia. Stability AI nie poprzestaje na obrazach, jak zasugerował Laforte, szykuje się do wielomodalnych przedsięwzięć wideo, audio i językowych.

Podstawowe pytania i odpowiedzi:

Czym jest Stable Diffusion 3 Medium (SD3 Medium)?
Stable Diffusion 3 Medium to najnowszy, zaawansowany model otwartego źródła do generowania obrazów na podstawie tekstu, wprowadzony przez Stability AI. Posiada 2 miliardy parametrów, zaprojektowany jest do produkowania wysokiej jakości, fotorealistycznych obrazów i jest wystarczająco wydajny, aby działać na standardowych GPU konsumenckich.

Co wyróżnia SD3 Medium spośród innych modeli?
SD3 Medium wyróżnia się kombinacją zdolności do generowania obrazów wysokiej jakości i kompaktowym rozmiarem, co pozwala mu na mniejsze zużycie pamięci, zachowując możliwość pracy na GPU konsumenckich. Rozwiązuje typowe problemy z generowaniem obrazów, takie jak artefakty w obrazach rąk i twarzy.

Jakie są niektóre wyzwania lub kontrowersje związane z Stability AI i SD3 Medium?
Do wyzwań należą kontrowersje prawne wynikające z oskarżeń pod adresem firmy o szkolenie jej AI na pracach artystów bez zgody. Widoczne są również wyzwania finansowe, o czym świadczą rozmowy o potencjalnej sprzedaży i rezygnacja z funkcji CEO Emada Mostaque, w kontekście eksploracji zdecentralizowanych modeli AI.

Jakie są zalety SD3 Medium?
Zalety obejmują dostarczanie fotorealistycznych wyników obrazów z ulepszoną precyzją generowania tekstu oraz zdolność do efektywnej pracy na sprzęcie konsumenckim. Ponadto, jest dostępny jako otwarte źródło z różnymi warunkami licencjonowania, aby wesprzeć zarówno użytkowników niekomercyjnych, jak i komercyjnych.

Jakie są wady SD3 Medium?
Potencjalne wady mogą obejmować obawy etyczne dotyczące szkolenia modelu AI na potencjalnie chronionych prawem autorów prac bez wyraźnej zgody. Jak w przypadku każdej generowanej przez AI treści, pojawia się także pytanie o autentyczność i możliwe wykorzystanie do tworzenia wprowadzających w błąd lub fałszywych obrazów.

Link powiązany:
Aby dowiedzieć się więcej na temat postępów w dziedzinie sztucznej inteligencji generatywnej obrazów na podstawie tekstu i innych innowacji z tej dziedziny, można odwiedzić stronę Stability AI za pomocą poniższego linku: Stability AI. Należy pamiętać, że podany adres URL prowadzi do głównego domeny i powinien być aktualny w momencie zapytania, chyba że nastąpiły nieprzewidziane zmiany w domenie lub strukturze strony po dacie odcięcia wiedzy.

The source of the article is from the blog mgz.com.tw

Privacy policy
Contact