Az Egyesült Királyság örömmel üdvözli a Stabil Diffúziós 3 Közepes fejlettebb képgenerálási modell beindítását.

A Stability AI bemutatja legfejlettebb nyílt forráskódú, szöveg-kép átalakító modelljét—a Stable Diffusion 3 Mediumot, amely elérhető az Egyesült Királyság fogyasztói számára. 2 milliárd paraméterrel rendelkező SD3 Mediumot úgy tervezték, hogy fotórealisztikus eredményeket nyújtson, kihagyva a bonyolult munkafolyamatokat. A modell hatékonyan működik az egyéni fogyasztói rendszereken, és a cég szerint kéz- és arcképek esetén közönséges hibákat orvosol.

A Stability AI javítja a szöveg generálásának pontosságát a Diffúziós Transzformációs Architektúrával. Annak ellenére, hogy hatalmas paraméterszámú, az SD3 Medium kompakt marad, kisebb memóriamérettel, mint versenytársai, amelyek paraméterszámuk tekintetében 800 milliótól akár 8 milliárdig terjednek. A mérete „ideális”, hogy futtatható legyen standard fogyasztói grafikus processzorokon anélkül, hogy a teljesítmény csökkenne, lehetővé téve a részletgazdag felszívást akár kis adathalmazokból is.

Christian Laforte, a Stability társ-vezérigazgatója elmondta a TNW-nek, hogy vállalatuk elkötelezett a modell további finomítása mellett, a cél, hogy megőrizzék vezető pozíciójukat a kép generálás területén. Az SD3 Medium prompok és képek elérhetők a Stability API-n keresztül. A modelltömegek hozzáférhetők nem kereskedelmi nyílt licensz alatt és az olcsóbb Creator licensz alatt—a kereskedelmi méretű felhasználók felvehetik a kapcsolatot a startuppal licenszelési részletekért.

A SD3 Medium megérkezik a Stability AI számára kihívások közepette. A startup 2020-ban alakult és gyorsan elismert generatív AI vezetőnek számított a Midjourney és az OpenAI Dall-E mellett. Az befektetők 2022-ben 1 milliárd dollár értékelésűnek találták a céget. Ugyanakkor viharos időszakokat élt meg egy hullámnyi pert és anyagi gondokat. A művészek azt vádolták a céget, hogy jogtalanul tanították be AI modelleiket munkáikból. Pénzügyi nyomás alatt olyan híresztelések is felmerültek, hogy az értékesítésről tárgyalnak, és márciusban Emad Mostaque vezérigazgató lemondott, hogy felfedezze a decentralizált AI-t.

Mégsincs kétség a szoftver teljesítményét illetően, az SD3 Medium jelentős javulásokat mutat. A Stability AI nem áll meg a képekkel, Laforte beszélt többmodalitású erőfeszítésekről videóban, audióban és nyelvben.

Kulcsfontosságú kérdések és válaszok:

Mi az a Stable Diffusion 3 Medium (SD3 Medium)?
A Stable Diffusion 3 Medium a Stability AI által bemutatott legújabb állapotú nyílt forráskódú szöveg-kép generátor, amely 2 milliárd paraméteres modelllel rendelkezik, és magas minőségű, fotórealisztikus képeket hoz létre, és hatékonyan fut a standard fogyasztói grafikus processzorokon.

Miben különbözik az SD3 Medium a más modellektől?
Az SD3 Medium a magas minőségű képgenerálási képességei és kompakt mérete kombinációjának köszönhetően áll ki, amelynek köszönhetően kisebb memóriaterülete van, de még mindig fut a fogyasztói grafikus processzorokon. Megoldja a képgenerálási problémákat, például a kézhelyek és arcfelismerési problémákat.

Milyen kihívások vagy viták társulnak a Stability AI-hoz és az SD3 Mediumhoz?
A kihívások közé tartozik a jogi viták, amelyek abból adódnak, hogy a vállalatot azzal vádolták, hogy jogtalanul tanítja be AI-ját művészek munkáiból engedély nélkül. Pénzügyi kihívások is jelentkeznek, melyek a cég értékesítéséről szóló pletykákat, valamint a vezérigazgató Emad Mostaque lemondását, miközben a decentralizált AI modellek felfedezését említik.

Mi az SD3 Medium előnyei?
Az előnyök közé tartozik a fotórealisztikus képeredmények szállítása azáltal, hogy javítja a szöveg generálásának pontosságát, és lehetővé teszi a hatékony futtatást a fogyasztóknak szánt hardveren. Ezenkívül nyílt forráskódú és különféle licencfeltételek alatt elérhető, hogy támogassa a nem kereskedelmi és kereskedelmi felhasználást.

Mi az SD3 Medium hátránya?
Potenciális hátrányok közé tartozhatnak etikai aggályok az AI modell esetlegesen szerzői jogi műveletekre való oktatásával kapcsolatban, engedély nélkül. Ahogy az összes AI-generált tartalom esetében, itt is az autenticitás és a lehetséges visszaélés kérdése merül fel, például félrevezető vagy hamis képek létrehozására történő felhasználást tekintve.

Kapcsolódó link:
További információkért a szöveg-kép AI fejlesztésekről és más kapcsolódó AI innovációkról látogasson el a Stability AI weboldalra a következő hivatkozáson keresztül: Stability AI. Kérjük, vegye figyelembe, hogy a megadott URL a fő domainre vezet és érvényesnek kell lennie annak a lekérdezés időpontjában, kivéve, ha nem várható bármiféle változás a domainen vagy a webhely szerkezetén a tudás határideje után.

Privacy policy
Contact