Google sa nachádza na prahu revolúcie svojich nástrojov AI generácie s prelomovými aktualizáciami nasledujúcimi po udalosti Google I/O. Spoločnosť sa chystá tento týždeň uviesť prepracovanú verziu svojho generátora obrázkov Imagen. Táto aktualizovaná verzia prinesie možnosť opätovného vytvárania obrázkov generovaných AI jednotlivcov, funkciu, ktorá bola na konci minulého roku pozastavená z dôvodu dobre známej kontroverzie. Okrem toho bude chatbot spoločnosti Google, Gemini, vylepšený funkciou „Gems“, podobne ako v prípade vlastných GPT ChatGPT. Tieto vzrušujúce aktualizácie boli zdieľané v oficiálnom vyhlásení.
Imagen 3, vylepšená verzia generátora obrázkov, sľubuje významné zlepšenia v kvalite svojich tvorieb. Postavený s bezpečnostnými opatreniami na zabránenie nadmerných opráv v oblasti diverzity podľa Davea Citrona, produktového manažéra Gemini. Toto rieši problém, ktorý v minulých mesiacoch viedol k generovaniu bizarných historických obrázkov AI, ktoré sa stali virálnymi. Možnosť generovať obrázky jednotlivcov sa čoskoro vráti pre platiacich používateľov s novými ochranami, aby sa zabránilo vytváraniu „fotorealistických a identifikovateľných jednotlivcov“. Obrázky detí a scény zobrazujúce násilie, hrôzu alebo sexuálny obsah budú prísne zakázané. Nástroj SynthID spoločnosti Google označí obrázky vodoznakom, potvrdzujúc ich pôvod od AI.
Zároveň Google predstavuje „Gems“, prispôsobiteľné chatboty s používateľsky vytvorenými inštrukciami. Táto funkcia, podobná GPTs od OpenAI, umožní používateľom vytvoriť „tím odborníkov“ na riešenie zložitých projektov, generovanie nápadov alebo tvorbu dokonalých príspevkov na sociálnych médiách. Gems si môžu zapamätať podrobné sady inštrukcií a ušetriť čas pri opakovaných alebo náročných úlohách. Okrem vytvárania vlastných Gems bude Gemini obsahovať aj predpripravené verzie ako učiteľa na učenie, generátora nápadov, kariérneho mentora, editora na písanie a programátorského partnera.
Súčasne budú Imagen 3 a Gems na začiatku dostupné výlučne pre predplatiteľov služieb Gemini Advanced, Business a Enterprise, čo zdôrazňuje stratégiu Googlu rezervovať pokročilé funkcie pre prémiových používateľov. Skorý prístup bude spustený v nasledujúcich dňoch, čím sa otvára nová éra inovácií v oblasti AI.
Nedávne odhalenie prelomových inovácií v oblasti AI zo strany Googlu vzbudilo vlnu nadšenia v technologickom svete. Zatiaľ čo predchádzajúci článok sa dotkol nadchádzajúceho štartu Imagen 3 a predstavenia funkcie Gems na zlepšenie chatbota Gemini od Googlu, existujú ďalšie kľúčové vývoje, na ktoré treba upriamiť pozornosť.