OpenAI tutvustab täiustatud tehisintellekti mudelit GPT-4o märkimisväärsete võimetega

OpenAI avaldab murrangulise multimodaalse tehisintellekti
Strateegiliselt ajastatuna üks päev enne Google’i väga oodatud arendajate konverentsi I/O avasid ChatGPT, AI-ga juhitava vestlusroboti loojad OpenAI oma viimase uuenduse. OpenAI tehnilise juhi Mira Murati eestvedamisel tutvustati uut tehisintellekti mudelit GPT-4o innuka publiku ees.

Suuendus tehisintellekti kommunikatsioonis
Suurepärane omadus GPT-4o puhul, mida tähistab “o” sõna “omni” ja mis tähendab “kõikjal”, on selle multimodaalne tegevus. See tähendab, et tehisintellekt suudab mõista sisendeid ja genereerida väljundeid erinevates vormingutes. Eriti märkimisväärne on parendatud suhtlus ChatGPT-ga, mis liigub nüüd tekstipõhistest käskudest kaugemale, hõlmates otsest häälekommunikatsiooni, omadust, mis vajas varem keerukat protsessi, hõlmates mitut tehisintellekti mudelit.

Lihtsustatud töötlemine ja inimestega sarnane suhtlus
GPT-4o tähistab edasiminekut, kuna see kasutab ainult ühte mudelit hääle sisendite töötlemiseks ja reageerimiseks vaid 300 millisekundiga. Tehisintellekti häält on samuti täiendatud, saavutades inimlikult eristatava tooni. Selle mudeli mitmekülgsuse demonstreerimine oli veenev, näidates selle võimeid alates põnevate unejuttude jutustamisest reaalajas tõlgendamiseni itaalia ja inglise keele vahel ning laulmisega seotud hääleandmise oskusteni.

Valvesüsteemide tänava väljakutse
Saksamaa tehnikaekspert Philipp Kloeckner nimetab seda arengut potentsiaalseks väljakutseks olemasolevatele häälteenistustele, võrreldes seda võimaliku “Siri tapjana”. OpenAI tundub võrreldavat empaatilise tehisintellektitegelase Samantha’ga 2013. aasta filmist “Her”. Kuigi pole veel selge, millal kõik uued omadused täielikult rakenduvad, selgitas OpenAI tegevjuht Sam Altman, et praegu pole hääle funktsioon veel GPT-4o toitel, kuigi selle kirjutamise võimed on juba teel.

Seotud küsimused ja vastused:

K: Mis eristab GPT-4o eelmistest versioonidest?
V: GPT-4o erineb eelnevatest iteratsioonidest selle poolest, et tegu on multimodaalse tehisintellektiga, mis tähendab, et see suudab mõista ja reageerida erinevatele andmetüüpidele, sealhulgas tekst, heli ja võimalikult ka piltidele. See töötleb häälkäskusid efektiivselt koos inimestega sarnase suhtlemisega, mis tähistab olulist sammu varasemate peamiselt tekstipõhiste mudelite asemel.

K: Kuidas võib GPT-4o mõjutada häälteenistuste turu?
V: Inimliku hääle ja võimega mõista erinevaid keeli ja vorminguid seab GPT-4o otsese väljakutse olemasolevatele häälteenistustele nagu Siri, Alexa ja Google Assistant. See võib suurendada konkurentsi, soodustades innovatsiooni ja potentsiaalselt asendades vähem arenenud süsteeme, kui see oma lubadusi täidab.

Peamised väljakutsed ja vastuolud:

– Turvalisus ja privaatsus: Nagu iga inimkeelt töötlev tehisintellekt, tekivad mured privaatsuse ja tundlike informatsiooni turvalise käsitlemise pärast.
– Teemade tehisintellekt: Kuna mudel õpib suurtest andmekogumitest, on oht pärida ja tugevdada koolitandmetes olevaid eelarvamusi.
– Inimtööjõu asendamine: Täiustatud tehisintellekti tõus võib asendada töökohti, eriti sektorites, mis sõltuvad inimtegevusest ja häälteenustest.

Eelised ja puudused:

Eelised:
– Pakub sujuvat ja loomulikku kasutajakogemust, parandades potentsiaalselt kättesaadavust kasutajatele puuetega.
– Võib viia efektiivsuse paranemiseni, võimaldades mitmeülesust erinevate suhtlusviiside vahel.
– Ületab keelebarjääre reaalajas tõlgendamisvõimekusega.

Puudused:
– Toetub tugevalt koolitusandmete kvaliteedile ja kogusele, mis võib piirata tõhusust vähemkõneldavates keeltes või murretes.
– Võib süvendada muresid privaatsuse kahanemise pärast, kui seda korralikult ei haldada.
– Inimesega sarnane suhtlus võib hägustada piiri tehisintellekti ja inimese vahel, tekitades eetilisi küsimusi.

Täiendava teabe saamiseks GPT-4o taga oleva ettevõtte kohta võite külastada OpenAI ametlikku veebisaiti klõpsates järgmisel lingil: OpenAI. Pange tähele, et veebimuutuste tõttu ei saa ma garanteerida, et see link on pärast minu teadmiste lõpptähtaega 100% kehtiv, kuid on kontrollitud selle ajani.