Egyedülálló hangszóró technológia a hang-világban

OpenAI bemutatta lenyűgöző hangklónozási technológiáját, amely elsősorban a biztonsági aggályokra összpontosít

OpenAI, mely híres a ChatGPT elnevezésű chatbot létrehozásáról, jelentős lépést tett a hangsegédipar felé. A cég nemrégiben bemutatta innovatív Voice Engine technológiáját, amely lehetővé teszi egy személy hangjának klónozását. Ennek ellenére az OpenAI jelenleg úgy döntött, hogy nem hozza nyilvánosságra a technológiát egyelőre a lehetséges visszaélések miatt.

Az OpenAI Voice Engine technológiája mindössze egy 15 másodperces hangfelvétel alapján pontosan lemásolni egy személy hangját. Habár a cég tervezi, hogy bemutatja az előzetes verziót néhány korai tesztelő számára, óvatosan kezeli a technológia szélesebb körű kiadását, felismerve az ezzel járó kockázatokat. Az OpenAI különösen ügyel a beszédgenerálás veszélyeire, amelyek nagyon hasonlítanak az egyének hangjához, különösen egy választás éve alatt, amikor ezeket káros célokra lehetne felhasználni.

Az Oakland-i székhelyű cég a közelmúltban kiadott közleményében hangsúlyozta, hogy felismeri a hangklónozási technológiával járó súlyos kockázatokat. A sajnálatos esemény az Új-Hampshire-i elnökválasztás során, amikor a szavazók olyan robohívásokat kaptak, amelyekben mesterséges intelligencia által előállított hang utánozta Joe Biden elnök hangját, rávilágít az ilyen előrelépések lehetséges visszaéléseire. Míg több induló cég már kínál hangklónozási technológiát a nyilvánosság vagy konkrét vállalkozások számára, például a szórakoztató stúdiók számára, az OpenAI a biztonság és a felelős használat prioritásával bír.

Az etikus használat biztosítása érdekében az OpenAI intézkedéseket tett a technológia védelme érdekében. Az első Voice Engine tesztelők kötelezettséget vállaltak arra, hogy nem fognak másokat utánozni a hozzájárulás nélkül, és kötelesek bejelenteni, hogy a hangok mesterséges intelligencia által lettek előállítva. Ez a felelős megközelítés a lehetséges káros hatások csökkentését célozza meg, ami az azonosítási csalás vagy más rosszindulatú cselekedetekkel jár.

Az OpenAI pályája összhangban van a korábbi stratégiai megközelítésével. A cég korábban bejelentette, de nem adta át nagy terjedelemben a videógenerátora Sora-t. Azonban egy márciusban benyújtott védjegybejelentés arra utal, hogy az OpenAI valószínűleg tovább kívánja fejleszteni a beszédfelismerés és a digitális hangsegéd technológiákat. Az ilyen innovációk továbbfejlesztésével az OpenAI versenyképes pozícióba kerülő elérni a már létező hangtermékek, például az Amazon Alexa mellett.

Gyakran ismételt kérdések:
K: Mi az a Voice Engine technológia?
V: Az OpenAI Voice Engine technológiája lehetővé teszi egy személy hangjának klónozását mindössze egy 15 másodperces hangfelvétel alapján.

K: Miért nem teszi közzé az OpenAI a technológiát a nyilvánosság számára?
V: Az OpenAI aggódik a potenciális visszaélések és a személyek hangjához nagyon hasonló beszéd generálásával járó kockázatok miatt, különösen egy választás éve alatt.

K: Hogyan biztosítja az OpenAI a technológia felelős használatát?
V: Az első Voice Engine tesztelők vállalták, hogy nem fognak másokat utánozni a hozzájárulás nélkül, és kötelesek bejelenteni, hogy a hangok mesterséges intelligencia által lettek előállítva.

K: Milyen egyéb technológiákat jelentett be korábban az OpenAI?
V: Az OpenAI korábban bemutatta a video-generátort, a Sora-t, amelyet nem tett széles körben hozzáférhetővé.

Források:
– OpenAI Voice Engine Technológia
– Védjegybejelentés

Az OpenAI belevetette magát a hangsegédiparba a Voice Engine technológiájával, ami jelentős fejlemény ezen a területen. A cég innovatív technológiája képes egy személy hangjának klónozására mindössze egy rövid, 15 másodperces hangfelvétel alapján. Habár az OpenAI tervezi, hogy előzetes bemutatást tartson a technológiáról néhány korai tesztelő számára, aggályok merülnek fel annak szélesebb körű kiadása és a potenciális visszaélések miatt.

Az OpenAI különösen figyelemmel van arra, hogy egy választás éve alatt olyan beszédgenerálást végezzen, amely nagyon hasonlít az egyének hangjához. A cég érti, hogy milyen károkat okozhat ennek a technológiának a rosszindulatú célokra való kihasználása. Az incidens az Új-Hampshire-i elnökválasztás során, amikor a szavazók olyan robohívásokat kaptak, amelyekben mesterséges intelligencia által generált hang utánozta Joe Biden elnök hangját, rávilágít arra, hogy milyen fontos a felelős használat és a védintézkedések alkalmazása az azonosítási csalás vagy más rosszindulatú cselekedetek elkerülése érdekében.

Az OpenAI felelős megközelítése azt célozza, hogy csökkentse ezeket a potenciális károkat. Az első Voice Engine tesztelők kötelezettséget vállaltak arra, hogy nem fognak mást utánozni a hozzájárulás nélkül, és kötelesek bejelenteni, hogy a hangok mesterséges intelligencia által lettek előállítva. Ez az etikus használati politika segít védekezni az ilyen típusú visszaélések és az klónozott hangokkal történő visszaélések ellen.

Míg az OpenAI jelenleg úgy döntött, hogy nem hozza nyilvánosságra a technológiát, valószínűleg jövőbeli tervei vannak a beszédfelismerés és a digitális hangsegéd technológiák további felfedezésére. A cég által benyújtott védjegybejelentés arra utal, hogy érdeklődésük fennáll ezen a területen. Az ilyen innovációk fejlesztésével az OpenAI verseny készen áll a jelenlegi hangtermékek, mint például az Amazon Alexa ellen.

További információkért látogasson el az OpenAI honlapjára, ahol többet megtudhat a Voice Engine technológiáról. A további betekintésekért pedig nézze meg az OpenAI által benyújtott védjegybejelentést.

The source of the article is from the blog meltyfan.es