شرکت Deepgram یک بازیگر معروف در صنعت راهاندازی شناخت صوتی است. امروز، این شرکت اعلامیهای مهم داشته و ‘آورا’، آخرین API واقعی به وقت و نوشتار به گفتار خود را معرفی میکند. با آورا، توسعهدهندگان اکنون میتوانند عاملهای هوش مصنوعی گفتاری با مدلهای صوتی بسیار واقعگرا و قابلیتهای کمدرنگی ایجاد کنند.
از قدیم، دستیابی به مدلهای صوتی با کیفیت بالا یک فرآیند گرانقیمت و زمانبر بوده است. از سوی دیگر، مدلهای با کمدرنگی اغلب شبیه به طبیعی به نظر نمیرسند. اما API آورا شرکت Deepgram این ناپیوستگی را با ارائه مدلهای صوتی سریع و انسانمانند به قیمتی مقرون به صرفه پل ساخته است.
موسس و مدیرعامل Deepgram، اسکات استفنسون، بر روند رشدی رو به افزایش برای رباتهای گفتاری به وقت واقعی که میتوانند درک، پردازش، تولید پاسخها و گفتار داشته باشند تاکید میکند. برای تأمین این نیازها، دقت، کمدرنگی و کارآیی هزینهای اساسی هستند. دسترسی به مدلهای زبان بزرگ ممکن است گران باشد که برای آورا ضروری است یک راهکار قابل تأمین ارائه کند.
Deepgram ادعا میکند که قیمتگذاری آورا از رقباش پیشی میگیرد و خدمات را با قیمت 0.015 دلار برای هر 1,000 کاراکتر ارائه میدهد. در حالی که صداهای WaveNet گوگل و صداهای عصبی Polly از پلی امازون بههمین اندازه با قیمت 0.016 دلار برای هر 1,000 کاراکتر قیمتگذاری شدهاند، پیشنهاد Deepgram کمی ارزانتر است. اهمیت دارد که گزینه بالاترین سطح امازون با برچسب قیمت بسیار بالاتری همراه است.
استفنسون توضیح میدهد که استراتژی توسعه محصول Deepgram در دستیابی به یک نقطه قیمت رقابتی، کم درنگی سریع و دقت برجسته معطوف است. استفنسون ادامه میدهد که Deepgram چهار سال را صرف ایجاد زیرساختهای لازم میکند قبل از انتشار هر محصولی.
در حال حاضر، آورا حدود دوازده مدل صوتی ارائه میدهد که توسط Deepgram با همکاری با بازیگران صدایی آموزش داده شدهاند. ارزشی برای ذکر دارد که تمامی مدلهای Deepgram، از جمله آورا، درونخانه آموزش دیده شدهاند.
API آورا شرکت Deepgram دیدگاه جدیدی به فناوری متن به گفتار به وقت واقعی معرفی میکند. با ترکیب مدلهای صوتی واقعگرا، قابلیتهای کمدرنگی و قیمتگذاری رقابتی، آورا امکانات جدیدی را برای کسبوکارها در صنایع مختلف به ارمغان میآورد.
سوالات متداول (FAQ)
The source of the article is from the blog elperiodicodearanjuez.es