تکنولوژی صدا به متن جدید Deepgram رونمایی از API نوشته به اصلیت مخالف: راهنمای کامل

شرکت Deepgram یک بازیگر معروف در صنعت راه‌اندازی شناخت صوتی است. امروز، این شرکت اعلامیه‌ای مهم داشته و ‘آورا’، آخرین API واقعی به وقت و نوشتار به گفتار خود را معرفی می‌کند. با آورا، توسعه‌دهندگان اکنون می‌توانند عامل‌های هوش مصنوعی گفتاری با مدل‌های صوتی بسیار واقع‌گرا و قابلیت‌های کم‌درنگی ایجاد کنند.

از قدیم، دستیابی به مدل‌های صوتی با کیفیت بالا یک فرآیند گرانقیمت و زمان‌بر بوده است. از سوی دیگر، مدل‌های با کم‌درنگی اغلب شبیه به طبیعی به نظر نمی‌رسند. اما API آورا شرکت Deepgram این ناپیوستگی را با ارائه مدل‌های صوتی سریع و انسان‌مانند به قیمتی مقرون به صرفه پل ساخته است.

موسس و مدیرعامل Deepgram، اسکات استفنسون، بر روند رشدی رو به افزایش برای ربات‌های گفتاری به وقت واقعی که می‌توانند درک، پردازش، تولید پاسخ‌ها و گفتار داشته باشند تاکید می‌کند. برای تأمین این نیازها، دقت، کم‌درنگی و کارآیی هزینه‌ای اساسی هستند. دسترسی به مدل‌های زبان بزرگ ممکن است گران باشد که برای آورا ضروری است یک راهکار قابل تأمین ارائه کند.

Deepgram ادعا می‌کند که قیمت‌گذاری آورا از رقباش پیشی می‌گیرد و خدمات را با قیمت 0.015 دلار برای هر 1,000 کاراکتر ارائه می‌دهد. در حالی که صداهای WaveNet گوگل و صداهای عصبی Polly از پلی امازون به‌همین اندازه با قیمت 0.016 دلار برای هر 1,000 کاراکتر قیمت‌گذاری شده‌اند، پیشنهاد Deepgram کمی ارزان‌تر است. اهمیت دارد که گزینه بالاترین سطح امازون با برچسب قیمت بسیار بالاتری همراه است.

استفنسون توضیح می‌دهد که استراتژی توسعه محصول Deepgram در دستیابی به یک نقطه قیمت رقابتی، کم درنگی سریع و دقت برجسته معطوف است. استفنسون ادامه می‌دهد که Deepgram چهار سال را صرف ایجاد زیرساخت‌های لازم می‌کند قبل از انتشار هر محصولی.

در حال حاضر، آورا حدود دوازده مدل صوتی ارائه می‌دهد که توسط Deepgram با همکاری با بازیگران صدایی آموزش داده شده‌اند. ارزشی برای ذکر دارد که تمامی مدل‌های Deepgram، از جمله آورا، درون‌خانه آموزش دیده شده‌اند.

API آورا شرکت Deepgram دیدگاه جدیدی به فناوری متن به گفتار به وقت واقعی معرفی می‌کند. با ترکیب مدل‌های صوتی واقع‌گرا، قابلیت‌های کم‌درنگی و قیمت‌گذاری رقابتی، آورا امکانات جدیدی را برای کسب‌وکارها در صنایع مختلف به ارمغان می‌آورد.

سوالات متداول (FAQ)

The source of the article is from the blog elperiodicodearanjuez.es

Privacy policy
Contact