תוכן חדש ל-Deepgram: נפילת קיסר או התחלת דרך חדשה?

Deepgram, ספק הפיתוח המוכר בענף הפיתוח הטכנולוגי לזיהוי קולי, עורר תערומה בענף עם הכרזה חשובה היום. החברה הציגה את Aura, אפליקציית ה-Text-to-Speech בזמן אמת החדשה ביותר שלה. בתוך Aura, מפתחים יכולים כעת ליצור סוכנים לבינה מלאכותית בעלי דמויות קול מאוד ריאליסטיות ויכולות צנתאות נמוכות.

בדרך כלל, השגת גישה לדמויות קול איכותיות גבוהות הייתה תהליך יקר ומסובך. מצד שני, דמויות קול עם צנתאות נמוכה לרוב מפספסות את המראה הטבעי. בכל זאת, API של Deepgram, Aura חוברת גשר זה על ידי מסירת דמויות קול מהירות ואנושיות במחיר סביר.

סקוט סטיבנסון, מייסד ומנכ"ל של Deepgram, דגיש את הביקשה היוצרת לבוטים של בינה מלאכותית בזמן אמת היכולים להבין, לעבד, ליצור תגובות ולדבר. כדי לענות על דרישות אלו, דיוק, צנתאות נמוכה ויעילות כלכלית הם גורמים חיוניים. גישה לדמויות שפה גדולות (LLMs) יכולה להיות יקרה, ולכן המוטר ל-Aura להציע פתרון זול.

Deepgram מטיבה שהמחיר של Aura עולה על זה של מתחרים, מציעה שירותים ב- $0.015 ל-1,000 תווים. בעוד שהדמויות של WaveNet של Google והדמויות הנויראליות של Polly של Amazon מתמחרות בדמויות בגודל דומה של $0.016 ל-1,000 תווים, ההצעה של Deepgram זולה מעט. חשוב לציין שהאופציה ברמה הגבוהה ביותר של Amazon מגיעה עם תווית מחיר גבוהה משמעותית.

סטיבנסון מסביר שאסטרטגיית פיתוח המוצר של Deepgram מתגלגלת סביב השגת נקודת מחיר תחרותית, צנתאות מהירה ודיוק מוביל. הוא ממשיך לדגוש ש- Deepgram הוציאה עשרים וארבע שנים בבניית האינפרהסטרקטורה הנחוצה לפני שהוציאה כל מוצר.

כיוון עכשיו, Aura מספקת בערך שנים עשר דמויות קול שנלמדו באמצעות מערך נתונים שנוצר יחד עם שחקנים מדובבים בקול. כדאי לציין שכל הדמויות של Deepgram, כולל דמויות של Aura, נלמדו בבית.

API של Aura של Deepgram מביא לנו מגמה חדשה בטכנולוגיית ה-Text-to-Speech בזמן אמת. על ידי שילוב דמויות קול ריאליסטיות, יכולות צנתאות נמוכות ומחיר תחרותי, Aura פותחת אפשרויות חדשות לעסקים בתחומים שונים.

שאלות נפוצות

  1. מהו המטרה של API של Aura של Deepgram?
    מטרת ה-API של Aura של Deepgram היא לאפשר למפתחים לבנות סוכנים לבינה מלאכותית בזמן אמת עם דמויות קול איכותיות גבוהות ויכולות צנתאות נמוכות.
  2. במה דוחק Aura של Deepgram מפתרונות אחרים לזיהוי קולי?
    Aura מבריקה בזכות הצעה של דמויות קול מהירות ואנושיות במחיר סביר, דבר שמבדיל אותה מהמתחרים.
  3. מהו המחיר של API של Aura של Deepgram?
    המחיר של API של Aura מתחיל ב- $0.015 ל-1,000 תווים, וזה יותר כלכלי בהשוואה להצעות דומות מ-Google ו-Amazon.
  4. איך נלמדו דמויות הקול עבור Aura?
    דמויות הקול של Aura נלמדו בבית על ידי Deepgram באמצעות מערך נתונים שנוצר בשיתוף פעולה עם שחקנים בקול.

הגדרות:

  • זיהוי קול: הטכנולוגיה שמאפשרת למכונות להבין ולפרש שפה ממוצעת.
  • Text-to-Speech (TTS): תהליך המרה של טקסט כתוב למילים מדוברות.
  • API: ממשק תכנותי ליישומי מחשב, קבוצת כללים ופרוטוקולים המאפשרת ליישומי תוכנה שונים לתקשר זה עם זה.

לינקים רלוונטים מומלצים:
Deepgram

The source of the article is from the blog tvbzorg.com

Privacy policy
Contact