گوگل نرمافزاری نوآورانه با نام «پروژه آسترا» که یک دستیار مصنوعی است تازه معرفی کرده است، این نرمافزار میتواند با ورودیهای چندرسانهای به سوالات پاسخ دهد. گوگل با نمایش این قابلیت از طریق یک ویدیو، سناریویی را ارائه داد که در آن نرمافزار مصنوعی به نام جمینی، به یک کاربر پاسخ میدهد و اشیاءی که صدا تولید میکنند، مانند یک اسپیکر، را تشخیص میدهد.
این توسعه نشان میدهد که گوگل به دنیای هوش چندرسانهای و قابلیت پردازش دادههای صوتی، تصویری، ویدیویی و متنی وارد شده است. پروژه آسترا بر اساس سکوی هوش مصنوعی تولیدی گوگل، جمینی، استوار است. در کنفرانس توسعهدهندگان Google I/O سالیانه در مونتون ویو، کالیفرنیا، شرکت تکنولوژیای عظیم پروژه آسترا را همراه با یک موتور جستجوی بهروزرسانی شده توسط جمینی معرفی کرد.
مدیرعامل گوگل سوندار پیچای اهداف شرکت را برای یکپارچهسازی طیف کاملی از امکانات هوش مصنوعی در محیط جمینی به اشتراک گذاشت و تجربه کاربری در حال تکاملی به نام ‘مروری بر هوش مصنوعی’ راهاندازی کرد. این عملکرد جدید به منظور ارائه خلاصه سریع و پیوندهای مرتبط برای نتایج جستجو، تجربه کلی جستجو را با امکان تعامل با محتوای چندرسانهای ارتقا داده است.
معرفی پروژه آسترا به همراه عرضه ابزارهای هوش مصنوعی خلاق چندگانه توسط گوگل همزمان با قابلیت تشخیص ویدیوی Veo، تولید تصویر از طریق متن Imagen، و ترکیب موسیقی توسط Lyria انجام شد. گوگل همچنین افزونه Google Gemini Live را معرفی کرد که تصاویر را هنگام بارگذاری تشخیص داده و بهطور طبیعی با آن تعامل میکند. آخرین نسخههای این ابزارها، از جمله Imagen3 و Lyria با قول عرضه در زبانهای مختلف در ماههای آینده، با اولین عرضه در 35 زبان از جمله کرهای، به نمایش گذاشته شد.
این پیشرفتها برای ارتقای قابلیتهای دستیار شخصی به ارتفاعهای جدید، تبدیل اشیاء روزمره به عوامل تعاملی که از انواع فرمها مانند گوشیهای هوشمند یا عینکها به عنوان مشاوران متخصص پیشنهاداتی ارائه میدهند، طراحی شدهاند.
پروژه آسترا گوگل نشان دهنده پیامدهای پیوسته شرکت برای توسعه هوش چندرسانهای است، و تواناییهای هوش مصنوعی را فراتر از تعاملهای صدا یا متنی گسترش میدهد. هر چند مقاله به ارائه هوش مصنوعی گوگل و ابزارهای مربوطه هوش مصنوعی، اما به بحث در مورد تأثیرات گسترده و چالشهای احتمالی هوش مصنوعی در جامعه نپرداخته است.
سوالات مهم مرتبط با توزیع گوگل در ابتکارات پروژه آسترا:
– چگونه گوگل ایمنی و حریم خصوصی کاربران را در هنگام پیچیده شدن ورودیهای آنها تضمین میکند؟
– در توسعه هوش چندرسانهای چه مشاورههای اخلاقی ارائه میدهد؟
– گوگل چگونه نگرانیهای مربوط به جایگزینی شغلها را با پیشرفت قابلیتهای هوش مصنوعی آدرس میدهد؟
– چه تدابیری شرکت برای جلوگیری از تعصبها در محتوای تولید شده توسط هوش مصنوعی اتخاذ میکند؟
چالشها و اختلافات کلیدی:
– حریم خصوصی: جمعآوری و پردازش ورودیهای چندرسانهای نگرانیهای حریم خصوصی قابل توجهی را برای کاربران ایجاد میکند. کاربران ممکن است از نوع دادههای جمعآوریشده نگران باشند، بهویژه اینکه این اطلاعات شامل اطلاعات بصری و صوتی است که میتواند حساستر از دادههای متنی باشد.
– امنیت: با وجود هوش مصنوعی پیچیدهتر، ریسکهای امنیتی افزایش مییابد. چگونگی حفاظت سیستم در برابر سوءاستفاده یا هک یک موضوع کلیدی است.
– دقت و تعصب: اطمینان حاصل کردن از ارائه اطلاعات دقیق و با معافیت از تعصبها، بهویژه در تشخیص تصاویر و صدا، پیچیده و چالشی است و به عنوان یک چالش به مدتی مداوم مطرح است.
– نظارت قانونی: سیاستگذاران ممکن است در درک و نظارت بر هوش مصنوعی چندرسانهای عقب مانده باشند که میتواند منجر به شکافی بین تواناییهای فنآوری و چارچوبهای قانونی شود.
مزایای پروژه آسترا:
– چندکاربردی: هوش مصنوعی چندرسانهای پتانسیل انقلابی برای تعاملات کاربر با فناوری را دارد توسط درک و پردازش انواع دادهها.
– دسترسیپذیری: کاربران با معلولیتها میتوانند به زیادی از یک هوش مصنوعی که قادر به تفسیر چند حالت ارتباطی است، بهرهمند شوند.
– نوآوری: امکانات محصولات و خدمات جدیدی که قبلاً بدون قابلیتهای هوش مصنوعی چندرسانهای قابل انجام نبود.
معایب پروژه آسترا:
– بار اطلاعات: مدیریت و درک انبوهی از دادههای چندرسانهای میتواند چالشهایی را ایجاد کند و ممکن است منجر به نادرستی یا بار فشردهای بر تأسیسات موجود گردد.
– مصرف منابع: قدرت محاسباتی مورد نیاز برای مدیریت سامانههای هوش مصنوعی چندرسانهای میتواند به شدت بالا باشد که منجر به نگرانیهای هزینهای و محیطی گردد.
اگر علاقهمندید بیشتر درباره ابتکارات عمده هوش مصنوعی گوگل آگاه شوید، لطفاً از وبسایت رسمی آنها از طریق این لینک دیدن کنید.
The source of the article is from the blog crasel.tk