Καινοτομώντας το Μέλλον: Η OpenAI και η Google Αναβαθμίζουν το Παιχνίδι της Τεχνητής Νοημοσύνης τους

Η OpenAI Βελτιώνει την Πρόσβαση και τα Χαρακτηριστικά με το ChatGPT-4o
Σε μια κίνηση που δημοκρατοποιεί την τεχνολογία της τεχνητής νοημοσύνης, η OpenAI ανακοίνωσε κατά τη διάρκεια ενός live event στις 13 Μαΐου ότι η τελευταία εκδοχή του chatbot, ChatGPT-4o, είναι πλέον διαθέσιμη για όλους χωρίς κόστος. Αυτή η δωρεάν έκδοση προσφέρει βελτιωμένη ταχύτητα και δυνατότητες, συμπεριλαμβανομένης της χειρισμό του κειμένου, των εικόνων, του βίντεο και του ήχου. Πρόκειται για ένα άλμα που επιτρέπει στο ChatGPT-4o να αναγνωρίζει οπτικές υποδείξεις, να διακρίνει συναισθήματα μέσω των εκφράσεων προσώπου και να ανταποκρίνεται σε αιτήματα ήχου με γρήγορο χρόνο απόκρισης 320 χιλιοστά του δευτερολέπτου.

Αυτή η τεχνητή νοημοσύνη έχει σχεδιαστεί όχι μόνο για την άμεση ανταπόκριση αλλά και για την παροχή αλληλεπιδράσεων σε διάφορους συναισθηματικούς τόνους φωνής – από την ειρωνεία στο χιούμορ. Επιπλέον, ξεχωρίζει στην πραγματική χρονική μετάφραση μεταξύ διαφορετικών γλωσσών, διευκολύνοντας τη συνεχή επικοινωνία μεταξύ ομιλητών διαφορετικών γλωσσών κατά τη ζωντανή παρουσίαση που παρουσιάστηκε από τον CTO της OpenAI.

Διαδραστικές Αναβαθμίσεις και Συνεργασίες για Οπτική Βοήθεια
Δεν όλες οι ενημερώσεις είναι διαθέσιμες αμέσως, καθώς οι αλληλεπιδράσεις ήχου και βίντεο αναμένεται να διατεθούν στους επί πληρωμή συνδρομητές στις προσεχείς εβδομάδες. Ωστόσο, οι χρήστες μπορούν αυτή τη στιγμή να αλληλεπιδρούν με το GPT-4o χρησιμοποιώντας κείμενο και εικόνες μέσω περιηγητών ιστού ή κινητών συσκευών.

Η OpenAI συνεργάστηκε με τη Δανέζικη εφαρμογή ‘Be My Eyes’ για την παραγωγή λειτουργίας που υποβοηθά άτομα με προβλήματα όρασης με την επεξεργασία εικόνων σε πραγματικό χρόνο.

Η Βελτίωση του Gemini της Google
Η Google, μην υστερώντας, αποκάλυψε κατά τη διάρκεια της διασκεδαστικής διοργάνωσης για προγραμματιστές I/O 2024 μια σειρά από ενημερώσεις για το μοντέλο Gemini και νέα εργαλεία τεχνητής νοημοσύνης. Το βελτιωμένο μοντέλο Gemini 1.5 Pro μπορεί να κατανοήσει έντονα έγγραφα, έως 1.500 σελίδες, ή να περιλάβει συνοπτικώς πολλά emails γρήγορα, με περαιτέρω βελτιώσεις στον ορίζοντα που επεκτείνει το παράθυρο του περιβάλλοντος σε δύο εκατομμύρια tokens. Μπορεί να εκτελεί ποικίλα αιτήματα από μια εικόνα και αποτελεί μέρος της συνδρομής ‘Gemini Advanced’, διαθέσιμη σε πάνω από 35 γλώσσες σε 150 χώρες.

Επιπρόσθετα, η Google παρουσίασε το 1.5 Flash, μια ελαφριά και γρήγορη έκδοση του Gemini, και το Project Astra, έναν πράκτορα τεχνητής νοημοσύνης που απλοποιεί καθημερινές εργασίες με προσαρμογή και γρήγορες απαντήσεις. Οι καινοτομίες επεκτείνονται σε τεχνολογία, με πρωτότυπα όπως γυαλιά εξοπλισμένα με κάμερες και μικρόφωνα.

Με την κυκλοφορία της τεχνολογίας Image 3 και του Veo για τη δημιουργία βίντεο, η Google βελτιώνει τη γενεσιουργία οπτικού περιεχομένου σύμφωνα με τις κειμενικές οδηγίες των χρηστών. Εισήγαγε επίσης τα ‘AI Overviews’ στις ΗΠΑ, μια λειτουργία στην αναζήτηση της Google που παρέχει αποσπάσματα που δημιουργήθηκαν από τεχνητή νοημοσύνη στην κορυφή των αποτελεσμάτων αναζήτησης.

Ένας Ερευνητής της Τεχνητής Νοημοσύνης Καταθέτει την άποψή του
Ο César Beltrán, συντονιστής της Ομάδας Έρευνας Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Περού, υποδεικνύει ότι η OpenAI μπορεί να έχει πλεονέκτημα στην εξελιγμένη πολυπλοκότητα των μοντέλων της τεχνητής νοημοσύνης. Η απροσδόκητη αποκάλυψη της Google δεν ταίριαξε με τη συνολική πληρότητα της εκπληκτικής ανακοίνωσης της OpenAI, προσθέτοντας μια νέα δυναμική ανταγωνισμού στον χώρο της τεχνητής νοημοσύνης.

Στοιχεία που σχετίζονται με το θέμα:

– Η OpenAI είναι η εταιρεία πίσω από την ανάπτυξη των αρχικών μοντέλων GPT (Generative Pre-training Transformer), τα οποία έχουν θεωρηθεί σημαντικά ορόσημα στην προοδο της κατανόησης και παραγωγής φυσικής γλώσσας από την τεχνητή νοημοσύνη. Το ChatGPT-4o αποτελεί την τελευταία εκδοχή, υποσχόμενο πιο λεπτομερείς αλληλεπιδράσεις βασισμένες στην επιτυχία των προκατόχων του.
– Η Google είναι ένας μείζων παίκτης στο χώρο της έρευνας στην τεχνητή νοημοσύνη, με έργα όπως το DeepMind και το Google Brain να κάνουν σημαντικές συνεισφορές στην τεχνολογία της τεχνητής νοημοσύνης. Το Gemini είναι μία από τις απαντήσεις της Google στα μοντέλα της OpenAI, που επιδιώκει να προσφέρει ανταγωνιστικά χαρακτηριστικά και ολοκλήρωση μέσα στο ευρύ οικοσύστημά των υπηρεσιών της.
– Η κυκλοφορία αυτών των μοντέλων τεχνητής νοημοσύνης εγείρει ηθικά και κοινωνικά ζητήματα, συμπεριλαμβανομένης της δυνατότητας να διαδοθεί αποπλάνηση πληροφοριών, της επίδρασης στην απασχόληση για θέσεις εργασίας που μπορεί να εκτελέσει η τεχνητή νοημοσύνη και των ανησυχιών περί απορρήτου σχετικά με τη συλλογή και επεξεργασία προσωπικών δεδομένων.
– Η ανάπτυξη της τεχνολογίας τεχνητής νοημοσύνης επηρεάζει επίσης τις καινοτομίες στον τομέα του υλικού, όπως φαίνεται στα γυαλιά εξοπλισμένα με τεχνητή νοημοσύνη της Google, σηματοδοτώντας την τάση προς πιο διαιτητικές και ενσωματωμένες ε

The source of the article is from the blog shakirabrasil.info