ChatGPT-4o: Το νέο μοντέλο της OpenAI είναι μια τεράστια αναβάθμιση – Χρησιμοποιεί κείμενο, όραση και ήχο

ChatGPT, ChatGPT-4o: Το νέο μοντέλο της OpenAI είναι μια τεράστια αναβάθμιση – Χρησιμοποιεί κείμενο, όραση και ήχο

Tη Δευτέρα η OpenAI παρουσίασε το GPT-4o (o για το “omni”), ένα σημαντικό νέο μοντέλο τεχνητής νοημοσύνης που μπορεί φαινομενικά να συνομιλεί χρησιμοποιώντας ομιλία σε πραγματικό χρόνο, διαβάζοντας συναισθηματικές ενδείξεις και ανταποκρινόμενο σε οπτικές εισροές.

Λειτουργεί ταχύτερα από το προηγούμενο καλύτερο μοντέλο της OpenAI, το GPT-4 Turbo, θα είναι δωρεάν για τους χρήστες του ChatGPT και θα είναι διαθέσιμο ως υπηρεσία μέσω του API, που θα κυκλοφορήσει τις επόμενες εβδομάδες, σύμφωνα με την εταιρεία.

Η OpenAI αποκάλυψε τις νέες δυνατότητες σε ένα live streaming στο YouTube με τίτλο “OpenAI Spring Update”, που παρουσιάστηκε από τον CTO του OpenAI Mira Murati και τους υπαλλήλους Mark Chen και Barret Zoph που έδειξαν το GPT-4o σε δράση.

Η OpenAI ισχυρίζεται ότι το GPT-4o ανταποκρίνεται στις εισόδους ήχου σε περίπου 320 χιλιοστά του δευτερολέπτου κατά μέσο όρο, κάτι που είναι παρόμοιο με τους χρόνους απόκρισης του ανθρώπου στη συνομιλία, σύμφωνα με μια μελέτη του 2009, και πολύ μικρότερο από την τυπική καθυστέρηση 2-3 δευτερολέπτων που παρατηρήθηκε με προηγούμενα μοντέλα.

Με το GPT-4o, η OpenAI λέει ότι εκπαίδευσε ένα ολοκαίνουργιο μοντέλο τεχνητής νοημοσύνης από άκρο σε άκρο χρησιμοποιώντας κείμενο, όραση και ήχο με τρόπο που όλες οι είσοδοι και οι έξοδοι “επεξεργάζονται από το ίδιο νευρωνικό δίκτυο”.

«Επειδή το GPT-4o είναι το πρώτο μας μοντέλο που συνδυάζει όλους αυτούς τους τρόπους, εξακολουθούμε να εργαζόμαστε για να εξερευνήσουμε τι μπορεί να κάνει το μοντέλο και τους περιορισμούς του», λέει η OpenAI.

Στην παρουσίαση, έδειξαν τις δυνατότητες συνομιλίας ήχου του GPT-4o σε πραγματικό χρόνο, επιδεικνύοντας την ικανότητά του να εμπλέκεται σε φυσικό, ανταποκρινόμενο διάλογο. Ο βοηθός τεχνητής νοημοσύνης φαινόταν να αντιλαμβάνεται εύκολα τα συναισθήματα, προσάρμοσε τον τόνο και το στυλ του για να ταιριάζει με τα αιτήματα του χρήστη και ακόμη και ενσωμάτωσε ηχητικά εφέ, γέλιο και τραγούδι στις απαντήσεις του.

Οι παρουσιαστές τόνισαν επίσης την βελτιωμένη οπτική κατανόηση του GPT-4o. Ανεβάζοντας στιγμιότυπα οθόνης, έγγραφα που περιέχουν κείμενο και εικόνες ή γραφήματα, οι χρήστες μπορούν  να διεξάγουν συνομιλίες σχετικά με το οπτικό περιεχόμενο και να λαμβάνουν ανάλυση δεδομένων από το GPT-4o. Στη ζωντανή επίδειξη, ο βοηθός τεχνητής νοημοσύνης έδειξε την ικανότητά του να αναλύει τις selfies, να εντοπίζει συναισθήματα και να συμμετέχει σε ανάλαφρα αστεία σχετικά με τις εικόνες.

Επιπλέον, το GPT-4o παρουσίασε βελτιωμένη ταχύτητα και ποιότητα σε περισσότερες από 50 γλώσσες, κάτι που σύμφωνα με την OpenAI καλύπτει το 97 τοις εκατό του παγκόσμιου πληθυσμού. Το μοντέλο παρουσίασε επίσης τις δυνατότητες μετάφρασης σε πραγματικό χρόνο, διευκολύνοντας τις συνομιλίες μεταξύ ομιλητών διαφορετικών γλωσσών με σχεδόν στιγμιαίες μεταφράσεις.

Η OpenAI ανακοίνωσε ότι το GPT-4o θα είναι προσβάσιμο σε όλους τους χρήστες του ChatGPT, με τους συνδρομητές επί πληρωμή να έχουν πέντε φορές μεγαλύτερα όρια χρήσης από τους δωρεάν χρήστες. Το GPT-4o σε μορφή API φέρεται επίσης να διαθέτει διπλάσια ταχύτητα, 50 τοις εκατό χαμηλότερο κόστος και πέντε φορές υψηλότερα όρια ρυθμού σε σύγκριση με το GPT-4 Turbo.

Ο Αντώνης Γιαγδζόγλου είναι δημοσιογράφος με πολλές συνεργασίες με online μέσα. Αρθρογραφεί για νέες τεχνολογίες και τεχνολογίες που βελτιώνουν τη ζωή μας ενώ συνεργάζεται με διαφημιστικές εταιρείες και διαχειρίζεται social media επιχειρήσεων.

Ακολουθήστε το Techblog.gr στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας. Αν χρησιμοποιείτε RSS προσθέστε το Techblog στη λίστα σας https://techblog.gr/feed/.

ΣΥΖΗΤΗΣΗ

Παρακολουθήστε τα σχόλια
Να ειδοποιηθώ όταν
guest

0 Σχόλια
Inline Feedbacks
View all comments

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Software Apple ChatGPT featured

iOS 18: Η Apple δεν πληρώνει την OpenAI για να χρησιμοποιήσει το ChatGPT

Εκτός από το Apple Intelligence, η Apple ανακοίνωσε μια συνεργασία με την OpenAI που θα επιτρέψει στη Siri να έχει πρόσβαση στο ChatGPT.

Business Apple ChatGPT Elon Musk

iOS 18: Ο Elon Musk απειλεί να απαγορεύσει τις συσκευές Apple επειδή ενσωματώνουν το ChatGPT

Ο Elon Musk απείλησε να απαγορεύσει τις συσκευές Apple από τις εταιρείες του λόγω της ανακοίνωσης της Apple ότι ενσωματώνει το ChatGPT.

Software ChatGPT featured

OpenAI: Υπάλληλοι προειδοποιούν για τον κίνδυνο της προηγμένης τεχνητής νοημοσύνης

Αρκετοί νυν και πρώην υπάλληλοι της OpenAI και της Google DeepMind προειδοποιούν για τους κινδύνους της προηγμένης τεχνητής νοημοσύνης.

Software ChatGPT

ChatGPT: Εκτός λειτουργίας το chatbot της OpenAI

Το chatbot ChatGPT της OpenAI υφίσταται επί του παρόντος μια μεγάλη διακοπή λειτουργίας που καθιστά την υπηρεσία μη διαθέσιμη.