Το Gemini Omni αλλάζει τα πάντα στα βίντεο — δες τι μπορεί να κάνει

Software

Το Gemini Omni της Google κυκλοφόρησε σήμερα — δημιουργεί βίντεο από εικόνες, ήχο και κείμενο, με επεξεργασία μέσω φυσικής γλώσσας. Διαθέσιμο στο YouTube Shorts δωρεάν.

Gemini Omni

Σύνοψη

  • Το Gemini Omni είναι το νέο AI μοντέλο της Google που δημιουργεί και επεξεργάζεται βίντεο από οποιοδήποτε συνδυασμό εικόνας, ήχου, κειμένου και βίντεο.

  • Το πρώτο μοντέλο της οικογένειας, Gemini Omni Flash, είναι ήδη διαθέσιμο για συνδρομητές AI Plus/Pro/Ultra και δωρεάν στο YouTube Shorts.

  • Κάθε βίντεο φέρει αόρατο υδατογράφημα SynthID για επαλήθευση της AI προέλευσής του.

Η Google παρουσίασε το Gemini Omni — ένα νέο AI μοντέλο που συνδυάζει για πρώτη φορά τις ικανότητες συλλογισμού του Gemini με δημιουργία βίντεο. Το πρώτο μέλος της οικογένειας, το Gemini Omni Flash, είναι ήδη διαθέσιμο μέσω της εφαρμογής Gemini, του Google Flow και του YouTube Shorts.

Τι κάνει το Gemini Omni που δεν έκανε τίποτα άλλο πριν

Το Gemini Omni δέχεται ως είσοδο οποιδήποτε συνδυασμό εικόνας, ήχου, βίντεο και κειμένου, και παράγει βίντεο υψηλής ποιότητας που λαμβάνουν υπόψη νόμους φυσικής, ιστορικό πλαίσιο και αφηγηματική συνέχεια. Στην πράξη, αυτό σημαίνει ότι μπορεί κανείς να ανεβάσει ένα βίντεο που έχει τραβήξει ο ίδιος και να του δώσει εντολές με φυσική γλώσσα — «άλλαξε το φωτισμό», «πρόσθεσε έναν χαρακτήρα», «κάνε τα φύλλα bioluminescent» — και το μοντέλο εφαρμόζει κάθε αλλαγή διατηρώντας τη συνέχεια της σκηνής.

Το Gemini Omni επεξεργάζεται βίντεο μέσω συνομιλίας, όπου κάθε νέα οδηγία χτίζεται πάνω στην προηγούμενη. Αυτό διαφέρει από τα υπάρχοντα εργαλεία AI video, που συνήθως επανεκκινούν τη δημιουργία από μηδέν με κάθε αίτημα.

Φυσική, χαρακτήρες και πολυτροπική κατανόηση

Ένα από τα βασικά χαρακτηριστικά του Omni είναι η βελτιωμένη κατανόηση φυσικών νόμων — βαρύτητα, κινητική ενέργεια, ρευστοδυναμική — που επιτρέπει πιο ρεαλιστικές σκηνές. Παράλληλα, οι χαρακτήρες παραμένουν οπτικά συνεπείς ακόμα και αν αλλάξει το περιβάλλον ή το στιλ βίντεο.

Το μοντέλο μπορεί επίσης να χρησιμοποιεί ταυτόχρονα εικόνα χαρακτήρα, βίντεο αναφοράς κίνησης και ηχητικό αρχείο για να παράγει ένα ενιαίο αποτέλεσμα. Η υποστήριξη για περισσότερους τύπους ήχου ως είσοδο προγραμματίζεται σε επόμενο στάδιο.

Avatar, SynthID και ζητήματα διαφάνειας

Το Gemini Omni περιλαμβάνει λειτουργία Avatar που επιτρέπει στον χρήστη να δημιουργεί βίντεο με τη δική του φωνή και εικόνα. Η Google τονίζει ότι η επεξεργασία φωνής τρίτων ατόμων βρίσκεται ακόμα σε φάση αξιολόγησης. Όλα τα βίντεο που παράγονται από το Omni φέρουν αόρατο ψηφιακό υδατογράφημα SynthID, που μπορεί να επαληθευτεί μέσω της εφαρμογής Gemini, του Gemini στο Chrome και της Google Αναζήτησης.

Διαθεσιμότητα

Το Gemini Omni Flash είναι ήδη διαθέσιμο για συνδρομητές Google AI Plus, Pro και Ultra παγκοσμίως. Στο YouTube Shorts και το YouTube Create App θα είναι διαθέσιμο δωρεάν από αυτή την εβδομάδα. Πρόσβαση μέσω API για developers και εταιρικούς πελάτες αναμένεται τις επόμενες εβδομάδες.

Η άποψή μας στο Techblog

Το Gemini Omni είναι η πρώτη φορά που ένα μεγάλο AI μοντέλο δεν απλώς «δημιουργεί» βίντεο, αλλά το «συνεχίζει» νοητά βάσει αυτού που ήδη συμβαίνει στη σκηνή. Αν αυτό λειτουργεί όπως υπόσχεται, η επεξεργασία βίντεο πάει να αλλάξει ριζικά — ακόμα και για τον κοινό χρήστη που θέλει απλώς να κάνει ένα βίντεο από κινητό λίγο πιο ενδιαφέρον. Το πόσο καλά αντέχει στην καθημερινή χρήση θα φανεί σύντομα, μιάς και η πρόσβαση ανοίγει για όλους μέσω YouTube Shorts.

Προσθήκη ως προτιμώμενη πηγή στα αποτελέσματα Google

Σου άρεσε το άρθρο;
Υποστήριξε την ανεξάρτητη τεχνολογική ενημέρωση.

Συχνές Ερωτήσεις

Τι είναι το Gemini Omni;

Είναι το νέο AI μοντέλο της Google που συνδυάζει συλλογισμό και δημιουργία βίντεο, δεχόμενο ως είσοδο εικόνες, ήχο, βίντεο και κείμενο ταυτόχρονα.

Ποιο είναι το πρώτο μοντέλο της οικογένειας Omni;

Το Gemini Omni Flash, που κυκλοφόρησε στις 19 Μαΐου 2026 μέσω εφαρμογής Gemini, Google Flow και YouTube Shorts.

Είναι δωρεάν το Gemini Omni;

Μέσω YouTube Shorts και YouTube Create App διατίθεται δωρεάν· για την εφαρμογή Gemini απαιτείται συνδρομή Google AI Plus, Pro ή Ultra.

Τι είναι το SynthID στα βίντεο του Omni;

Είναι αόρατο ψηφιακό υδατογράφημα που ενσωματώνεται σε κάθε AI-generated βίντεο και μπορεί να επαληθευτεί μέσω Gemini και Google Search.

Πότε θα είναι διαθέσιμο το Gemini Omni για developers;

Η πρόσβαση μέσω API για developers και εταιρικούς πελάτες αναμένεται εντός των επόμενων εβδομάδων.

Newsletter Techblog
Κάθε Παρασκευή στις 19:00 — smartphones, προσφορές, επιλογές. Χωρίς spam.

Με την εγγραφή σας αποδέχεστε την Πολιτική Απορρήτου.

Σχόλια

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Ροή ειδήσεων