Google, το software που περιγράφει ολόκληρες εικόνες με φράσεις

Σήμερα έχουμε ήδη την τεχνολογία η οποία μπορεί να εντοπίζει αντικείμενα σε εικόνες αλλά αυτό που δεν μπορεί να καταφέρει να κάνει καλά είναι η περιγραφή των αντικειμένων αυτών. Το εμπόδιο όμως φαίνεται να ξεπεράστηκε από ερευνητές της Google σε συνεργασία με επιστήμονες από το Stanford University.

Το σύστημά τους συνδυάζει δυο νευρωνικά δίκτυα (neural networks), το ένα είναι για την αναγνώριση εικόνων και το άλλο για την επεξεργασία φυσικής γλώσσας προκειμένου να περιγράψει μια ολόκληρη σκηνή χρησιμοποιώντας φράσεις. Ακόμη, χρειάζονται να γίνουν πολλές βελτιώσεις και να εκπαιδευτεί για την αναγνώριση και περιγραφή περισσότερων εικόνων, όμως έχει την ικανότητα να κάνει αρκετά καλές περιγραφές. Για παράδειγμα στην παρακάτω φωτογραφία δεν αναγνωρίζει απλά έναν άνθρωπο και μια μηχανή, αλλά μπορεί να περιγράψει έναν άνθρωπο πάνω σε μια μηχανή σε χωματόδρομο.

google image recognition, Google, το software που περιγράφει ολόκληρες εικόνες με φράσεις

Το νέο software είναι δυο φορές πιο ακριβές στις περιγραφές του όταν συγκριθεί με προηγούμενους αλγόριθμους. Ακόμη έχει κάποια προβλήματα καθώς δεν δίνει πάντα ακριβείς περιγραφές, όπως συμβαίνει στα παρακάτω παραδείγματα. Ακόμη είναι στην αρχή και λογικά όσο περνάει ο καιρός θα μαθαίνει περισσότερα.

Η νέα τεχνολογία θα μπορούσε να χρησιμοποιηθεί σε διάφορους τομείς από την τεχνητή νοημοσύνη μέχρι και την έρευνα. Για παράδειγμα μελλοντικά θα μπορούσε να βοηθήσει άτομα με προβλήματα όρασης και ρομπότ να κινηθούν καλύτερα στο φυσικό τους περιβάλλον. Επίσης, ένα ρομπότ θα μπορούσε να σου πει τι βλέπει ακριβώς χωρίς να χρειάζεται να κοιτάξεις εσύ την κάμερα ενώ θα μπορούσε να γίνει search για εικόνες χρησιμοποιώντας καθημερινές φράσεις και στα αποτελέσματα να βγουν μόνο αυτές που θέλεις.

Ακόμα πρέπει να περάσει καιρός μέχρι να δούμε τη νέα τεχνολογία να εφαρμόζεται στην καθημερινή ζωή, αλλά στο μέλλον έχουμε να δούμε σημαντικές αλλαγές.

Για παράδειγμα, τα τελευταία 15 χρόνια βλέπουμε να έχουν τοποθετηθεί σε δημόσιους και ιδιωτικούς χώρους κάμερες παρακολούθησης. Στο μέλλον οι κάμερες αυτές δεν θα μπορούν απλά να αντιλαμβάνονται το άτομο που καταγράφουν, μέσω της τεχνολογίας αναγνώρισης προσώπου, αλλά θα είναι ικανές να εντοπίζουν συγκεκριμένες συμπεριφορές οι οποίες όταν θεωρηθούν ύποπτες θα ειδοποιούν αυτόματα τις αρχές.

google image recognition, Google, το software που περιγράφει ολόκληρες εικόνες με φράσεις

Πηγή: 1,2

ΣΥΖΗΤΗΣΗ

Παρακολουθήστε τα σχόλια
Να ειδοποιηθώ όταν
guest

1 Σχόλιο
παλαιότερο
νεώτερο
Inline Feedbacks
View all comments
Τομ

Μου λεγε ενας φιλος προσφατα για τα νευρωνικα δικτυα. Advanced shit..

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Internet Android Chrome Google

Η Google φέρνει κλειδωμένες καρτέλες ανώνυμης περιήγησης στο Chrome για Android

H Google ανακοίνωσε πως το Chrome για Android αποκτά μια νέα λειτουργία, η οποία σας επιτρέπει να κλειδώνετε τις καρτέλες ανώνυμης περιήγησης όταν αποχωρείτε από την εφαρμογή.

Cars Google

Νέα λειτουργία για την Google – Προσφέρει βοήθεια για την αγορά αυτοκινήτων

Η Google κυκλοφορεί μια νέα λειτουργία που θα επιτρέπει στους χρήστες να περιηγούνται σε αυτοκίνητα προς πώληση απευθείας στην Αναζήτηση.

Gear Google Google Pixel

Google Pixel Tablet: Νέες φήμες λένε ότι θα υπάρχει μία μόνο έκδοση

Το Pixel Tablet της Google το περιμένουμε εδώ και πολύ καιρό. Για πρώτη φορά είδαμε teaser τον Μάιο του 2022 αλλά ακόμα δεν έχει γίνει επίσημο.

Smartphones Google Pixel 6 Pixel 7

Google Pixel 6 και 7: Το Play system παίρνει την ενημέρωση Ιανουαρίου 2023

Πολλοί κάτοχοι Pixel 6 και Pixel 7 δηλώνουν στο Reddit ότι βλέπουν την ενημέρωση Play system του Ιανουαρίου 2023 διαθέσιμη για λήψη.