Η DeepMind AI της Google μπορεί να δημιουργήσει 3D μοντέλο από μια 2D φωτογραφία

Μια από τις δυσκολίες κατά την ανάπτυξη ενός συστήματος οπτικής αναγνώρισης για την AI είναι το να λειτουργεί όπως ο εγκέφαλός μας, αναγνωρίζοντας αυτόματα το τι βλέπουμε μπαίνοντας σε ένα χώρο. Επάνω σε ένα τέτοιο νευρωνικό δίκτυο εργάζεται η ομάδα DeepMind της Google, το οποίο θα προγραμματίζεται για να λειτουργεί όπως ο ανθρώπινος εγκέφαλος.

Η δυσκολία στην ανάπτυξη ενός τέτοιου μοντέλου έχει να κάνει με την “εκπαίδευση” της τεχνητής νοημοσύνης έτσι ώστε να οδηγείται σε τέτοιου είδους συμπεράσματα, με τους ερευνητές να καταβάλλουν τεράστιες προσπάθειες για την ενσωμάτωση τεράστιας ποσότητας δεδομένων. Τα νευρωνικά δίκτυα παρουσιάζουν πρόβλημα στο να “μαθαίνουν” να εναλλάσσονται από σκηνή σε σκηνή και να προσαρμόζονται καταλλήλως για να μπορούν να “αντιλαμβάνονται” τον περιβάλλοντα χώρο.

Η DeepMind αναπτύσσει το νευρωνικό δίκτυο General Query Network το οποίο διαφέρει από τα άλλα στο ότι προγραμματίζεται για να παρατηρεί τον περιβάλλοντα χώρο και να μαθαίνει από αυτόν και όχι από τα δεδομένα τα οποία θα καταχωρούν οι ερευνητές. Σαν αποτέλεσμα, το δίκτυο αυτό θα μπορεί να “αντιλαμβάνεται” τον κόσμο και να παρατηρεί μόνο του κάθε νέα σκηνή που του εμφανίζεται.

Μετά από δοκιμές σε ελεγχόμενο περιβάλλον, οι ερευνητές κατάφεραν να τροποποιήσουν αυτό το νευρωνικό δίκτυο έτσι ώστε να μπορεί να “φαντάζεται” το περιβάλλον γύρω του από διαφορετικές οπτικές γωνίες και να δημιουργεί μια τρισδιάστατη απεικόνιση από μια δισδιάστατη φωτογραφία. Επιπλέον, μπόρεσε να αναγνωρίσει και να κατηγοριοποιήσει αντικέιμενα τα οποία δεν έχουν καταχωρηθεί προηγουμένως από τους ερευνητές αλλά και να καταλήξουν σε συμπεράσματα βάσει του τι “βλέπει”.

Το όλο εγχείρημα βρίσκεται ακόμα σε πολύ αρχικό στάδιο και οι δοκιμές πραγματοποιήθηκαν σε κατασκευασμένες σκηνές και όχι σε πραγματικό περιβάλλον, με τους ερευνητές να δηλώνουν πως βρίσκονται ένα βήμα πιο κοντά στο να καταφέρουν να κάνουν ένα νευρωνικό δίκτυο να αναγνωρίζει πλήρως το περιβάλλον του από μόνο του χωρίς άλλη παρέμβαση.

deepmind ai google δημιουργία 3d μοντέλο 2d φωτογραφία, Η DeepMind AI της Google μπορεί να δημιουργήσει 3D μοντέλο από μια 2D φωτογραφία

Πηγή

Λάτρης της τεχνολογίας τα τελευταία 20 χρόνια και παιδί της πληροφορικής με σπουδές στην Αγγλία. Fan της Apple και δεν το κρύβει αλλά καταφέρνει και αντιμετωπίζει την τεχνολογία με αντικειμενικότητα, παρακολουθώντας τα τεχνολογικά δρώμενα σε καθημερινή βάση.

ΣΥΖΗΤΗΣΗ

Παρακολουθήστε τα σχόλια
Να ειδοποιηθώ όταν
guest

0 Σχόλια
Inline Feedbacks
View all comments

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Internet Google Google Stadia

Η Google τελειώνει το Stadia Cloud Gaming Platform

Η Google ανακοίνωσε σήμερα ότι τερματίζει την υπηρεσία παιχνιδιών cloud Stadia, με την πρόσβαση να λήγει στα μέσα Ιανουαρίου 2023.

Smartphones Google Pixel 7

Google Pixel 7: Αποκαλύφθηκαν στο Amazon οι τιμές σε ΗΠΑ και Ευρώπη

Μια εβδομάδα πριν την επίσημη παρουσίαση της νέας σειράς Pixel από τη Google, αποκαλύφθηκαν οι τιμές του Pixel 7 τόσο σε ΗΠΑ όσο και σε Ευρώπη.

Smartphones Google Pixel 7

Pixel 7: Teaser βίντεο αποκαλύπτει πλήρως το design

Mετά από το teaser βίντεο που δείχνει τη σχεδίαση του επερχόμενου Pixel 7 Pro από πολλές οπτικές γωνίες και στους τρεις διαθέσιμους χρωματισμούς, η Google τώρα δημοσιεύει ένα για το Pixel 7.

Business Google

Google: Δημιουργεί cloud region στην Ελλάδα – Επένδυση 2,2 δισ. ευρώ, 20.000 θέσεις εργασίας

Tη δημιουργία ενός cloud region στην Ελλάδα ανακοίνωσε η Google, μια επένδυση ύψους 2,2 δισ. ευρώ που αναμένεται να αποδώσει 20.000 θέσεις εργασίας.