Σάββατο
02/08/2008

Xerox | Λογισμικό που ταξινομεί ταυτόχρονα κείμενο και εικόνες

Οι ερευνητές της Xerox παρουσίασαν πρόσφατα μία τεχνολογία λογισμικού που μπορεί να συνδέσει κείμενο και εικόνες – μια σημαντική εξέλιξη στο πώς ταξινομούνται οι online και οι έγγραφες πληροφορίες. Τα σημερινά εργαλεία ταξινομούν είτε κείμενο είτε εικόνες, ώστε να μπορούν να γίνουν αντικείμενο επεξεργασίας. Μέχρι σήμερα, ωστόσο, κανείς δεν είχε συνδυάσει αποτελεσματικά και τα δύο, σύμφωνα και με τον Marco Bressan, επιστήμονα της πληροφορικής που ηγείτο της ερευνητικής ομάδας στο Xerox Research Centre Europe.

Συνδέοντας περιεχόμενο με τη μορφή εικόνων και περιεχόμενο με τη μορφή κειμένου, η νέα τεχνολογία λογισμικού της Xerox βελτιώνει σημαντικά θεμελιώδεις εργασίες διαχείρισης εγγράφων όπως η ανάκτηση πληροφοριών από μια βάση δεδομένων ή η αυτόματη δρομολόγηση εγγράφων. Το αποτέλεσμα; Περισσότερο ολοκληρωμένες αναζητήσεις και βελτιστοποιημένες επιχειρησιακές διαδικασίες.

Για παράδειγμα, αν ένα φυλλάδιο από ένα απομονωμένο ξενοδοχείο στις Γαλλικές Άλπεις περιγράφει τα χαρακτηριστικά του ξενοδοχείου και περιλαμβάνει χάρτες και φωτογραφίες του ορεινού τοπίου, ο ταξινομητής θα ανακαλύψει αυτόματα το περιεχόμενο και θα συνδέσει το κείμενο και τις εικόνες μεταξύ τους. Έτσι, στη συνέχεια οποιοσδήποτε αναζητά ένα απομακρυσμένο ορεινό κατάλυμα σε ένα συγκεκριμένο εύρος τιμών θα μπορούσε να ανακτήσει το φυλλάδιο, ακόμα και αν η φράση «απομακρυσμένο κατάλυμα στο βουνό» δεν αναφερόταν καθόλου στο αρχικό κείμενο.

Η έρευνα είναι ευθυγραμμισμένη με το στόχο της Xerox να αναπτύξει εξυπνότερα έγγραφα για να κάνει τη δουλειά που βασίζεται σε πληροφορίες ευκολότερη, αποδοτικότερη και πιο αποτελεσματική. Ο Bressan είναι πεπεισμένος ότι υπάρχουν πολλές χρήσεις του νέου λογισμικού ταξινόμησης.

«Ας υποθέσουμε ότι ένας ταξιδιώτης θέλει να συνδυάσει φωτογραφίες από τις διακοπές του με μία καταγραφή των ημερήσιων δραστηριοτήτων του, ώστε να δημιουργήσει ένα φωτογραφικό άλμπουμ με σχόλια ή ένα φωτογραφικό blog που θα συνοψίζει τις πιο ενδιαφέρουσες στιγμές των διακοπών του», ανέφερε ο Bressan. «Επειδή ο ταξινομητής της Xerox χειρίζεται και κείμενο και εικόνες, μπορεί να αναγνωρίσει τις φωτογραφίες, να τις συνδυάσει αυτόματα με το γραπτό κείμενο και στη συνέχεια να εμπλουτίσει τις εικόνες με πρόσθετες πληροφορίες μέσω hyperlinks που θα οδηγούν σε μία βάση γνώσεων όπως είναι η Wikipedia».

Οι παράγοντες που κατέστησαν δυνατή τη δημιουργία του υβριδικού ταξινομητή της Xerox είναι οι πρόσφατες εξελίξεις στη μάθηση των μηχανών και στην αναγνώριση από αυτές σχεδίων, οι εξελίξεις στην «όραση» των υπολογιστών και ο μεγάλος όγκος υβριδικού περιεχομένου που είναι διαθέσιμος σήμερα. Το κέντρο έρευνας XRCE έχει εκτεταμένη εμπειρία με την ταξινόμηση κειμένου, ενώ το 2005 παρουσίασε τον πρώτο γενικό ταξινομητή εικόνων του κλάδου. Ο νέος ταξινομητής συνδυάζει προηγούμενους ταξινομητές κειμένου και εικόνας για να διαχειριστεί υβριδικό περιεχόμενο, με εξαιρετικά αποτελέσματα.

Το συγκεκριμένο λογισμικό βρίσκεται ακόμα υπό ανάπτυξη. Η Xerox έχει ζητήσει την κατοχύρωση ενός αριθμού ευρεσιτεχνιών σχετικών με την εν λόγω τεχνολογία.

Μάθε για:

Συντάκτης: .


Η γνώμη σας

Παρακαλούμε σχολιάστε με ελληνικούς πεζούς χαρακτήρες, όχι greeklish.

Πατώντας "Αποστολή" αποδέχεστε τους Όρους Χρήσης.