Μελέτη του MIT βρίσκει λάθη και ανακρίβειες στις βάσεις δεδομένων

Μελέτη του MIT βρίσκει λάθη και ανακρίβειες στις βάσεις δεδομένων

Ένα ποσοστό 3% των δεδομένων σε βάσεις δεδομένων παρουσιάζονται ως ανακριβή και λανθασμένα, σύμφωνα με μελέτη του MIT. Το ζήτημα αυτό μπορεί να έχει συνέπειες σε συστήματα machine learning που βασίζονται στις βάσεις δεδομένων.

Οι ερευνητές του MIT εξέτασαν πακέτα δεδομένων που περιλαμβάνονται σε βάσεις δεδομένων που χρησιμοποιούν γνωστές διαδικτυακές υπηρεσίες, όπως το IMDB, το Amazon και άλλες, προκειμένου να ανακαλύψουν πιθανά λάθη και σφάλματα.

Σε πολλές περιπτώσεις εμφανίστηκαν λάθη στις εγγραφές και τα αποτελέσματα αναζήτησης, με χαρακτηριστικές περιπτώσεις λανθασμένης χρήσης ετικέτας σε YouTube videos και άλλες περιπτώσεις. Για την αναζήτηση λαθών, οι ερευνητές του MIT χρησιμοποίησαν την τεχνική του confident learning, όπως ονομάζεται, μαζί με το εργαλείο Mechanical Turk.

Σε ένα πολύ μεγάλο ποσοστό οι ερευνητές εντόπισαν λάθη στις ετικέτες που χρησιμοποιούνται, κάτι που μπορεί να οδηγήσει αντιστοίχως και σε λανθασμένα αποτελέσματα αναζήτησης. Αυτό δεν μπορεί παρά να σημαίνει ότι απέχουμε ακόμα αρκετά από το να θεωρήσουμε ότι η Τεχνητή Νοημοσύνη μπορεί να λειτουργεί αυτόνομα. Υπάρχει μεγάλο περιθώριο βελτιώσεων, αφού η μηχανική μάθηση είναι η βάση της ανάπτυξης της Τεχνητής Νοημοσύνης.

Ακολουθήστε το Techblog.gr στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας. Αν χρησιμοποιείτε RSS προσθέστε το Techblog στη λίστα σας https://techblog.gr/feed.

ΣΥΖΗΤΗΣΗ

Παρακολουθήστε τα σχόλια
Να ειδοποιηθώ όταν
guest
0 Σχόλια
Inline Feedbacks
View all comments

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Software WhatsApp

Το WhatsApp επεκτείνει το WhatsApp Pay σε 40 εκατομμύρια χρήστες στην Ινδία

Η WhatsApp κέρδισε ρυθμιστική έγκριση από την National Payments Corporation of India (NPCI) για να επεκτείνει την υπηρεσία πληρωμών WhatsApp Pay στην Ινδία σε 40 εκατομμύρια χρήστες, όπως αναφέρει το Reuters.

Software MediaTek

Το MediaTek Dimensity 9000 θα είναι διπλάσιο από το κόστος του προκατόχου του

Η Qualcomm αναμένεται να ανακοινώσει το επερχόμενο κορυφαίο chipset υψηλής απόδοσης την επόμενη εβδομάδα, κατά τη διάρκεια της Tech Summit.

Software Huawei

Malware ανακαλύφθηκε σε πολλά από τα games του Huawei AppGallery

H ομάδα ειδικών ασφαλείας Dr Web ανακάλυψε το trojan Cynos.7 σε 9.3 εκατομμύρια downloads του Huawei AppGallery.

Software Spotify TikTok

Το Spotify πειραματίζεται με μια ροή βίντεο τύπου TikTok

Όπως αναφέρει το TechCrunchο, το Spotify δοκιμάζει μια νέα ροή βίντεο, τύπου TikTok, στην εφαρμογή beta iOS.