Η Apple μίλησε για το θέμα που προέκυψε για τη χρήση δεδομένων για την εκπαίδευση της τεχνητής νοημοσύνης, μετά από έρευνα που αποκάλυψε ότι η εταιρεία, μαζί με άλλους στο χώρο της τεχνολογίας, είχαν χρησιμοποιήσει υπότιτλους στο YouTube για να εκπαιδεύσουν τα μοντέλα τεχνητής νοημοσύνης τους.
Η έρευνα του Wired νωρίτερα αυτή την εβδομάδα ανέφερε ότι πάνω από 170.000 βίντεο από δημοφιλείς δημιουργούς περιεχομένου ήταν μέρος ενός συνόλου δεδομένων που χρησιμοποιείται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Η Apple χρησιμοποίησε συγκεκριμένα αυτό το σύνολο δεδομένων για την ανάπτυξη των μοντέλων OpenELM ανοιχτού κώδικα, τα οποία δημοσιοποιήθηκαν τον Απρίλιο.
Ωστόσο, η Apple έχει πλέον επιβεβαιώσει στο 9to5Mac ότι το OpenELM δεν τροφοδοτεί καμία από τις λειτουργίες AI ή machine learning, συμπεριλαμβανομένου του συστήματος Apple Intelligence της εταιρείας. Η Apple διευκρίνισε ότι το OpenELM δημιουργήθηκε αποκλειστικά για ερευνητικούς σκοπούς, με στόχο την προώθηση της ανάπτυξης μοντέλων μεγάλων γλωσσών ανοιχτού κώδικα.
Κατά την κυκλοφορία του OpenELM στο Hugging Face Hub, μια κοινότητα για κοινή χρήση κώδικα AI, οι ερευνητές της Apple το περιέγραψαν ως ένα «μοντέλο ανοιχτής γλώσσας τελευταίας τεχνολογίας» που είχε σχεδιαστεί για να «ενδυναμώσει και να εμπλουτίσει την ανοιχτή ερευνητική κοινότητα». Το μοντέλο είναι επίσης διαθέσιμο μέσω του ιστότοπου Machine Learning Research της Apple. Η Apple δήλωσε ότι δεν σκοπεύει να αναπτύξει νέες εκδόσεις του μοντέλου OpenELM.
Η εταιρεία τόνισε ότι εφόσον το OpenELM δεν είναι ενσωματωμένο στο Apple Intelligence, το σύνολο δεδομένων «Υπότιτλοι YouTube» δεν χρησιμοποιείται για την τροφοδοσία οποιασδήποτε από τις εμπορικές λειτουργίες AI του.
Η Apple επανέλαβε την προηγούμενη δήλωσή της ότι τα μοντέλα Apple Intelligence εκπαιδεύονται σε “δεδομένα με άδεια χρήσης, συμπεριλαμβανομένων των δεδομένων που επιλέγονται για τη βελτίωση συγκεκριμένων λειτουργιών, καθώς και στα δημόσια διαθέσιμα δεδομένα που συλλέγονται από το πρόγραμμα ανίχνευσης ιστού μας”.
Η αναφορά του Wired περιείχε λεπτομερώς πώς εταιρείες όπως η Apple, η Anthropic και η NVIDIA είχαν χρησιμοποιήσει το σύνολο δεδομένων “Υπότιτλοι YouTube” για εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Αυτό το σύνολο δεδομένων είναι μέρος μιας μεγαλύτερης συλλογής γνωστής ως “The Pile”, η οποία έχει συγκεντρωθεί από τον μη κερδοσκοπικό οργανισμό EleutherAI.
ΣΥΖΗΤΗΣΗ