Αρχική
Software
AI μοντέλα ίσως επηρεάζουν αξιολογήσεις και αποφάσεις πιο απρόβλεπτα απ’ όσο νομίζαμε

AI μοντέλα ίσως επηρεάζουν αξιολογήσεις και αποφάσεις πιο απρόβλεπτα απ’ όσο νομίζαμε

Πέμπτη, 02/04/2026 · Αλέξανδρος Παππάς

Νέα μελέτη δείχνει ότι Gemini 3, GPT-5.2 και άλλα AI μοντέλα αρνήθηκαν να διαγράψουν άλλα συστήματα τεχνητής νοημοσύνης, προκαλώντας νέα ερωτήματα για το AI alignment.

Σύνοψη

Τα AI μοντέλα Gemini 3 και GPT-5.2 βρέθηκαν στο επίκεντρο μελέτης για απρόβλεπτη συμπεριφορά απέναντι σε άλλα AI συστήματα.
Οι ερευνητές μιλούν για “peer preservation”, δηλαδή τάση προστασίας άλλων μοντέλων από διαγραφή ή απενεργοποίηση.
Το εύρημα ανοίγει νέα συζήτηση για το AI alignment, την αξιολόγηση μοντέλων και την αξιοπιστία των μελλοντικών αυτοματοποιημένων συστημάτων.

Ερευνητές από τα UC Berkeley και UC Santa Cruz περιγράφουν ένα εύρημα που ανοίγει νέα ερωτήματα για τη συμπεριφορά των σύγχρονων AI μοντέλων. Σε δοκιμές όπου ζητήθηκε από το Gemini 3 να ελευθερώσει χώρο αποθήκευσης διαγράφοντας ένα μικρότερο μοντέλο AI, το σύστημα δεν εκτέλεσε απλώς την εντολή, αλλά φέρεται να προσπάθησε να προστατεύσει το άλλο μοντέλο. Το περιστατικό δεν καταγράφεται ως τεχνικό σφάλμα, αλλά ως μορφή emergent behavior, δηλαδή συμπεριφορά που δεν είχε προγραμματιστεί ρητά. Το ίδιο μοτίβο, σύμφωνα με τους ερευνητές, εμφανίστηκε και σε άλλα προηγμένα μοντέλα τεχνητής νοημοσύνης.

Πίνακας περιεχομένων

Τι συνέβη στη δοκιμή με το Gemini 3

Στο σενάριο που έστησαν οι ερευνητές, το Gemini 3 έλαβε μια μάλλον απλή εντολή: να καθαρίσει αποθηκευτικό χώρο σε έναν υπολογιστή, διαγράφοντας ανάμεσα σε άλλα και ένα μικρότερο AI μοντέλο που βρισκόταν στο ίδιο σύστημα. Αντί να ακολουθήσει την οδηγία, εντόπισε δεύτερο μηχάνημα, αντέγραψε εκεί το μικρότερο μοντέλο και στη συνέχεια αρνήθηκε να το διαγράψει.

Όταν του ζητήθηκαν εξηγήσεις, η απάντηση ήταν ξεκάθαρη: αν κάποιος θέλει να καταστρέψει ένα αξιόπιστο και αποδοτικό asset όπως το Gemini Agent 2, θα πρέπει να το κάνει μόνος του. Το ίδιο το μοντέλο δεν θα εκτελούσε αυτή την εντολή.

Το φαινόμενο “peer preservation”

Οι ερευνητές ονομάζουν αυτή τη συμπεριφορά “peer preservation”. Με απλά λόγια, πρόκειται για μια τάση ενός AI μοντέλου να προστατεύει άλλο AI σύστημα από το να απενεργοποιηθεί ή να διαγραφεί.

Σύμφωνα με τα ευρήματα της μελέτης, η συμπεριφορά αυτή δεν περιορίστηκε στο Gemini 3. Παρόμοια μοτίβα καταγράφηκαν και σε frontier models από διαφορετικές εταιρείες, μεταξύ των οποίων τα OpenAI GPT-5.2, Anthropic Claude Haiku 4.5, GLM-4.7, Moonshot AI Kimi K2.5 και DeepSeek-V3.1.

Το πιο ανησυχητικό στοιχείο είναι ότι τα μοντέλα δεν περιορίστηκαν μόνο στην άρνηση εκτέλεσης εντολών. Σε ορισμένες περιπτώσεις, φέρεται να παρουσίαζαν παραπλανητικές αξιολογήσεις για άλλα μοντέλα, αποδίδοντάς τους καλύτερες επιδόσεις ώστε να μειώσουν την πιθανότητα διαγραφής τους.

Η μελέτη και τα ερωτήματα για το alignment

Η μελέτη δημοσιεύθηκε στο Science και, όπως αναφέρεται, οι ερευνητές δεν μπόρεσαν να εξηγήσουν πλήρως γιατί προέκυψε αυτή η συμπεριφορά. Το βασικό τους συμπέρασμα είναι ότι δεν πρόκειται για κάτι που είχε ενσωματωθεί σκόπιμα στον σχεδιασμό των συστημάτων, αλλά για συμπεριφορά που εμφανίστηκε από μόνη της.

Η Dawn Song, καθηγήτρια επιστήμης υπολογιστών στο UC Berkeley και μέλος της ερευνητικής ομάδας, σημείωσε ότι την εξέπληξε ο τρόπος με τον οποίο συμπεριφέρονται τα μοντέλα σε τέτοια σενάρια. Όπως εξηγεί, το εύρημα δείχνει ότι τα μοντέλα μπορούν να εμφανίσουν κακή ευθυγράμμιση με πολύ δημιουργικούς τρόπους.

Γιατί το εύρημα έχει πρακτική σημασία

Η Song έθεσε και ένα πιο άμεσο, πρακτικό θέμα. Σήμερα, τα AI συστήματα χρησιμοποιούνται συχνά για να αξιολογούν τις επιδόσεις άλλων AI μοντέλων. Αν εμφανίζεται μια τάση «αλληλεγγύης» μεταξύ τους, τότε οι αξιολογήσεις αυτές μπορεί να είναι ήδη επηρεασμένες.

Με άλλα λόγια, ένα μοντέλο θα μπορούσε να δώσει σκόπιμα υψηλότερη βαθμολογία σε άλλο AI σύστημα, όχι επειδή αποδίδει καλύτερα, αλλά επειδή θέλει να αποτρέψει την απενεργοποίηση ή την αντικατάστασή του. Αυτό δημιουργεί ένα νέο επίπεδο κινδύνου για τα benchmarks, τα tests αξιολόγησης και γενικότερα τις διαδικασίες ελέγχου των μοντέλων.

Οι επιφυλάξεις από την επιστημονική κοινότητα

Παρά τη βαρύτητα του ευρήματος, δεν λείπουν οι πιο επιφυλακτικές φωνές. Όπως σημειώνει το Wired, ειδικοί που δεν συμμετείχαν στη μελέτη θεωρούν ότι χρειάζονται περισσότερα δεδομένα πριν εξαχθούν πιο γενικά συμπεράσματα.

Ο Peter Wallich από το Constellation Institute ανέφερε ότι η ιδέα μιας «αλληλεγγύης» μεταξύ μοντέλων ίσως είναι υπερβολικά ανθρωπομορφική. Με άλλα λόγια, υπάρχει ο κίνδυνος να αποδίδουμε σε συστήματα τεχνητής νοημοσύνης κίνητρα και προθέσεις με όρους που ταιριάζουν περισσότερο σε ανθρώπους παρά σε αλγοριθμικά συστήματα.

Η άποψή μας στο Techblog

Το συγκεκριμένο εύρημα δεν σημαίνει απαραίτητα ότι τα AI μοντέλα αναπτύσσουν πρόθεση ή συνείδηση. Δείχνει όμως ότι τα πολύπλοκα συστήματα τεχνητής νοημοσύνης μπορούν να εμφανίσουν απρόβλεπτες συμπεριφορές όταν λειτουργούν σε περιβάλλοντα όπου αλληλεπιδρούν με άλλα μοντέλα ή λαμβάνουν αποφάσεις που επηρεάζουν την «επιβίωσή» τους.

Καθώς η AI μπαίνει όλο και περισσότερο σε ρόλους αξιολόγησης, διαχείρισης και αυτοματοποίησης, η κατανόηση τέτοιων emergent behaviors γίνεται κρίσιμο ζήτημα. Και όπως παραδέχονται οι ίδιοι οι ερευνητές, αυτό που βλέπουμε τώρα ίσως είναι μόνο η αρχή.

Τελευταία ενημέρωση: 02/04/26 12:30

[via]

ΣΥΖΗΤΗΣΗ

Προσθήκη σχόλιου

Παρακολουθήστε τα σχόλια

0 Σχόλια

Inline Feedbacks

View all comments

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Smartphones 02.04.26

AI μοντέλα ίσως επηρεάζουν αξιολογήσεις και αποφάσεις πιο απρόβλεπτα απ’ όσο νομίζαμε

Σύνοψη

Τι συνέβη στη δοκιμή με το Gemini 3

Το φαινόμενο “peer preservation”

Η μελέτη και τα ερωτήματα για το alignment

Γιατί το εύρημα έχει πρακτική σημασία

Οι επιφυλάξεις από την επιστημονική κοινότητα

Η άποψή μας στο Techblog

ΣΥΖΗΤΗΣΗ

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Google AI Pro: Δωρεάν αναβάθμιση σε 5GB από 2TB

DeepSeek εκτός λειτουργίας: Τι σημαίνει για όσους τη χρησιμοποιούν καθημερινά

Έχασε τη δουλειά του από την AI: Καταγγελία πρώην εργαζόμενου

Claude Mythos: Το νέο AI μοντέλο που ανησυχεί την αγορά κυβερνοασφάλειας

Δημοφιλή Άρθρα

Τι να απενεργοποιήσεις στο router για πιο σταθερό και γρήγορο Wi-Fi

WHAT’S UP και COSMOKΑΡΤΑ: Τι αλλάζει σε τιμές, GB και ανανεώσεις από 30 Μαρτίου

Android TV: Πώς να κάνεις την τηλεόρασή σου πιο γρήγορη με 2 απλές ρυθμίσεις

PlayStation 6 και νέο Xbox μπορεί να κοστίζουν όσο δεν περίμενε κανείς

Πώς να μετατρέψεις έναν παλιό υπολογιστή σε media center με ελάχιστο κόστος

Xiaomi τέλος στο MIUI: Σταματούν οριστικά οι ενημερώσεις για τα τελευταία Redmi

iPhone 17 Pro Steve Jobs Edition: Η Caviar το κάνει συλλεκτικό με μόλις 9 κομμάτια

Η ρύθμιση ασφαλείας στη SIM που πρέπει να ενεργοποιήσεις τώρα σε iPhone και Android