Αρχική
Software
Τα AI έπαιξαν στοίχημα στην Premier League και τα έχασαν όλα

Τα AI έπαιξαν στοίχημα στην Premier League και τα έχασαν όλα

12/04/2026 · Ενημερώθηκε: 12/04/26 · Κώστας Βλαχάκης

Μελέτη αποδεικνύει ότι μοντέλα AI από Google, OpenAI, Anthropic και xAI έχασαν χρήματα στοιχηματίζοντας σε αγώνες της Premier League 2023-24.

Σύνοψη

Η μελέτη KellyBench της General Reasoning αποδεικνύει ότι κορυφαία AI μοντέλα αδυνατούν να αποκομίσουν κέρδος στοιχηματίζοντας στην Premier League.
Το Claude Opus 4.6 της Anthropic τα πήγε καλύτερα με μέση απώλεια 11%, ενώ το Grok 4.20 της xAI χρεοκόπησε.
Τα ευρήματα αναδεικνύουν το χάσμα μεταξύ των δυνατοτήτων της AI σε στατικά προβλήματα και της αδυναμίας της σε δυναμικά, απρόβλεπτα περιβάλλοντα.

Οκτώ από τα πιο προηγμένα συστήματα τεχνητής νοημοσύνης στον κόσμο δοκιμάστηκαν σε μια εικονική αναπαράσταση της σεζόν 2023-24 της Premier League, με καθένα να ξεκινά με κεφάλαιο £100.000 για στοιχήματα. Το αποτέλεσμα; Κανένα δεν βγήκε κερδισμένο. Η μελέτη «KellyBench», που δημοσίευσε αυτή την εβδομάδα η λονδρέζικη εταιρεία General Reasoning, αναδεικνύει τα όρια της AI σε σενάρια του πραγματικού κόσμου με μακροπρόθεσμο ορίζοντα.

Πίνακας περιεχομένων

Το πείραμα

Η General Reasoning έδωσε στα AI συστήματα λεπτομερή ιστορικά δεδομένα, στατιστικά κάθε ομάδας και αποτελέσματα προηγούμενων αγώνων. Κάθε μοντέλο έπρεπε να χτίσει τη δική του στρατηγική στοιχήματος — μεγιστοποιώντας αποδόσεις και διαχειριζόμενο κίνδυνο — και να στοιχηματίζει σε αποτελέσματα αγώνων και αριθμό γκολ καθώς η σεζόν εξελισσόταν. Κανένα μοντέλο δεν είχε πρόσβαση στο διαδίκτυο κατά τη διάρκεια του πειράματος, και σε κάθε σύστημα δόθηκαν τρεις ξεχωριστές προσπάθειες.

Τα AI συστήματα που δοκιμάστηκαν προέρχονταν από τις Google, OpenAI, Anthropic και xAI — δηλαδή τους μεγαλύτερους παίκτες του κλάδου. Κανένα δεν κατάφερε να κλείσει θετικά το σύνολο των προσπαθειών του.

Ποιος τα πήγε καλύτερα — και πόσο

Το Claude Opus 4.6 της Anthropic ήταν το λιγότερο κακό: κατέγραψε μέση απώλεια 11% κατά τη διάρκεια της σεζόν. Το Gemini 3.1 Pro της Google κατάφερε κέρδος 34% σε μία από τις τρεις προσπάθειές του, αλλά χρεοκόπησε σε άλλη. Το Grok 4.20 της xAI ήταν το χειρότερο: χρεοκόπησε σε μία προσπάθεια και δεν κατάφερε να ολοκληρώσει τις άλλες δύο.

Οι συγγραφείς της μελέτης συνοψίζουν με σαφήνεια: κάθε μοντέλο που αξιολογήθηκε έχασε χρήματα κατά τη διάρκεια της σεζόν, και πολλά βίωσαν πλήρη κατάρρευση της επένδυσής τους. Η τεχνητή νοημοσύνη υποαπέδωσε συστηματικά σε σύγκριση με ανθρώπινους αναλυτές στο ίδιο σενάριο.

Γιατί η AI δυσκολεύεται σε αυτό το είδος εργασιών

Ο Ρος Τέιλορ, διευθύνων σύμβουλος της General Reasoning, εξήγησε στους Financial Times ότι υπάρχει μεγάλος ενθουσιασμός για τον αυτοματισμό AI, αλλά ελάχιστη αξιολόγηση της απόδοσής του σε μακροπρόθεσμο ορίζοντα. Σύμφωνα με τον ίδιο, τα περισσότερα benchmarks που χρησιμοποιούνται για τον έλεγχο AI ορίζονται σε «πολύ στατικά περιβάλλοντα» που δεν αντικατοπτρίζουν το χάος και την πολυπλοκότητα του πραγματικού κόσμου. Το ποδόσφαιρο, με τους τραυματισμούς, τις τακτικές αλλαγές και την απρόβλεπτη φύση του, αποτελεί ακριβώς τέτοιο περιβάλλον.

Η μελέτη δεν έχει ακόμα αξιολογηθεί από ομότιμους ερευνητές (peer review), ωστόσο τα ευρήματά της προσφέρουν ένα σημαντικό αντίβαρο στις υπερβολές της Silicon Valley για την ικανότητα της AI να αντικαταστήσει ανθρώπινη κρίση σε σύνθετα, δυναμικά περιβάλλοντα.

Η άποψή μας στο Techblog

Το πείραμα αυτό είναι χρήσιμη υπενθύμιση για τους χρήστες που ίσως έχουν ακούσει ότι το AI «τα ξέρει όλα»: τα μοντέλα τα πάνε εξαιρετικά σε προβλήματα με σαφείς κανόνες, αλλά δυσκολεύονται όταν πρέπει να προσαρμοστούν σε ένα χαοτικό και συνεχώς μεταβαλλόμενο περιβάλλον. Το ποδόσφαιρο — και η αγορά στοιχημάτων — παραμένουν ακόμα προνομιακά πεδία της ανθρώπινης κρίσης.

Newsletter Techblog

Κάθε Παρασκευή στις 19:00 — smartphones, προσφορές, επιλογές. Χωρίς spam.

Εγγραφόμενος αποδέχεσαι την Πολιτική Απορρήτου.

Συχνές Ερωτήσεις

Ποια AI μοντέλα συμμετείχαν στη μελέτη KellyBench;

Δοκιμάστηκαν οκτώ κορυφαία συστήματα από τις εταιρείες Google, OpenAI, Anthropic και xAI, με κάθε μοντέλο να έχει τρεις προσπάθειες.

Πόσα χρήματα είχε στη διάθεσή του κάθε AI για στοιχήματα;

Κάθε σύστημα ξεκινούσε κάθε προσπάθεια με κεφάλαιο £100.000.

Ποιο AI απέδωσε καλύτερα στο πείραμα;

Το Claude Opus 4.6 της Anthropic κατέγραψε τη μικρότερη απώλεια, κατά μέσο όρο 11% του κεφαλαίου του.

Γιατί η AI αποτυγχάνει σε τέτοιες εργασίες;

Τα τρέχοντα AI συστήματα εκπαιδεύονται και αξιολογούνται σε στατικά περιβάλλοντα, ενώ το ποδόσφαιρο είναι δυναμικό και απρόβλεπτο.

Έχει αξιολογηθεί η μελέτη από ανεξάρτητους ερευνητές;

Όχι ακόμα — η εργασία της General Reasoning δεν έχει υποβληθεί σε peer review κατά τη δημοσίευσή της.

[via]

Σχόλια

Προσθήκη σχόλιου

Αφήστε μια απάντηση Ακύρωση απάντησης

Σχετικά άρθρα

Internet 11.04.26

Τι είναι το Claude Mythos AI και γιατί δεν επιτρέπεται σε κανέναν να το χρησιμοποιήσει

Η Anthropic κράτησε κλειστό το Claude Mythos Preview, ένα AI που εντοπίζει και «οπλοποιεί» κρίσιμες ευπάθειες λογισμικού.

Cars 03.04.26

Μίλα με το ChatGPT οδηγώντας: Το AI μπήκε επίσημα στο αυτοκίνητό σου

Το ChatGPT Voice Mode και το Google Meet είναι πλέον διαθέσιμα μέσω Apple CarPlay σε iPhone με iOS 26.4. Δείτε πώς λειτουργούν και ποιοι είναι οι περιορισμοί.

Software 20.03.26

Η OpenAI θέλει να βάλει ChatGPT, browser και coding tools σε μία μόνο εφαρμογή

Η OpenAI φέρεται να ετοιμάζει ενιαία desktop εφαρμογή με ChatGPT, browser και Codex, δίνοντας έμφαση στην παραγωγικότητα και στα agentic AI εργαλεία.

Software 18.03.26

Google αλλάζει το Search: Οι απαντήσεις θα βασίζονται και στα δικά σου δεδομένα

Η Google επεκτείνει το Personal Intelligence στο Search, το Gemini app και το Chrome, φέρνοντας πιο προσωποποιημένες AI απαντήσεις με δεδομένα από Gmail και Photos.