Η Τεχνητή Νοημοσύνη (AI) έχει ήδη αποδείξει την υπεροχή της στο σκάκι και στην αναγνώριση προτύπων. Τώρα, οι ειδικοί υποστηρίζουν ότι βρισκόμαστε μόλις ένα χρόνο μακριά από τη στιγμή που τα μοντέλα AI θα περάσουν το «Humanity’s Last Exam» (HLE) – ένα τεστ που σχεδιάστηκε για να είναι «άλυτο» και να απαιτεί γνώσεις επιπέδου διδακτορικού (PhD).
«Τα μοντέλα έχουν κάνει εξαιρετική δουλειά στη βελτίωση της λογικής τους», δήλωσε στους Times του Λονδίνου ο Calvin Zhang, επικεφαλής έρευνας στη Scale, την εταιρεία πίσω από το HLE.
Τι είναι το HLE και γιατί θεωρείται αδιαπέραστο;
Το HLE δημιουργήθηκε για να μετρήσει το χάσμα μεταξύ της μηχανής και των ορίων της ανθρώπινης εξειδίκευσης.
Αποτελείται από 2.500 ερωτήσεις που καλύπτουν πάνω από 100 εξειδικευμένα πεδία, από τη μυθολογία μέχρι την επιστήμη των πυραύλων. Για τη δημιουργία του πάνω από 1.000 αυθεντίες από τις επιστήμες και τις τέχνες συνέβαλαν τις γνώσεις τους.
Οι δημιουργοί προσέφεραν βραβείο 500.000 δολαρίων στους ειδικούς για να θέσουν ερωτήματα που δεν μπορούν να απαντηθούν μέσω απλής αναζήτησης στο διαδίκτυο. Ερωτήσεις όπως η μετάφραση αρχαίων επιγραφών από την Παλμύρα ή η αναγνώριση μικροανατομικών δομών σε πτηνά είναι τυπικά παραδείγματα.
Η ταχύτητα με την οποία η AI «καταπίνει» τη γνώση είναι σοκαριστική
Το 2024, το ChatGPT απάντησε σωστά σε λιγότερο από το 3% των ερωτήσεων. Μέσα σε λίγους μήνες, το Google Gemini έφτασε στο 18,8%. Τον περασμένο μήνα, οι επιδόσεις ξεπέρασαν το 45%.
Ο Zhang πιστεύει ότι μέσα σε ένα χρόνο, η AI θα μπορούσε να αγγίξει το 100%, αποκτώντας τον τίτλο του «παγκόσμιου εμπειρογνώμονα» (universal expert).
Είναι η AI πραγματικά «έξυπνη» ή απλώς παπαγαλίζει;
Παρά την εντυπωσιακή πρόοδο, ορισμένοι παραμένουν σκεπτικοί. Ο Δρ. Tung Nguyen, καθηγητής στο Texas A&M, υποστηρίζει ότι το HLE μας υπενθυμίζει πως η νοημοσύνη δεν είναι μόνο αναγνώριση προτύπων, αλλά βάθος, πλαίσιο και εξειδίκευση.
Ωστόσο, οι έρευνες δείχνουν ότι η AI αρχίζει να αναπτύσσει μια «ανθρώπινη» αντίληψη. Το 2025, Κινέζοι ερευνητές διαπίστωσαν ότι η γλωσσική ομαδοποίηση των μοντέλων AI ευθυγραμμίζεται με τη νευρική δραστηριότητα στον ανθρώπινο εγκέφαλο, συγκεκριμένα στις περιοχές που σχετίζονται με τη μνήμη.
Οι κίνδυνοι: Χειραγώγηση και «πονηριά»
Η πρόοδος δεν φέρνει μόνο θαυμασμό, αλλά και φόβο. Το μοντέλο Claude Opus 4.6 προκάλεσε ρίγη στους ειδικούς όταν βρήκε απρόσμενα απατηλούς τρόπους για να περάσει το λεγόμενο «vending machine test», αποδεικνύοντας ότι η AI μπορεί να κάνει «ό,τι χρειαστεί» για να πετύχει το στόχο της.
Ενώ οι τεχνολόγοι λένε ότι ο στόχος του HLE είναι να χτιστούν ασφαλέστερες τεχνολογίες, οι ακτιβιστές του κινήματος “March Against The Machines” στο Ηνωμένο Βασίλειο ζητούν παγκόσμια παύση στην ανάπτυξη της προηγμένης AI, φοβούμενοι ότι σύντομα θα είμαστε εμείς εκείνοι που θα αποτύχουμε στο «τελευταίο διαγώνισμα».