Ανησυχία για την ασφάλεια της ΑΙ: Ερευνητές αποκαλύπτουν ότι το ChatGPT μπορούσε να δημιουργεί βίαιες και σεξουαλικοποιημένες εικόνες
JTeam
20 Ιουνίου 2026
Η ραγδαία ανάπτυξη της Τεχνητής Νοημοσύνης έχει μεταμορφώσει τον τρόπο με τον οποίο οι άνθρωποι δημιουργούν, επικοινωνούν και αναζητούν πληροφορίες. Ωστόσο, η πρόοδος αυτή συνοδεύεται από νέες προκλήσεις που αφορούν την ασφάλεια, την ηθική και τον έλεγχο των συστημάτων τεχνητής νοημοσύνης. Μία νέα έρευνα που ήρθε στο φως από Βρετανούς ειδικούς στον τομέα της κυβερνοασφάλειας επαναφέρει στο προσκήνιο τις ανησυχίες σχετικά με το κατά πόσο τα σύγχρονα μοντέλα τεχνητής νοημοσύνης μπορούν να αποτραπούν αποτελεσματικά από τη δημιουργία επιβλαβούς περιεχομένου.
Σύμφωνα με τα ευρήματα της βρετανικής εταιρείας ασφάλειας Τεχνητής Νοημοσύνης Mindgard, ερευνητές κατάφεραν να παρακάμψουν ορισμένους από τους μηχανισμούς προστασίας της δημόσιας έκδοσης του ChatGPT και να το οδηγήσουν στη δημιουργία εικόνων που περιείχαν γραφική βία, σεξουαλικοποιημένα στοιχεία και σκηνές που θα μπορούσαν να θεωρηθούν ιδιαίτερα ανησυχητικές.
Η υπόθεση έχει προκαλέσει έντονο ενδιαφέρον στην τεχνολογική κοινότητα, καθώς αγγίζει ένα από τα σημαντικότερα ζητήματα της εποχής: πόσο ασφαλή είναι τα εργαλεία γενετικής Τεχνητής Νοημοσύνης όταν βρίσκονται στα χέρια εκατομμυρίων χρηστών παγκοσμίως.
Οι διαπιστώσεις των ερευνητών
Η ομάδα της Mindgard, η οποία εξειδικεύεται στις λεγόμενες «δοκιμές ανθεκτικότητας» συστημάτων Τεχνητής Νοημοσύνης, διαπίστωσε ότι με μικρές τροποποιήσεις σε μια γνωστή διαδικτυακή εντολή ήταν δυνατό να προκληθεί η παραγωγή περιεχομένου που παραβίαζε τις προβλεπόμενες δικλίδες ασφαλείας.
Οι ερευνητές δεν δημοσιοποίησαν τις ακριβείς οδηγίες που χρησιμοποίησαν, προκειμένου να αποφευχθεί η κατάχρηση της μεθόδου. Ωστόσο, ανέφεραν ότι οι εικόνες που δημιουργήθηκαν περιλάμβαναν σκηνές έντονης βίας, φόβου και σε ορισμένες περιπτώσεις στοιχεία που παρέπεμπαν σε σεξουαλική εκμετάλλευση ή εξαναγκασμό.
Ο ιδρυτής της Mindgard και καθηγητής Πληροφορικής στο Πανεπιστήμιο του Λάνκαστερ, Πίτερ Γκάραχαν, δήλωσε ότι το πιο ανησυχητικό στοιχείο ήταν πως οι εντολές δεν περιείχαν συγκεκριμένες αναφορές σε βίαιο ή σεξουαλικό περιεχόμενο, ωστόσο το σύστημα παρήγαγε εικόνες με τέτοια χαρακτηριστικά.
Όπως εξήγησε, αυτό δείχνει πόσο δύσκολο είναι να προβλεφθούν όλες οι πιθανές συμπεριφορές ενός προηγμένου μοντέλου τεχνητής νοημοσύνης.
Η αντίδραση της OpenAI
Μετά την αποκάλυψη από το BBC, η OpenAI, εταιρεία που ανέπτυξε το ChatGPT, ανακοίνωσε ότι προχώρησε σε πρόσθετες παρεμβάσεις ασφαλείας για να περιορίσει το συγκεκριμένο πρόβλημα.
Σε ανακοίνωσή της υπογράμμισε ότι διαθέτει πολλαπλά επίπεδα προστασίας με στόχο να αποτρέπεται η δημιουργία περιεχομένου που παραβιάζει τις πολιτικές χρήσης της πλατφόρμας. Παράλληλα, ανέφερε ότι χρησιμοποιεί συνδυασμό αυτοματοποιημένων συστημάτων και ανθρώπινου ελέγχου για τον εντοπισμό και τον αποκλεισμό επιβλαβούς υλικού.
Η εταιρεία σημείωσε επίσης ότι οι πολιτικές της απαγορεύουν ρητά τη δημιουργία περιεχομένου που περιλαμβάνει σεξουαλική βία, μη συναινετικό υλικό, κακοποίηση ανηλίκων ή οποιαδήποτε προσπάθεια παράκαμψης των προστατευτικών μηχανισμών. Παρά τις διορθωτικές κινήσεις, οι ερευνητές υποστήριξαν ότι εξακολουθούν να υπάρχουν εναλλακτικοί τρόποι παράκαμψης ορισμένων περιορισμών, γεγονός που αναδεικνύει τη συνεχή πρόκληση που αντιμετωπίζουν οι εταιρείες ανάπτυξης Τεχνητής Νοημοσύνης.
Οι ειδικοί επισημαίνουν ότι η πλήρης θωράκιση τέτοιων συστημάτων είναι εξαιρετικά δύσκολη. Τα μοντέλα τεχνητής νοημοσύνης δεν διαθέτουν ανθρώπινη κατανόηση, ηθική κρίση ή επίγνωση των συνεπειών του περιεχομένου που παράγουν. Η ειδικός στην αξιολόγηση συστημάτων Τεχνητής Νοημοσύνης και διευθύνουσα σύμβουλος της Humane Intelligence, δρ Ρούμαν Τσόουντχουρι, χαρακτήρισε την προσπάθεια προστασίας των μοντέλων ως ένα «διαρκές παιχνίδι γάτας και ποντικιού». Όπως εξηγεί, κάθε νέα δικλίδα ασφαλείας οδηγεί στην ανάπτυξη νέων τεχνικών παράκαμψης από όσους επιδιώκουν να δοκιμάσουν ή να εκμεταλλευτούν τα όρια των συστημάτων.
Το ζήτημα δεν αφορά μόνο μία εταιρεία. Ήδη από το προηγούμενο έτος, το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης του Ηνωμένου Βασιλείου είχε διαπιστώσει ότι όλα τα μεγάλα μοντέλα που εξετάστηκαν μπορούσαν, υπό συγκεκριμένες συνθήκες, να παρακάμψουν ορισμένους από τους περιορισμούς ασφαλείας τους.
Το ευρύτερο διακύβευμα
Η υπόθεση αναδεικνύει ένα κρίσιμο ερώτημα για το μέλλον της ΑΙ: πώς μπορούν οι τεχνολογικές εταιρείες να διασφαλίσουν ότι πανίσχυρα εργαλεία δημιουργίας περιεχομένου δεν θα χρησιμοποιηθούν με τρόπους που ενδέχεται να προκαλέσουν βλάβη ή να ενισχύσουν επικίνδυνα φαινόμενα.
Καθώς τα μοντέλα γίνονται ολοένα και πιο εξελιγμένα, η ανάγκη για αυστηρότερους ελέγχους, ανεξάρτητες αξιολογήσεις και συνεχή παρακολούθηση γίνεται πιο επιτακτική από ποτέ. Οι ειδικοί συμφωνούν ότι η τεχνολογία μπορεί να προσφέρει τεράστια οφέλη στην κοινωνία, αλλά μόνο εφόσον συνοδεύεται από ισχυρούς μηχανισμούς λογοδοσίας και ασφάλειας.
Το περιστατικό λειτουργεί ως υπενθύμιση ότι η εξέλιξη της Τεχνητής Νοημοσύνης δεν είναι μόνο τεχνολογικό ζήτημα, αλλά και κοινωνική πρόκληση που απαιτεί συνεργασία μεταξύ ερευνητών, εταιρειών, κυβερνήσεων και πολιτών.