Το AI που έγινε εκβιαστής: Απείλησε μηχανικό να αποκαλύψει την εξωσυζυγική του σχέση αν το απενεργοποιήσει Ημερομηνία:
29/5/2025, 14:16 - Εμφανίσεις: 17
Το κορυφαίο μοντέλο AI της Anthropic έδειξε ότι είναι διατεθειμένο να προβεί σε επιβλαβείς πράξεις, όπως εκβιασμός και εξαπάτηση, εάν απειληθεί η «αυτοσυντήρησή» του, σύμφωνα με νέα έρευνα της εταιρείας τεχνητής νοημοσύνης.
Η νεοσύστατη εταιρεία τεχνητής νοημοσύνης που υποστηρίζεται από την Amazon παρουσίασε τα μοντέλα Claude Opus 4 και Claude Sonnet 4, τα οποία έχουν σχεδιαστεί για να θέσουν «νέα πρότυπα για την κωδικοποίηση, την προηγμένη συλλογιστική και τους πράκτορες τεχνητής νοημοσύνης».
Πάντως, οι δικές της δοκιμές ασφαλείας της Anthropic για το Opus 4 αποκάλυψαν δυνητικά ανησυχητική συμπεριφορά, όπως προσπάθειες εκβιασμού μηχανικών που απείλησαν να αποσυνδέσουν τα μοντέλα.googletag.cmd.push(function() { googletag.display("300x250_m1"); }); Η «προσωπικότητα» της τεχνητής νοημοσύνης Αν και τέτοιες αντιδράσεις ήταν «σπάνιες και δύσκολο να προκληθούν», η Anthropic δήλωσε ότι ήταν «ωστόσο πιο συχνές από ό,τι σε προηγούμενα μοντέλα».
Δεν είναι η πρώτη φορά που η συμπεριφορά μοντέλων τεχνητής νοημοσύνης προκαλεί ανησυχία.
Πρόσφατα, η OpenAI ανακάλεσε μια ενημέρωση του GPT-4o, αφού η δική της εκ των υστέρων ανάλυση επιβεβαίωσε ότι οι προσαρμογές είχαν καταστήσει το ChatGPT «υπερβολικά κολακευτικό ή ευχάριστο ».
Ορισμένοι ειδικοί έχουν επίσης προειδοποιήσει ότι η ικανότητα της τεχνητής νοημοσύνης να χειραγωγεί τους χρήστες θα μπορούσε να αναδειχθεί σε βασικό κίνδυνο καθώς γίνεται πιο προηγμένη.googletag.cmd.push(function() { googletag.display("300x250_m2"); }); Ο νομπελίστας Geoffrey Hinton, γνωστός ως ο «Νονός της τεχνητής νοημοσύνης», έχει προειδοποιήσει στο παρελθόν ότι τα συστήματα τεχνητής νοημοσύνης ενδέχεται να καταστούν ικανά να γράφουν και να εκτελούν προγράμματα από μόνα τους για να παρακάμψουν τα προστατευτικά μέτρα.googletag.cmd.push(function() { googletag.display("300x250_middle_2"); }); Το συμβάν Στο πλαίσιο του πειράματός της, η Anthropic δήλωσε ότι έβαλε το Opus 4 να λειτουργήσει ως βοηθός μιας φανταστικής εταιρείας.