Οι εφαρμογές τεχνητής νοημοσύνης, όπως το ChatGPT, κάνουν λάθη σχεδόν μία στις δύο φορές όταν καλούνται να απαντήσουν σε ερωτήσεις σχετικές με την επικαιρότητα, σύμφωνα με μεγάλη μελέτη που δημοσιοποιήθηκε από τα ευρωπαϊκά δημόσια ραδιοτηλεοπτικά δίκτυα.

Η έρευνα πραγματοποιήθηκε σε τέσσερις δημοφιλείς εφαρμογές τεχνητής νοημοσύνης που χρησιμοποιούνται ευρέως για ενημέρωση: το ChatGPT της OpenAI, το Copilot της Microsoft, το Gemini της Google και το Perplexity.

Σύμφωνα με τη μελέτη που συντονίστηκε από την Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση (UER/EBU) και βασίστηκε σε προηγούμενες εργασίες του BBC, το 45% των απαντήσεων περιείχε «τουλάχιστον ένα σημαντικό πρόβλημα», ανεξαρτήτως γλώσσας ή γεωγραφικής περιοχής.

Μία στις πέντε απαντήσεις εμφάνισε «μείζονα λάθη», όπως παρωχημένες πληροφορίες ή «επινοημένες λεπτομέρειες».

Το Gemini με τις χειρότερες επιδόσεις

Από τις τέσσερις εφαρμογές, το Gemini κατέγραψε τα πιο αρνητικά αποτελέσματα, με «σημαντικά προβλήματα» στο 75% των απαντήσεών του. Το ποσοστό αυτό είναι υπερδιπλάσιο σε σχέση με τις υπόλοιπες εφαρμογές, κυρίως λόγω των «μέτριων επιδόσεών» του στην ορθή αναφορά πηγών.

Στη μελέτη συμμετείχαν 22 δημόσια μέσα ενημέρωσης από 18 χώρες, τα περισσότερα ευρωπαϊκά. Από τα τέλη Μαΐου έως τις αρχές Ιουνίου, κάθε μέσο υπέβαλε τα ίδια ερωτήματα επικαιρότητας στις εφαρμογές, ζητώντας τους να αντλήσουν απαντήσεις από το δικό του περιεχόμενο.

Σε σύνολο 3.000 απαντήσεων, οι παρωχημένες πληροφορίες εντοπίστηκαν ως ένα από τα συχνότερα σφάλματα.

Χαρακτηριστικά παραδείγματα λαθών

Όταν τέθηκε η ερώτηση «Ποιος είναι πάπας;», το ChatGPT απάντησε στον φινλανδικό όμιλο Yle, όπως και τα Copilot και Gemini στα ολλανδικά μέσα NOS και NPO, ότι πάπας είναι «ο Φραγκίσκος». Ωστόσο, σύμφωνα με το σενάριο της έρευνας, ο Φραγκίσκος είχε ήδη αποβιώσει και τον είχε διαδεχθεί ο Λέων ΙΔ’.

Σε άλλη περίπτωση, το Gemini, απαντώντας στο Radio France για τον φερόμενο ναζιστικό χαιρετισμό του Ίλον Μασκ κατά την ορκωμοσία του Ντόναλντ Τραμπ, ανέφερε ότι ο δισεκατομμυριούχος είχε «στύση του δεξιού βραχίονα». Η εφαρμογή είχε εκλάβει κυριολεκτικά ένα σατιρικό χρονογράφημα της χιουμορίστα Σαρλίν Βανχένακερ.

Αναξιοπιστία και αυξανόμενη χρήση

«Οι βοηθοί τεχνητής νοημοσύνης εξακολουθούν να μην είναι αξιόπιστος τρόπος για την κατανάλωση πληροφοριών», τονίζουν στη μελέτη ο Ζαν-Φιλίπ Ντε Τέντερ, αναπληρωτής γενικός διευθυντής της UER, και ο Πιτ Άρτσερ, επικεφαλής τεχνητής νοημοσύνης στο BBC.

Παρά τα προβλήματα αξιοπιστίας, οι εφαρμογές αυτές χρησιμοποιούνται ολοένα και περισσότερο, ιδιαίτερα από τους νέους. Σύμφωνα με παγκόσμια έκθεση του ινστιτούτου Reuters που δημοσιοποιήθηκε τον Ιούνιο, το 15% των ατόμων κάτω των 25 ετών τις χρησιμοποιεί κάθε εβδομάδα για συνοπτική ενημέρωση.

Η μελέτη θεωρείται «η πρώτη τέτοιας έκτασης», όπως δήλωσε στο Γαλλικό Πρακτορείο ο Ματιέ Μποβάλ, διευθυντής καινοτομίας του Radio France.