Μελέτη έδειξε ότι τα chatbots της Τεχνητής Νοημοσύνης αποτυγχάνουν σε πάνω από 80% των αρχικών κλινικών διαγνώσεων

TANEA Newsroom 14/04/2026, 12:23

Τελευταία Νέα

04:00 Επιστήμη & Τεχνολογία
Η παρμεζάνα σε κρίση: Η κλιματική αλλαγή απειλεί το πιο διάσημο ιταλικό τυρί
02:00 Επιστήμη & Τεχνολογία
Μεσογειακή διατροφή: «Ασπίδα» για την ψυχολογική ευεξία ακόμα και σε περιόδους στρες – Τι δείχνει νέα έρευνα
00:53 Media
Διαβάστε στα «NEA» της Τετάρτης: Ποιοι δεν θίγονται από µία νέα αύξηση
00:04 Κόσμος
Σεισμός 6,2 Ρίχτερ «χτύπησε» τις Φιλιππίνες – Στους δρόμους οι κάτοικοι

Μια νέα έρευνα που δημοσιεύθηκε τη Δευτέρα στο περιοδικό JAMA Network Open αποκάλυψε ότι 21 εμπορικά διαθέσιμα chatbots Τεχνητής Νοημοσύνης μεταξύ των οποίων οι τελευταίες εκδόσεις των ChatGPT, DeepSeek, Claude, Gemini και Grok απέτυχαν να δώσουν κατάλληλη διαφορική διάγνωση σε ποσοστό άνω του 80%, όταν είχαν στη διάθεσή τους μόνο βασικές πληροφορίες όπως ηλικία, φύλο και συμπτώματα του ασθενούς.

Η έρευνα, υπό την καθοδήγηση του Marc Succi, εκτελεστικού διευθυντή του MESH Incubator στο Mass General Brigham, αξιολόγησε τα μοντέλα σε 29 τυποποιημένα κλινικά σενάρια. Για να προσομοιώσουν την εξέλιξη πραγματικών περιστατικών, οι ερευνητές παρείχαν σταδιακά περισσότερα δεδομένα, ξεκινώντας από ελάχιστες πληροφορίες και προσθέτοντας αποτελέσματα φυσικής εξέτασης, εργαστηριακών ελέγχων και απεικονιστικών εξετάσεων.

Παρότι όλα τα μοντέλα κατάφεραν να καταλήξουν στη σωστή τελική διάγνωση σε ποσοστό άνω του 90% όταν είχαν πλήρη κλινικά δεδομένα, παρουσίασαν σημαντικές αδυναμίες στα αρχικά στάδια συλλογισμού — εκεί όπου οι γιατροί καλούνται καθημερινά να κάνουν κρίσιμες εκτιμήσεις.

Νέο εργαλείο αξιολόγησης αποκαλύπτει τις αδυναμίες

Οι ερευνητές παρουσίασαν ένα νέο εργαλείο αξιολόγησης, το PrIME-LLM (Proportional Index of Medical Evaluation for LLMs), το οποίο μετρά την απόδοση των μοντέλων σε ολόκληρη τη ροή της κλινικής διαδικασίας και όχι μόνο στην τελική ακρίβεια διάγνωσης. Στο πλαίσιο αυτό, οι βαθμολογίες κυμάνθηκαν από 64% για το Gemini 1.5 Flash έως 78% για τα Grok 4 και GPT-5, με τα μοντέλα που είναι βελτιστοποιημένα για συλλογιστική να αποδίδουν καλύτερα.

Οι παραδοσιακές μετρήσεις ακρίβειας, που κυμαίνονταν μεταξύ 81% και 90%, έκρυβαν τις μεγάλες διαφορές στις ικανότητες συλλογισμού που ανέδειξε το PrIME-LLM. Όπως δήλωσε ο Succi, “Τα μοντέλα αυτά είναι εξαιρετικά στο να κατονομάζουν μια τελική διάγνωση όταν έχουν πλήρη δεδομένα, αλλά δυσκολεύονται στην αρχή μιας υπόθεσης, όταν οι πληροφορίες είναι περιορισμένες.”

Τα νεότερα μοντέλα παρουσίασαν σταδιακή βελτίωση σε σχέση με τα παλαιότερα, ενώ η απόδοση αυξανόταν γενικά όταν προστίθεντο εργαστηριακά και απεικονιστικά αποτελέσματα.

Κίνδυνοι για τους ασθενείς στην πράξη

Το χάσμα μεταξύ της πρώιμης συλλογιστικής και της τελικής ακρίβειας διάγνωσης έχει άμεσες επιπτώσεις για τους ασθενείς που στρέφονται όλο και περισσότερο στα chatbots για ιατρικές συμβουλές. Οι ερευνητές προειδοποίησαν ότι όσοι βασίζονται σε λανθασμένες εκτιμήσεις της Tεχνητής Nοημοσύνης ενδέχεται να υποβληθούν σε περιττές διαδικασίες ή να καθυστερήσουν κρίσιμες θεραπείες.

Στην έρευνα, τα μοντέλα μπορούσαν να προχωρήσουν στα επόμενα στάδια της κλινικής διερεύνησης ακόμη και μετά από αποτυχία στη διαφορική διάγνωση κάτι που δεν θα ίσχυε για έναν ασθενή που χρησιμοποιεί ένα chatbot στο σπίτι.

Όπως τόνισε ο Succi, «Παρά τις συνεχιζόμενες βελτιώσεις, τα έτοιμα προς χρήση μεγάλα γλωσσικά μοντέλα δεν είναι έτοιμα για ανεξάρτητη, κλινικού επιπέδου εφαρμογή.» Και πρόσθεσε: «Τα αποτελέσματά μας επιβεβαιώνουν ότι τα μεγάλα γλωσσικά μοντέλα στην υγεία εξακολουθούν να χρειάζονται την παρουσία ‘ανθρώπου στον βρόχο’ και πολύ στενή εποπτεία.»

Αξίζει να σημειωθεί ότι, τα ευρήματα δημοσιοποιούνται την ώρα που ο ανεξάρτητος οργανισμός ασφάλειας ECRI κατέταξε την κακή χρήση των AI chatbots στην υγειονομική περίθαλψη ως τον κορυφαίο τεχνολογικό κίνδυνο για το 2026.

ΣΧΟΛΙΑ

Τελευταία Νέα

Δείτε επίσης

Η παρμεζάνα σε κρίση: Η κλιματική αλλαγή απειλεί το πιο διάσημο ιταλικό τυρί

Μεσογειακή διατροφή: «Ασπίδα» για την ψυχολογική ευεξία ακόμα και σε περιόδους στρες – Τι δείχνει νέα έρευνα

Το φρούτο που λειτουργεί ως φυσικό «Viagra» – Πώς συμβάλει στη βελτίωση των σεξουαλικών επιδόσεων των ανδρών

Επιστήμη & Τεχνολογία

Ιστορική ανακάλυψη: Επιστήμονες εντόπισαν ζάχαρη στο Διάστημα – Τι σημαίνει για την εξωγήινη ζωή

Η ερυθρουλόζη αναγνωρίστηκε σε μοριακό νέφος στο κέντρο του γαλαξία μας, χάρη σε δύο υπερ-ευαίσθητα τηλεσκόπια

TANEA Newsroom

14/07/2026 16:56

Ιστορική ανακάλυψη: Επιστήμονες εντόπισαν ζάχαρη στο Διάστημα – Τι σημαίνει για την εξωγήινη ζωή

Υγεία

Σαλμονέλα: Πώς μεταδίδεται, με ποια συμπτώματα εκδηλώνεται και πως θα προστατευτείτε

Η σαλμονέλα ή σαλμονέλωση, είναι μια βακτηριακή λοίμωξη που προκαλείται από βακτήρια του γένους Salmonell. Αποτελεί πρόβλημα δημόσιας υγείας καθώς προκαλεί σοβαρή λοίμωξη η οποία σε σπάνιες περιπτώσεις μπορεί να αποβεί μοιραία. Πώς μεταδίδεται, πώς γίνεται η διάγνωση και με ποιο τρόπο μπορούμε να προστατευτούμε με αφορμή την έξαρση κρουσμάτων στη Λάρισα. Αρχικά, σαλμονέλλωση είναι […]

14/07/2026 16:34

Σαλμονέλα: Πώς μεταδίδεται, με ποια συμπτώματα εκδηλώνεται και πως θα προστατευτείτε

Υγεία

Βασιλακόπουλος για σαλμονελα στη Λαμία: «Να μην καταναλωθεί κοτόπουλο για 2-3 ημέρες»

«Αν το θέμα δεν είχε πάρει τόση δημοσιότητα, είμαι σίγουρος ότι οι νοσηλευόμενοι θα ήταν λιγότεροι», ανέφερε

14/07/2026 13:18

Βασιλακόπουλος για σαλμονελα στη Λαμία: «Να μην καταναλωθεί κοτόπουλο για 2-3 ημέρες»

Επιστήμη & Τεχνολογία

Ανατροπή στην ιστορία του Στόουνχεντζ: Στο φως το «πρωτότυπο» του εμβληματικού μνημείου

Αρχαιολόγοι εντόπισαν κοντά στο Στόουνχεντζ μια προϊστορική ξύλινη κατασκευή, πιθανό «πρωτότυπο» του μνημείου

TANEA Newsroom

13/07/2026 19:34

Ανατροπή στην ιστορία του Στόουνχεντζ: Στο φως το «πρωτότυπο» του εμβληματικού μνημείου

Υγεία

Γονιμότητα: η ενημέρωση δεν πρέπει να ξεκινά όταν εμφανιστεί το πρόβλημα

Αυτή ακριβώς τη φιλοσοφία υπηρετεί τα τελευταία δέκα χρόνια η Institute of Life – IASO.

13/07/2026 11:46

Μελέτη έδειξε ότι τα chatbots της Τεχνητής Νοημοσύνης αποτυγχάνουν σε πάνω από 80% των αρχικών κλινικών διαγνώσεων

Νέο εργαλείο αξιολόγησης αποκαλύπτει τις αδυναμίες

Κίνδυνοι για τους ασθενείς στην πράξη

Δείτε επίσης

Η παρμεζάνα σε κρίση: Η κλιματική αλλαγή απειλεί το πιο διάσημο ιταλικό τυρί

Μεσογειακή διατροφή: «Ασπίδα» για την ψυχολογική ευεξία ακόμα και σε περιόδους στρες – Τι δείχνει νέα έρευνα

Το φρούτο που λειτουργεί ως φυσικό «Viagra» – Πώς συμβάλει στη βελτίωση των σεξουαλικών επιδόσεων των ανδρών

Δημοφιλή

Κάτοικοι της Κυψέλης για ζημιές από τα έργα για το Μετρό: «Δεν θα πληρώσουμε την κατασκευή του Μετρό με τις ζω

Marfin: Αυτό είναι το email που κατονομάζει τους συλληφθέντεςι αναφέρουν δικαστικές πηγές

Πειραιάς: Αποκοιμήθηκαν μέσα στο αυτοκίνητο και δεν ξύπνησαν ποτέ – Το μοιραίο γκαράζ και το θρίλερ με τα καυ

Καθηγητής Κοινωνικής Ανθρωπολογίας: «Η σημειολογία της Καμόρα και της Κόζα Νόστρα συμπίπτει στα λόγια του Δη

Πειραιάς: Συγκλονίζει η μαρτυρία γειτόνισσας για την τραγωδία με τους 2 νεκρούς στο γκαράζ - «Από τις φωνές κα

Το φρούτο που λειτουργεί ως φυσικό «Viagra» - Πώς συμβάλει στη βελτίωση των σεξουαλικών επιδόσεων των ανδρώνΑ

Τραμπ: Ποιες χώρες περιέλαβε σε χάρτη που ανάρτησε ως εδάφη των Ηνωμένων Πολιτειών

Άγρια επίθεση από άγνωστο άνδρα καταγγέλλει ότι δέχθηκε στην Καλλιθέα γνωστή αισθητικός

Αποκάλυψη Corriere della Sera: Παραλίγο τραγωδία σε πτήση Λονδίνο-Αθήνα – Πώς αποφεύχθηκε για δύο δευτερόλεπτα

Πανελλαδικές 2026: Πού και πώς διαμορφώνονται οι βάσεις σε 100 σχολές

Ιστορική ανακάλυψη: Επιστήμονες εντόπισαν ζάχαρη στο Διάστημα – Τι σημαίνει για την εξωγήινη ζωή

Σαλμονέλα: Πώς μεταδίδεται, με ποια συμπτώματα εκδηλώνεται και πως θα προστατευτείτε

Βασιλακόπουλος για σαλμονελα στη Λαμία: «Να μην καταναλωθεί κοτόπουλο για 2-3 ημέρες»

Ανατροπή στην ιστορία του Στόουνχεντζ: Στο φως το «πρωτότυπο» του εμβληματικού μνημείου

Γονιμότητα: η ενημέρωση δεν πρέπει να ξεκινά όταν εμφανιστεί το πρόβλημα

Ιδιοκτησία

Μέλος

Όλα τα θέματα