Ερευνητές του Πανεπιστημίου Stanford, με χρηματοδότηση από τα Εθνικά Ινστιτούτα Υγείας (National Institutes of Health), ανέπτυξαν ένα καινοτόμο μοντέλο τεχνητής νοημοσύνης με την ονομασία Merlin. Το σύστημα αυτό μπορεί να ερμηνεύει τρισδιάστατες αξονικές τομογραφίες κοιλιάς και να εκτελεί περισσότερες από 750 διαφορετικές εργασίες, από την αναγνώριση οργάνων έως την πρόβλεψη εμφάνισης χρόνιων ασθενειών, χρόνια πριν από την κλινική τους διάγνωση. Η σχετική μελέτη δημοσιεύθηκε στο περιοδικό Nature, παρουσιάζοντας ένα ενιαίο μοντέλο γενικής χρήσης που ξεπερνά τα εξειδικευμένα εργαλεία που χρησιμοποιούνται για επιμέρους ιατρικές λειτουργίες.
Το Merlin αποτελεί ένα θεμελιώδες μοντέλο τρισδιάστατης όρασης και γλώσσας, εκπαιδευμένο σε 15.331 αξονικές τομογραφίες κοιλίας, συνδυασμένες με ακτινολογικές αναφορές και σχεδόν ένα εκατομμύριο διαγνωστικούς κωδικούς από ηλεκτρονικά αρχεία υγείας. Οι ερευνητές το αξιολόγησαν σε έξι κατηγορίες δραστηριότητας που περιλάμβαναν συνολικά 752 επιμέρους εργασίες, από διαγνωστικές έως προγνωστικές και αξιολογήσεις ποιότητας.
Σε 692 διαφορετικούς διαγνωστικούς κωδικούς, το Merlin πέτυχε ποσοστό επιτυχίας άνω του 81% στην πρόβλεψη της σωστής πάθησης, ξεπερνώντας αρκετά ανταγωνιστικά μοντέλα. Για ένα υποσύνολο 102 κωδικών, η ακρίβεια του έφτασε το 90%.
«Με το Merlin, θα μπορούσε κανείς ενδεχομένως να ξεπεράσει την παραδοσιακή ακτινολογία και να περάσει απευθείας από την απεικόνιση σε μια πιθανή διάγνωση. Και αυτή είναι μόνο μία πιθανή χρήση», δήλωσε ο Louis Blankemeier, πρώτος συν-συγγραφέας της μελέτης, ο οποίος πραγματοποίησε την εργασία ενώ ήταν μεταπτυχιακός φοιτητής στο Stanford.
Η ικανότητα του Merlin να προβλέπει χρόνιες παθήσεις θεωρείται ιδιαίτερα εντυπωσιακή. Όταν κλήθηκε να εκτιμήσει αν υγιείς ασθενείς θα εμφάνιζαν διαβήτη, οστεοπόρωση ή καρδιαγγειακές νόσους μέσα σε πέντε χρόνια, το μοντέλο εντόπισε ασθενείς υψηλότερου κινδύνου στο 75% των περιπτώσεων, έναντι 68% ενός εναλλακτικού μοντέλου. Τα αποτελέσματα δείχνουν ότι το Merlin μπορεί να ανιχνεύει χαρακτηριστικά αόρατα στο ανθρώπινο μάτι, πιθανώς αποκαλύπτοντας νέους βιοδείκτες ασθενειών.
Επιπλέον, οι ερευνητές ζήτησαν από το Merlin να ερμηνεύσει αξονικές τομογραφίες θώρακα, αν και δεν είχε εκπαιδευτεί σε τέτοια δεδομένα. Παρ’ όλα αυτά, το μοντέλο απέδωσε εξίσου καλά ή και καλύτερα από εξειδικευμένα εργαλεία, αποδεικνύοντας την ικανότητά του να μαθαίνει γενικεύσιμα χαρακτηριστικά ασθενειών.
Σε αντίθεση με πολλά μεγάλα μοντέλα τεχνητής νοημοσύνης που απαιτούν τεράστια υπολογιστική ισχύ, το Merlin εκπαιδεύτηκε σε μία μόνο GPU. Η ομάδα τόνισε ότι αυτό αποδεικνύει πως νοσοκομεία και ερευνητικά ιδρύματα μπορούν να δημιουργήσουν δικά τους θεμελιώδη μοντέλα με περιορισμένους πόρους.
Ο συν-πρώτος συγγραφέας Ashwin Kumar, μεταπτυχιακός φοιτητής στο Stanford, ανέφερε ότι ενώ κάποιες εργασίες λειτούργησαν άμεσα, «άλλες πιο περίπλοκες εργασίες, όπως η σύνταξη ακτινολογικών αναφορών από το μηδέν ή η αναγνώριση και οριοθέτηση οργάνων σε τρισδιάστατο χώρο, απαιτούσαν πρόσθετη εκπαίδευση».
Οι ερευνητές σχεδιάζουν να επιδιώξουν κανονιστική έγκριση για απλούστερες εφαρμογές, ενώ παράλληλα θα συνεχίσουν να βελτιώνουν το Merlin για πιο σύνθετες προκλήσεις, όπως η αυτοματοποιημένη συγγραφή ιατρικών αναφορών.