Με ποιο βιβλίο τα βρίσκει σκούρα η Τεχνητή Νοημοσύνη;

Οι ερευνητές ισχυρίζονται ότι τα εργαλεία τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες

TANEA Newsroom 25/05/2023, 19:52

Τελευταία Νέα

04:00 Επιστήμη & Τεχνολογία
Η παρμεζάνα σε κρίση: Η κλιματική αλλαγή απειλεί το πιο διάσημο ιταλικό τυρί
02:00 Επιστήμη & Τεχνολογία
Μεσογειακή διατροφή: «Ασπίδα» για την ψυχολογική ευεξία ακόμα και σε περιόδους στρες – Τι δείχνει νέα έρευνα
00:53 Media
Διαβάστε στα «NEA» της Τετάρτης: Ποιοι δεν θίγονται από µία νέα αύξηση
00:04 Κόσμος
Σεισμός 6,2 Ρίχτερ «χτύπησε» τις Φιλιππίνες – Στους δρόμους οι κάτοικοι

Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.

Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.

Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.

Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.

Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.

7.000 γλώσσες περιμένουν

Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.

Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.

«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».

Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.

Το πρόβλημα με τη Βίβλο

Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.

Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.

Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.

Με πληροφορίες από MIT Technology Review

ΣΧΟΛΙΑ

Τελευταία Νέα

Δείτε επίσης

Η παρμεζάνα σε κρίση: Η κλιματική αλλαγή απειλεί το πιο διάσημο ιταλικό τυρί

Μεσογειακή διατροφή: «Ασπίδα» για την ψυχολογική ευεξία ακόμα και σε περιόδους στρες – Τι δείχνει νέα έρευνα

Το φρούτο που λειτουργεί ως φυσικό «Viagra» – Πώς συμβάλει στη βελτίωση των σεξουαλικών επιδόσεων των ανδρών

Επιστήμη & Τεχνολογία

Ιστορική ανακάλυψη: Επιστήμονες εντόπισαν ζάχαρη στο Διάστημα – Τι σημαίνει για την εξωγήινη ζωή

Η ερυθρουλόζη αναγνωρίστηκε σε μοριακό νέφος στο κέντρο του γαλαξία μας, χάρη σε δύο υπερ-ευαίσθητα τηλεσκόπια

TANEA Newsroom

14/07/2026 16:56

Ιστορική ανακάλυψη: Επιστήμονες εντόπισαν ζάχαρη στο Διάστημα – Τι σημαίνει για την εξωγήινη ζωή

Υγεία

Σαλμονέλα: Πώς μεταδίδεται, με ποια συμπτώματα εκδηλώνεται και πως θα προστατευτείτε

Η σαλμονέλα ή σαλμονέλωση, είναι μια βακτηριακή λοίμωξη που προκαλείται από βακτήρια του γένους Salmonell. Αποτελεί πρόβλημα δημόσιας υγείας καθώς προκαλεί σοβαρή λοίμωξη η οποία σε σπάνιες περιπτώσεις μπορεί να αποβεί μοιραία. Πώς μεταδίδεται, πώς γίνεται η διάγνωση και με ποιο τρόπο μπορούμε να προστατευτούμε με αφορμή την έξαρση κρουσμάτων στη Λάρισα. Αρχικά, σαλμονέλλωση είναι […]

14/07/2026 16:34

Σαλμονέλα: Πώς μεταδίδεται, με ποια συμπτώματα εκδηλώνεται και πως θα προστατευτείτε

Υγεία

Βασιλακόπουλος για σαλμονελα στη Λαμία: «Να μην καταναλωθεί κοτόπουλο για 2-3 ημέρες»

«Αν το θέμα δεν είχε πάρει τόση δημοσιότητα, είμαι σίγουρος ότι οι νοσηλευόμενοι θα ήταν λιγότεροι», ανέφερε

14/07/2026 13:18

Βασιλακόπουλος για σαλμονελα στη Λαμία: «Να μην καταναλωθεί κοτόπουλο για 2-3 ημέρες»

Επιστήμη & Τεχνολογία

Ανατροπή στην ιστορία του Στόουνχεντζ: Στο φως το «πρωτότυπο» του εμβληματικού μνημείου

Αρχαιολόγοι εντόπισαν κοντά στο Στόουνχεντζ μια προϊστορική ξύλινη κατασκευή, πιθανό «πρωτότυπο» του μνημείου

TANEA Newsroom

13/07/2026 19:34

Ανατροπή στην ιστορία του Στόουνχεντζ: Στο φως το «πρωτότυπο» του εμβληματικού μνημείου

Υγεία

Γονιμότητα: η ενημέρωση δεν πρέπει να ξεκινά όταν εμφανιστεί το πρόβλημα

Αυτή ακριβώς τη φιλοσοφία υπηρετεί τα τελευταία δέκα χρόνια η Institute of Life – IASO.

13/07/2026 11:46

Με ποιο βιβλίο τα βρίσκει σκούρα η Τεχνητή Νοημοσύνη;

Οι ερευνητές ισχυρίζονται ότι τα εργαλεία τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες

7.000 γλώσσες περιμένουν

Το πρόβλημα με τη Βίβλο

Δείτε επίσης

Η παρμεζάνα σε κρίση: Η κλιματική αλλαγή απειλεί το πιο διάσημο ιταλικό τυρί

Μεσογειακή διατροφή: «Ασπίδα» για την ψυχολογική ευεξία ακόμα και σε περιόδους στρες – Τι δείχνει νέα έρευνα

Το φρούτο που λειτουργεί ως φυσικό «Viagra» – Πώς συμβάλει στη βελτίωση των σεξουαλικών επιδόσεων των ανδρών

Δημοφιλή

Κάτοικοι της Κυψέλης για ζημιές από τα έργα για το Μετρό: «Δεν θα πληρώσουμε την κατασκευή του Μετρό με τις ζω

Marfin: Αυτό είναι το email που κατονομάζει τους συλληφθέντεςι αναφέρουν δικαστικές πηγές

Πειραιάς: Αποκοιμήθηκαν μέσα στο αυτοκίνητο και δεν ξύπνησαν ποτέ – Το μοιραίο γκαράζ και το θρίλερ με τα καυ

Καθηγητής Κοινωνικής Ανθρωπολογίας: «Η σημειολογία της Καμόρα και της Κόζα Νόστρα συμπίπτει στα λόγια του Δη

Πειραιάς: Συγκλονίζει η μαρτυρία γειτόνισσας για την τραγωδία με τους 2 νεκρούς στο γκαράζ - «Από τις φωνές κα

Το φρούτο που λειτουργεί ως φυσικό «Viagra» - Πώς συμβάλει στη βελτίωση των σεξουαλικών επιδόσεων των ανδρώνΑ

Τραμπ: Ποιες χώρες περιέλαβε σε χάρτη που ανάρτησε ως εδάφη των Ηνωμένων Πολιτειών

Άγρια επίθεση από άγνωστο άνδρα καταγγέλλει ότι δέχθηκε στην Καλλιθέα γνωστή αισθητικός

Αποκάλυψη Corriere della Sera: Παραλίγο τραγωδία σε πτήση Λονδίνο-Αθήνα – Πώς αποφεύχθηκε για δύο δευτερόλεπτα

Πανελλαδικές 2026: Πού και πώς διαμορφώνονται οι βάσεις σε 100 σχολές

Ιστορική ανακάλυψη: Επιστήμονες εντόπισαν ζάχαρη στο Διάστημα – Τι σημαίνει για την εξωγήινη ζωή

Σαλμονέλα: Πώς μεταδίδεται, με ποια συμπτώματα εκδηλώνεται και πως θα προστατευτείτε

Βασιλακόπουλος για σαλμονελα στη Λαμία: «Να μην καταναλωθεί κοτόπουλο για 2-3 ημέρες»

Ανατροπή στην ιστορία του Στόουνχεντζ: Στο φως το «πρωτότυπο» του εμβληματικού μνημείου

Γονιμότητα: η ενημέρωση δεν πρέπει να ξεκινά όταν εμφανιστεί το πρόβλημα

Ιδιοκτησία

Μέλος

Όλα τα θέματα