Larissa, Amateur Weather Report: Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;

Δευτέρα, Ιουνίου 05, 2023

Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;

Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.

Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.

Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.

Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.

Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.

7.000 γλώσσες περιμένουν

Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.

Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.

«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».

Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.

Το πρόβλημα με τη Βίβλο

Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.

Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.

Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

ΣΥΝΑΛΛΑΓΜΑΤΙΚΈΣ ΙΣΟΤΙΜΊΕΣ.

30/06/2016 - Δελτίο Συναλλαγματικών Ισοτιμιών Αναφοράς της ΕΚΤ

Νόμισμα	Μέση Τιμή
USD - ΔΟΛΛΑΡΙΟ Η.Π.Α	1,1102
JPY - ΓΙΕΝ ΙΑΠΩΝΙΑΣ	114,0500
BGN - ΛΕΒΑ ΒΟΥΛΓΑΡΙΑΣ	1,9558
CZK - ΚΟΡΩΝΑ ΤΣΕΧΙΑΣ	27,1310
DKK - ΚΟΡΩΝΑ ΔΑΝΙΑΣ	7,4393
GBP - ΛΙΡΑ ΑΓΓΛΙΑΣ	0,8265
HUF - ΦΟΡΙΝΤ ΟΥΓΓΑΡΙΑΣ	317,0600
PLN - ΖΛΟΤΙ ΠΟΛΩΝΙΑΣ	4,4362
RON - ΝΕΟ ΛΕΙ ΡΟΥΜΑΝΙΑΣ	4,5234
SEK - ΚΟΡΩΝΑ ΣΟΥΗΔΙΑΣ	9,4242
CHF - ΦΡΑΓΚΟ ΕΛΒΕΤΙΑΣ	1,0867
ISK - ΚΟΡΩΝΑ ΙΣΛΑΝΔΙΑΣ	0,0000
NOK - ΚΟΡΩΝΑ ΝΟΡΒΗΓΙΑΣ	9,3008
HRK - ΚΟΥΝΑ ΚΡΟΑΤΙΑΣ	7,5281
RUB - ΡΟΥΒΛΙ ΡΩΣΙΑΣ	71,5200
TRY - ΛΙΡΑ ΤΟΥΡΚΙΑΣ	3,2060
AUD - ΔΟΛΛΑΡΙΟ ΑΥΣΤΡΑΛΙΑΣ	1,4929
BRL - ΡΕΑΛ ΒΡΑΖΙΛΙΑΣ	3,5898
CAD - ΔΟΛΛΑΡΙΟ ΚΑΝΑΔΑ	1,4384
CNY - ΓΙΟΥΑΝ (ΡΕΝΜΙΝΜΠΙ) ΚΙΝΑΣ	7,3755
HKD - ΔΟΛΛΑΡΙΟ ΧΟΝΓΚ-ΚΟΝΓΚ	8,6135
IDR - ΡΟΥΠΙΑ ΙΝΔΟΝΗΣΙΑΣ	14601,7000
ILS - ΣΕΚΕΛ ΙΣΡΑΗΛ	4,2761
INR - ΙΝΔΙΚΗ ΡΟΥΠΙΑ	74,9603
KRW - ΓΟΥΟΝ ΝΟΤΙΟΥ ΚΟΡΕΑΣ	1278,4800
MXN - ΠΕΣΟ ΜΕΞΙΚΟΥ	20,6347
MYR - ΡΙΝΓΚΙΤ ΜΑΛΑΙΣΙΑΣ	4,4301
NZD - ΔΟΛΛΑΡΙΟ ΝΕΑΣ ΖΗΛΑΝΔΙΑΣ	1,5616
PHP - ΠΕΣΟ ΦΙΛΙΠΠΙΝΩΝ	52,2410
SGD - ΔΟΛΛΑΡΙΟ ΣΙΓΚΑΠΟΥΡΗΣ	1,4957
THB - ΜΠΑΧΤ ΤΑΪΛΑΝΔΗΣ	39,0070
ZAR - ΡΑΝΤ ΝΟΤΙΟΥ ΑΦΡΙΚΗΣ	16,4461

Larissa, Amateur Weather Report

Σελίδες

Συνολικές προβολές σελίδας

Δευτέρα, Ιουνίου 05, 2023

Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;

Δεν υπάρχουν σχόλια: