Larissa, Amateur Weather Report: Tεχνητή νοημοσύνη της Microsoft αναγνωρίζει εικόνες και λύνει οπτικά παζλ

Παρασκευή, Μαρτίου 17, 2023

Tεχνητή νοημοσύνη της Microsoft αναγνωρίζει εικόνες και λύνει οπτικά παζλ

Με απώτερο στόχο την ανάπτυξη μιας «γενικής τεχνητής νοημοσύνης» που θα μπορεί να εκτελεί οποιαδήποτε νοητική εργασία σε ανθρώπινο επίπεδο, ερευνητές της Microsoft παρουσίασαν πειραματικό σύστημα AI που όχι μόνο κατανοεί την ανθρώπινη γλώσσα αλλά επιπλέον αναγνωρίζει αντικείμενα σε εικόνες και λύνει οπτικά προβλήματα.

Το τελευταίο διάστημα η Microsoft σπεύδει να αξιοποιήσει εμπορικά την τεχνολογία του ChatGPT, ενός «μεγάλου γλωσσικού μοντέλου» της OpenAI που παράγει κάθε είδους κείμενα σύμφωνα με τις οδηγίες του χρήστη.

Πέρα όμως από τη συνεργασία της με την OpenAI, ο γίγαντας του λογισμικού πειραματίζεται με δικά της συστήματα που θα μπορούσαν να επεκτείνουν την τεχνολογία στην αντίληψη της οπτικής πληροφορίας.

«Η πολυμεσική αντίληψη είναι απαραίτητη προκειμένου να φτάσουμε στην γενική τεχνητή νοημοσύνη όσον αφορά την απόκτηση γνώσης και την επαφή με τον πραγματικό κόσμο» γράφουν ερευνητές της εταιρείας σε μελέτη τους που αναρτήθηκε ως προδημοσίευση στο αποθετήριο ArXiV.

H μελέτη, με τίτλο «Η Γλώσσα δεν Είναι το Μόνο που Χρειάζεσαι: Ευθυγραμμίζοντας την Αντίληψη με τα Γλωσσικά Μοντέλα» περιγράφει το Kosmos-1, ένα «πολυμεσικό γλωσσικό μοντέλο» που συνδυάζει τη γλώσσα με την όραση.

Τα γραφήματα της δημοσίευσης, αναφέρει το Ars Technica, δείχνουν το μοντέλο να αναλύει εικόνες και να απαντά σε ερωτήσεις για το περιεχόμενό τους, να διαβάζει κείμενο από εικόνες, να συντάσσει λεζάντες και να υποβάλλεται σε τεστ «οπτικού IQ».

Το Kosmos-1 απαντά σε ερωτήσεις για το περιεχόμενο εικόνων (Shaohan Huang et al. / Microsoft)

Εκπαιδευμένο από δεδομένα στο Διαδίκτυο, το Kosmos-1 ξεπέρασε τις επιδόσεις άλλων προηγμένων μοντέλων, καμαρώνουν οι ερευνητές.

Ένα από τα τεστ στα οποία υποβλήθηκε το μοντέλο ήταν η «προοδευτικός λογισμός Ρέιβεν», ένα τεστ που μετρά το οπτικό IQ ζητώντας από τον εξεταζόμενο να συνεχίσει μια αλληλουχία σχημάτων.

(Shaohan Huang et al. / Microsoft)

Το Kosmos-1 δεν διέπρεψε, αφού απάντησε σωστά στο τεστ Ρέιβεν μόνο στο 26% των περιπτώσεων, συγκριτικά με 17% αν απαντούσε απλά στην τύχη,

Παρόλα αυτά, το μοντέλο της Microsoft επιβεβαιώνει ότι οι μηχανές σημειώνουν μεγάλη πρόοδο στην κατανόηση πληροφοριών.

Δεν είναι όμως το μόνο πειραματικό μοντέλο σε αυτό τον τομέα –η OpenAI, μεταξύ άλλων εταιρειών, έχει δηλώσει πως η γενική τεχνητή νοημοσύνη είναι ο απώτερος στόχος της.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

ΣΥΝΑΛΛΑΓΜΑΤΙΚΈΣ ΙΣΟΤΙΜΊΕΣ.

30/06/2016 - Δελτίο Συναλλαγματικών Ισοτιμιών Αναφοράς της ΕΚΤ

Νόμισμα	Μέση Τιμή
USD - ΔΟΛΛΑΡΙΟ Η.Π.Α	1,1102
JPY - ΓΙΕΝ ΙΑΠΩΝΙΑΣ	114,0500
BGN - ΛΕΒΑ ΒΟΥΛΓΑΡΙΑΣ	1,9558
CZK - ΚΟΡΩΝΑ ΤΣΕΧΙΑΣ	27,1310
DKK - ΚΟΡΩΝΑ ΔΑΝΙΑΣ	7,4393
GBP - ΛΙΡΑ ΑΓΓΛΙΑΣ	0,8265
HUF - ΦΟΡΙΝΤ ΟΥΓΓΑΡΙΑΣ	317,0600
PLN - ΖΛΟΤΙ ΠΟΛΩΝΙΑΣ	4,4362
RON - ΝΕΟ ΛΕΙ ΡΟΥΜΑΝΙΑΣ	4,5234
SEK - ΚΟΡΩΝΑ ΣΟΥΗΔΙΑΣ	9,4242
CHF - ΦΡΑΓΚΟ ΕΛΒΕΤΙΑΣ	1,0867
ISK - ΚΟΡΩΝΑ ΙΣΛΑΝΔΙΑΣ	0,0000
NOK - ΚΟΡΩΝΑ ΝΟΡΒΗΓΙΑΣ	9,3008
HRK - ΚΟΥΝΑ ΚΡΟΑΤΙΑΣ	7,5281
RUB - ΡΟΥΒΛΙ ΡΩΣΙΑΣ	71,5200
TRY - ΛΙΡΑ ΤΟΥΡΚΙΑΣ	3,2060
AUD - ΔΟΛΛΑΡΙΟ ΑΥΣΤΡΑΛΙΑΣ	1,4929
BRL - ΡΕΑΛ ΒΡΑΖΙΛΙΑΣ	3,5898
CAD - ΔΟΛΛΑΡΙΟ ΚΑΝΑΔΑ	1,4384
CNY - ΓΙΟΥΑΝ (ΡΕΝΜΙΝΜΠΙ) ΚΙΝΑΣ	7,3755
HKD - ΔΟΛΛΑΡΙΟ ΧΟΝΓΚ-ΚΟΝΓΚ	8,6135
IDR - ΡΟΥΠΙΑ ΙΝΔΟΝΗΣΙΑΣ	14601,7000
ILS - ΣΕΚΕΛ ΙΣΡΑΗΛ	4,2761
INR - ΙΝΔΙΚΗ ΡΟΥΠΙΑ	74,9603
KRW - ΓΟΥΟΝ ΝΟΤΙΟΥ ΚΟΡΕΑΣ	1278,4800
MXN - ΠΕΣΟ ΜΕΞΙΚΟΥ	20,6347
MYR - ΡΙΝΓΚΙΤ ΜΑΛΑΙΣΙΑΣ	4,4301
NZD - ΔΟΛΛΑΡΙΟ ΝΕΑΣ ΖΗΛΑΝΔΙΑΣ	1,5616
PHP - ΠΕΣΟ ΦΙΛΙΠΠΙΝΩΝ	52,2410
SGD - ΔΟΛΛΑΡΙΟ ΣΙΓΚΑΠΟΥΡΗΣ	1,4957
THB - ΜΠΑΧΤ ΤΑΪΛΑΝΔΗΣ	39,0070
ZAR - ΡΑΝΤ ΝΟΤΙΟΥ ΑΦΡΙΚΗΣ	16,4461

Larissa, Amateur Weather Report

Σελίδες

Συνολικές προβολές σελίδας

Παρασκευή, Μαρτίου 17, 2023

Tεχνητή νοημοσύνη της Microsoft αναγνωρίζει εικόνες και λύνει οπτικά παζλ

Δεν υπάρχουν σχόλια: