asimo.jpgΤο εντυπωσιακό ρομπότ Asimo της Honda, το έχουμε αναφέρει μέσα από το Medgreece παλιότερα. Κάθε φορά που έρχεται στο προσκήνιο , τα μαγικά χέρια των ερευνητών της Honda έχουν κάνει όλο και κάποιο θαύμα το οποίο μας εντυπωσιάζει και επεκτείνει τις ικανότητες του συμπαθητικού ρομπότ ένα βήμα παραπέρα. Αυτή τη φορά αυτό που άλλαξε από την τελευταία φορά ήταν η αντίληψη του Asimo όσον αφορά την ανθρώπινη ομιλία.

Ο Asimo μπορεί πλέον να αντιληφθεί τις φωνές τριών ανθρώπων που μιλάνε ταυτόχρονα και να μπορεί να πει με ακρίβεια ποιός είπε τι. Αν και η συγκεκριμένη δυνατότητα φαίνεται σε πολλούς κάτι το απλό, για μια μηχανή είναι κάτι το πολύ δύσκολο γιατί πρέπει να αναγνωρίσει κάθε πηγή φωνής χωριστά και κατόπιν ανεξαρτήτως θορύβου περιβάλλοντος να ανακαλύψει τι λέει η καθεμία.

Για το σκοπό αυτό οι ερευητές Hiroshi Okuno at Kyoto University, και Kazuhiro Nakadai ανέπτυξαν ένα πρόγραμμα (το οποίο ονομάζεται HARK) το οποίο εγκατέστησαν στον Asimo και σε συνδυασμό με 8 μικρόφωνα, στρατηγικά τοποθετημένα στο κεφάλι και στο σώμα του, του έδωσαν την δυνατότητα να μπορεί να ακούει ένα πλήθος συνομιλητών και να καταφέρει να αντιλαμβάνεται τι έχει πει ο καθένας.

Το συγκεκριμένο πρόβλημα που έρχεται να λύσει το συγκεκριμένο πρόγραμμα, λέγεται το “cocktail party effect” και αφορά την δυνατότητα κάποιος να μπορεί να εστιάσει στην φωνή ενός συγκεκριμένου ομιλητή μέσα σε ένα πλήθος άλλων ανθρώπων που μιλάνε ταυτόχρονα, αγνοώντας τις υπόλοιπες. Κάτι τέτοιο κάνει και το πρόγραμμα. Προσπαθεί να απομονώσει την κάθε φωνή ξεχωριστά με τη βοήθεια των μικροφώνων, και στην συνέχεια αφού βεβαιωθεί ότι η φωνή είναι καθαρή την στέλνει σε ένα πρόγραμμα αναγνώρισης φωνής όπου αποκωδικοποιείται.

Το πρόγραμμα εγκαταστάθηκε όπως είπαμε στον Asimo και κατόπιν, δοκιμάστηκε σε μια απλή εκδοχή του προβλήματος “cocktail party effect” . Και αυτή η απλή εκδοχή, ήταν το γνωστό σε όλους μας πέτρα-ψαλίδι-χαρτί.
Ο Asimo ακούει την διαμάχη τριών ατόμων πάνω στο συγκεκριμένο παιχνίδι, και στο τέλος ανακοινώνει τον νικητή . Προσπαθεί να διακρίνει δηλαδή τη λέξη που κερδίζει ανάμεσα σε τρία άτομα που φωνάζουν ταυτόχρονα μία λέξη ο καθένας. Το ποσοστό επιτυχίας ήταν περίπου 80% όταν εγκαταστάθηκε πρώτη φορά το πρόγραμμα στον Asimo. Οι ερευνητές πιστεύουν ότι με τον καιρό θα είναι σε θέση να αντιλαμβάνεται πολυπλοκότερες φράσεις μέσα σε πλήθος συζητήσεων.

Το μόνο σίγουρο είναι ότι δεν θα σταματήσει ποτέ να μας εντυπωσιάζει….

Share This Post

Βρήκες ενδιαφέρον το παραπάνω άρθρο; Ενημερώσου άμεσα για όλα τα νέα άρθρα, παίρνοντας το Medgreece Feed πατώντας εδώ!...τζάμπα είναι...:)

Σχετικά Post