sound.JPGΣε παλιότερα άρθρα στο Medgreece,  έχουμε αναφερθεί στην αναγνώριση φωνής από μηχανές και το πόσο σημαντική είναι αλλά και το πόσο δύσκολο είναι στην υλοποίησή του κάτι τέτοιο. Τα τεχνικά προβλήματα που πρέπει να υπερπηδηθούν είναι αρκετά αλλά φαίνεται ότι οι επιστήμονες βελτιώνουν τις τεχνικές τους συνέχεια και βρίσκουν νέους τρόπους για έρθουν πιο κοντά στην πραγματοποίηση του στόχου τους.
Συγκεκριμένα, ερευνητές από την Ευρώπη, κατάφεραν να κάνουν κάτι εντυπωσιακό. Να κάνουν ένα πρόγραμμα να μπορεί να κατανοήσει τυχαίες φράσεις από κάποια γλώσσα.

Η αναγνώριση φωνής εφαρμόζεται σε σημεία που ίσως στους περισσότερους να μην έχουν κάνει ιδιαίτερη εντύπωση, αλλά σαν σύστημα υπάρχει ήδη και λειτουργεί. Συγκεκριμένα μια από τις πιο δημοφιλείς εφαρμογές της που όλοι μας κάποια στιγμή έχουμε έρθει σε επαφή, είναι στην τηλεφωνική εξυπηρέτηση πελατών σε τράπεζες αλλά και σε αγορά εισιτηρίων ή παρόμοιες υπηρεσίες. Φανταστείτε ότι σε περίπτωση που δεν υπήρχε αυτή η δυνατότητα η μόνη λύση ήταν η απασχόληση επιπλέον προσωπικού σε βάρδιες. Με την αναγνώριση φωνής το πρόγραμμα κατανοεί την επιθυμία του χρήστη, και πράττει αναλόγως, ακούραστα, 24 ώρες το 24ωρο 7 μέρες την εβδομάδα.
Παρόλα αυτά όμως η συγκεκριμένη τεχνολογία (με τη σημερινή υλοποίηση) δεν αποτελεί την καλύτερη δυνατή λύση. Προκειμένου να γίνει αντιληπτό από το πρόγραμμα η επιθυμία μας, χρειάζεται μια σειρά από βήματα όπου το πρόγραμμα ρωτά και εμείς απαντάμε μέχρι να ολοκληρώσει το αίτημά μας. Αν και δεν απασχολεί υπάλληλο για κάτι τέτοιο, δεν παύει να είναι εκνευριστικό το πόσο αργά εκτυλίσσεται η διαδικασία.

Οι ερευνητές λοιπόν από Ευρώπη κατάφεραν να βελτιώσουν τόσο πολύ την τεχνητή νοημοσύνη του συστήματος ώστε να μπορεί να αντιληφθεί μια ολοκληρωμένη πρόταση χωρίς να χρειάζεται να μας ρωτάει συνεχώς μέχρι να κατανοήσει το αίτημά μας. Το project ονομάζεται Luna, και μπορεί να καταλάβει κανονικό τυχαίο λόγο , κάνοντάς την επικοινωνία μας με τις μηχανές κάτι παραπάνω από εύκολη και σημαντικά πιο ανθρώπινη.
Η υψηλή καταληπτότητα φωνής από ένα λογισμικό ονομάζεται Spoken Language Understanding (SLU).
Ένα επίσης σημαντικό στοιχείο, είναι και το γεγονός ότι είναι σε θέσει να “καταλαβαίνει” διαφορετικές γλώσσες και συγκεκριμένα γλώσσες που δεν είχαν μέχρι πρόσφατα τέτοιου είδους συστήματα αναγνώρισης φωνής.

Η επιτυχία του προγράμματος οφείλεται στο γεγονός ότι οι ερευνητές προκειμένου να τελειοποιήσουν το πρόγραμμα, καταγράφουν πολλές τυχαίες συνομιλίες τόσο μεταξύ ανθρώπων αλλά και μεταξύ ανθρώπου και μηχανών. Όλη αυτή η εργασία οδηγεί το πρόγραμμα στο να δημιουργήσει την βασική του γλώσσα που αποτελείται από λέξεις και μικρές φράσεις και στη συνέχεια οι ερευνητές τις μετατρέπουν σε μία μορφή που ένας υπολογιστής μπορεί να καταλάβει.
Ένα τέτοιο πρόγραμμα θα μπορούσε να επιταχύνει σημαντικά τις τηλεφωνικές συνδιαλλαγές μας με τις τράπεζες, αλλά και με τουριστικά γραφεία ή κέντρα όπου χρειαζόμαστε κάποια πληροφορία.Επίσης όταν ωριμάσει η τεχνολογία θα αποτελέσει ένα σημαντικό βήμα για την επικοινωνία μας με ρομπότ, κάτι το οποίο θα μας φέρει πιο κοντά σε μία εποχή όπου άνθρωποι και μηχανές θα επικοινωνούν στη φυσική ανθρώπινη γλώσσα  (φανταστείτε ότι κάποια στιγμή θα μπορούσε να αντικαταστήσει και το πληκτρολόγιο ακόμα, αν και κάτι τέτοιο φαντάζει λίγο απίθανο γιατί πάντα θα είναι απαραίτητο ένα πληκτρολόγιο για την εισαγωγή ευαίσθητων προσωπικών δεδομένων).

Το project δεν έχει ολοκληρωθεί ακόμα (μένουν ακόμα αρκετοί μήνες) αλλά παρουσιάστηκε στο ICT 2008 με προοπτικές για άμεση πρακτική εφαρμογή του όταν τελειοποιηθεί, από διάφορες εταιρείες τηλεπικοινωνιών.

Share This Post

Βρήκες ενδιαφέρον το παραπάνω άρθρο; Ενημερώσου άμεσα για όλα τα νέα άρθρα, παίρνοντας το Medgreece Feed πατώντας εδώ!...τζάμπα είναι...:)

Σχετικά Post