Ερευνητές του POSTECH παρουσίασαν φορετό αισθητήρα λαιμού που μετατρέπει τις μικροκινήσεις των μυών σε συνθεμένη φωνή χάρη σε AI.
Ερευνητές από το Πανεπιστήμιο Επιστημών και Τεχνολογίας Pohang (POSTECH) της Νότιας Κορέας παρουσίασαν φορετό αισθητήρα λαιμού που «διαβάζει» τις μικροκινήσεις των μυών του λάρυγγα και τις μετατρέπει σε καθαρή, συνθεμένη ομιλία — ακόμη και όταν ο χρήστης δεν βγάζει κανέναν ήχο. Η μελέτη, που δημοσιεύθηκε στο επιστημονικό περιοδικό Cyborg and Bionic Systems, απευθύνεται τόσο σε ανθρώπους που έχουν χάσει τη φωνή τους λόγω ασθένειας ή χειρουργικής επέμβασης όσο και σε επαγγελματίες που εργάζονται σε εξαιρετικά θορυβώδη περιβάλλοντα.
Πώς λειτουργεί η τεχνολογία CVOS
Η καρδιά του συστήματος είναι ένας αισθητήρας οπτικής παραμόρφωσης με υπολογιστική όραση, γνωστός ως CVOS (Computer Vision-Based Optical Strain). Πρόκειται για έναν μαλακό υποστρωματικό δίσκο από σιλικόνη Ecoflex, ο οποίος φέρει μικροσκοπικούς μαύρους δείκτες πάνω σε λευκό φόντο. Ενσωματωμένα στη διάταξη βρίσκονται μια μικροσκοπική κάμερα, ένας συμπαγής φακός μικροσκοπίου και μια πηγή φωτισμού LED. Όλα αυτά τοποθετούνται σε ένα φορετό περιλαίμιο τύπου choker γύρω από τον λαιμό.
Όταν ο χρήστης αρθρώνει λέξεις — με ή χωρίς ήχο — οι μύες του λαιμού επεκτείνονται, συστέλλονται και στρέφονται προς διάφορες κατευθύνσεις. Η κάμερα καταγράφει τη μετατόπιση των δεικτών σε δύο διαστάσεις, δημιουργώντας έναν λεπτομερή χάρτη πολυαξονικής παραμόρφωσης. Σε αντίθεση με παλαιότερους αισθητήρες που κατέγραφαν την κίνηση σε έναν μόνο άξονα, το CVOS αποτυπώνει ταυτόχρονα το μέγεθος και την κατεύθυνση της τάσης.
Προσωποποίηση φωνής
Ένα σημαντικό στοιχείο είναι η προσωποποίηση της φωνής. Με δείγμα ηχογράφησης διάρκειας μόλις 10 λεπτών, το σύστημα μπορεί να ανακατασκευάσει τη δική σου φωνή. Αυτό σημαίνει ότι ένας ασθενής που πρόκειται να υποβληθεί σε λαρυγγεκτομή θα μπορούσε θεωρητικά να «αποθηκεύσει» τη φωνή του πριν την επέμβαση και να τη χρησιμοποιεί αργότερα μέσω του αισθητήρα, αντί για τον χαρακτηριστικό ρομποτικό ήχο των παραδοσιακών ηλεκτρονικών λαρυγγικών συσκευών.
Από το εργοστάσιο μέχρι την εφαρμογή
Οι παραδοσιακές λύσεις σιωπηλής ομιλίας βασίζονταν σε EEG (ηλεκτροεγκεφαλογραφία) ή EMG (ηλεκτρομυογραφία), δηλαδή σε ηλεκτρόδια που απαιτούν gel, δύσκολη προσαρμογή στο δέρμα και εργαστηριακές συνθήκες. Το νέο σύστημα αντιμετωπίζει ακριβώς αυτά τα μειονεκτήματα, καθώς είναι φορετό, μη επεμβατικό και δουλεύει χωρίς ηλεκτρόδια.
Η ερευνητική ομάδα παρουσίασε μια εντυπωσιακή επίδειξη: ο χρήστης εκτελούσε βολές με τυφέκιο ενώ ταυτόχρονα «μιλούσε» σιωπηλά, και το σύστημα μετέδιδε ασύρματα τα αποκωδικοποιημένα μηνύματα σε άλλο δωμάτιο, όπου ακούγονταν ως καθαρός ήχος. Πέρα από στρατιωτικές εφαρμογές, οι ερευνητές στοχεύουν σε εργοτάξια, βιομηχανικές εγκαταστάσεις και υπηρεσίες έκτακτης ανάγκης, όπου τα μικρόφωνα αποτυγχάνουν λόγω θορύβου. Παράλληλες χρήσεις περιλαμβάνουν βιβλιοθήκες, συνεδριακές αίθουσες και θέατρα, όπου χρειάζεται επικοινωνία χωρίς παραγωγή ήχου.
Επόμενα βήματα της έρευνας
Σύμφωνα με ανακοίνωση του POSTECH, η ομάδα υπό τον καθηγητή Sung-Min Park θα επικεντρωθεί στην επέκταση του λεξιλογίου πέρα από το αλφάβητο, στη βελτίωση της ανθεκτικότητας σε κινητικές παρεμβολές — πιθανώς μέσω ενσωμάτωσης αδρανειακών μονάδων μέτρησης (IMU) — και στην εργονομία της συσκευής για μακροχρόνια χρήση. Ο επικεφαλής της μελέτης σχεδίασε το σύστημα ώστε να μπορεί να τρέχει σε μικρές συσκευές edge computing, κάτι που ανοίγει τον δρόμο για πρακτική καθημερινή χρήση.
Η άποψή μας στο Techblog
Το κύριο στοίχημα εδώ δεν είναι ο εντυπωσιασμός, αλλά η αξιοπιστία σε πραγματικές συνθήκες — και σε αυτό η νοτιοκορεατική ομάδα φαίνεται να έχει κάνει σοβαρή δουλειά, όπως δείχνει η επίδειξη μέσα σε περιβάλλον πυροβολισμών. Η πιο άμεση αξία βρίσκεται στον τομέα της υγείας, όπου μια τέτοια τεχνολογία θα μπορούσε να δώσει ξανά φωνή σε ασθενείς μετά από λαρυγγεκτομή, διατηρώντας μάλιστα την προσωπική τους ταυτότητα ήχου. Μένει να δούμε πόσο γρήγορα θα φτάσει από το εργαστήριο στην αγορά, ειδικά με δεδομένο ότι το λεξιλόγιο των 26 λέξεων παραμένει περιοριστικό για εμπορική κυκλοφορία.
Σχόλια