ΕΛΛAΔΑ

Η Ελλάδα στην πρωτοπορία της έρευνας στις τεχνολογίες ομιλίας

Η Ελλάδα στην πρωτοπορία της έρευνας στις τεχνολογίες ομιλίας - Κεντρική Εικόνα

Στην πρωτοπορία της έρευνας βρίσκεται η Ελλάδα όσον αφορά τις τεχνολογίες ομιλίας, οι οποίες αναμένεται να "σαρώσουν" τα αμέσως επόμενα χρόνια και να αλλάξουν κάθε πτυχή της επαγγελματικής και καθημερινής μας δραστηριότητας.

Ειδικότερα, όπως αναφέρει στο ΑΠΕ/ΜΠΕ ο Δρ. Βαγγέλης Καρκαλέτσης, Διευθυντής Έρευνας στο Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών του ΕΚΕΦΕ «Δημόκριτος» και υπεύθυνος του Εργαστηρίου Τεχνολογίας Γνώσεων & Λογισμικού, στον Τομέα Πληροφορικής του Ινστιτούτου, η Ελλάδα στον τομέα της τεχνολογίας ομιλίας και γενικότερα στην Τεχνητή Νοημοσύνη, είναι πάνω από τον ευρωπαϊκό μέσο όρο.

Χάρη στην εξαιρετική δουλειά που γίνεται στα Ερευνητικά Κέντρα και τα Πανεπιστήμια της χώρας, Έλληνες ερευνητές από ιδρύματα του εξωτερικού παράγουν σημαντικό έργο, που επικοινωνείται σε πληθώρα διεθνών συνεδρίων. Χαρακτηριστικό παράδειγμα αποτελεί το διεθνές συνέδριο για τις τεχνολογίες ομιλίας (SLT 2018) που πραγματοποιήθηκε για πρώτη φορά στην Ευρώπη και μάλιστα στην Ελλάδα, στο οποίο ερευνητές, αλλά και εταιρείες τεχνολογικοί κολοσσοί ανέδειξαν τη δουλειά τους σε ένα διεθνές κοινό με ιδιαίτερη επιτυχία, προσθέτει.

Αναφερόμενος ειδικότερα στα βασικά πεδία στα οποία εστιάζεται σήμερα η έρευνα στο Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών του ΕΚΕΦΕ «Δημόκριτος» ο κ.Καρκαλέτσης επισημαίνει ότι η πορεία του Ινστιτούτου έχει οδηγήσει σε σημαντικά ερευνητικά αποτελέσματα στην τεχνητή νοημοσύνη και συγκεκριμένα στην ανάλυση κειμένου, εικόνας και βίντεο, και στην εξόρυξη και διασύνδεση δεδομένων από διαφορετικές πηγές και μέσα. Αναγνωρίζοντας επίσης έγκαιρα τη σημασία της διαχείρισης μεγάλου όγκου δεδομένων για την τεχνητή νοημοσύνη, το Ινστιτούτο έχει αφιερώσει σημαντικό μέρος των ερευνητικών του προσπαθειών στον τομέα της διαχείρισης και επεξεργασίας δεδομένων μεγάλης κλίμακας (big data).

Από την άλλη πλευρά, το ΙΠΤ συνεχίζει την ισχυρή παρουσία του στον τομέα των δικτύων επικοινωνίας - και ιδιαίτερα των ασύρματων δικτύων - μέσω του Τομέα Τηλεπικοινωνιών του. Το Ινστιτούτο κατέχει ηγετική θέση στον ερευνητικό χώρο των δικτύων 5G και παράγει σημαντικά αποτελέσματα όσον αφορά τις σχετικές υποδομές, τα χρησιμοποιούμενα πρωτόκολλα και τις μεθοδολογίες για τη βελτιστοποίηση της απόδοσης και της διαθεσιμότητας του δικτύου, προσθέτει ο κ.Καρκαλέτσης.

Ερωτηθείς σχετικά αναφέρεται ειδικότερα στο ευρωπαϊκό έργο RADIO, που αφορά στη συνδυασμένη χρήση ρομποτικών πλατφορμών και έξυπνων σπιτιών. Το Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών συμμετέχει σε πολλά έργα με αντικείμενο την επικοινωνία ανθρώπου-μηχανής, τόσο με την χρήση ρομποτικών πλατφορμών όσο και χωρίς. Παράδειγμα ολοκληρωμένου, επιτυχημένου έργου αποτελεί το ευρωπαϊκό πρόγραμμα RADIO, που συντόνισε το Ινστιτούτο. Το έργο είχε ως στόχο να μελετήσει πώς μπορούν να χρησιμοποιηθούν ρομποτικές συσκευές που κινούνται αυτόνομα στο χώρο, σε συνδυασμό με τους αισθητήρες ενός έξυπνου σπιτιού, σε περιβάλλοντα υποστηριζόμενης διαβίωσης. Ο απώτερος στόχος είναι ο ηλικιωμένος ή ασθενής να μπορεί να παραμείνει για όσο το δυνατόν περισσότερο χρόνο στο σπίτι, αντί να πάει σε κάποια δομή φροντίδας. Στο έξυπνο σπίτι και με τη χρήση μιας σχετικά απλής ρομποτικής συσκευής, μπορείς να τον επιβλέπεις με ασφάλεια και να έχεις τα απαραίτητα δεδομένα ώστε να καταλάβεις αν χρειάζεται μεγαλύτερη βοήθεια στο σπίτι ή αν δεν μπορεί πλέον να μένει μόνος.

Από την αλληλεπίδραση ρομποτικών πλατφορμών, του έξυπνου σπιτιού και του ανθρώπου παράγεται πληθώρα χρήσιμων δεδομένων. Το ίδιο συμβαίνει πλέον και για μια σειρά από συσκευές που χρησιμοποιούμε στην καθημερινότητά μας, όπως είναι τα έξυπνα κινητά.

Ο κ. Καρκαλέτσης αναφέρεται και στην μεγάλη πρόκληση για την ερευνητική κοινότητα που αφορά στη διαχείριση και βέλτιστη χρήση των δεδομένων αυτών (big data management & analytics). Παράλληλα, όπως επισημαίνει, προκύπτουν ζητήματα που σχετίζονται με την ηθική και την προστασία της ιδιωτικότητας του ατόμου, που καλούμαστε να αντιμετωπίσουμε με ιδιαίτερη προσοχή.

Ερωτηθείς σε ποιο επίπεδο μπορεί να φθάσει η συνομιλία ανθρώπων με συσκευές και ρομπότ, επισημαίνει ότι όπως φάνηκε από τις εξαιρετικά ενδιαφέρουσες ομιλίες και εργασίες του διεθνούς συνεδρίου Spoken Language Technology 2018 (SLT 2018) ένα σύνολο από ενδιαφέρουσες εξελίξεις θα αλλάξουν τη ζωή μας στο άμεσο μέλλον. Σημαντικές βελτιώσεις στα συστήματα που κατανοούν ή παράγουν ανθρώπινο λόγο θα επιτρέψουν πιο εύκολη αλληλεπίδραση με τους τεχνητούς προσωπικούς βοηθούς (personal assistants) στα έξυπνα κινητά και σε άλλες συσκευές. H εξέλιξη της Τεχνητής Νοημοσύνης θα επιτρέψει στα συστήματα αυτά να κατανοούν καλύτερα τις προσωπικές ανάγκες μας, να μας αντιλαμβάνονται όποια γλώσσα και αν μιλάμε, ακόμα και σε περιβάλλοντα με θόρυβο. Αυτό σημαίνει πιο εύκολη διαβίωση στο σπίτι, πιο ασφαλή και ξέγνοιαστη οδήγηση, πιο πλούσια, αλληλεπιδραστική ψυχαγωγία, και καλύτερη υποστήριξη σε άτομα που χρειάζονται βοήθεια, προσθέτει.

Πέτρος Μαραγκός-Οι προκλήσεις της ψηφιακής ζωής

Από την πλευρά του και ο Πέτρος Μαραγκός, Καθηγητής της Σχολής Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, του Εθνικού Μετσόβιου Πολυτεχνείου, μιλώντας στο ΑΠΕ/ΜΠΕ τονίζει ότι το ανθρώπινο δυναμικό στην Ελλάδα είναι εξαιρετικό στον τομέα των τεχνολογιών ομιλίας και των συναφών τεχνολογιών τεχνητής νοημοσύνης, τονίζοντας το πλούσιο έργο ερευνητικών κέντρων και πανεπιστημίων αλλά και τα αποτελέσματα νεοφυών επιχειρήσεων της χώρας μας που διακρίνονται εντός και εκτός Ελλάδος.

Αναφέρεται μεταξύ άλλων στο Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ / Ε.Κ."Αθηνά"), που λειτουργεί υπό την αιγίδα της Γενικής Γραμματείας Έρευνας και Τεχνολογίας του Υπουργείου Παιδείας, Έρευνας και Θρησκευμάτων, μέσω του οποίου δημιουργήθηκε η ελληνική εταιρεία Innoetics, που εξαγοράστηκε από τη Samsung, προκειμένου να χρησιμοποιήσει την πλατφόρμα μετατροπής κειμένου σε φωνή (text-to-speech) που έχει αναπτύξει η Innoetics, ώστε να αντιμετωπίσει τους διεθνείς ανταγωνιστές. Γενικότερα επεσήμανε ότι θα πρέπει να δοθούν στα ερευνητικά κέντρα και πανεπιστήμια οι κατάλληλες ευκαιρίες για περαιτέρω ανάπτυξη τους σε διεθνές επίπεδο με ότι θετικό θα συνεπάγεται αυτό για τα αποτελέσματα των ερευνών που πραγματοποιούν.

Ο Πέτρος Μαραγκός στην συνομιλία του με το ΑΠΕ/ΜΠΕ αναφέρεται στη μεγάλη πρόκληση της «ψηφιακής ζωής μας», καθώς όπως επισημαίνει η ζωή κυριαρχείται πλέον από ψηφιακές τεχνολογίες: Στην απρόσκοπτη επικοινωνία ανθρώπου με ψηφιακές συσκευές, όπως κινητά τηλέφωνα, υπολογιστές, ταμπλέτες, ρομπότ με απλό και φυσικό τρόπο. Η ψηφιακή γλώσσα και η ψηφιακή όραση είναι οι δύο πυλώνες της επικοινωνίας αυτής του ανθρώπου με τις μηχανές που όσο πιο απλά και με φυσικό τρόπο γίνεται θα διευκολύνει την καθημερινότητα του ανθρώπου.

Αναφερόμενος ειδικότερα στο ερευνητικό έργο του Πολυτεχνείου στο τομέα της τεχνητής νοημοσύνης και ρομποτικής, εστιάζει στο ερευνητικό έργο του Εργαστηρίου Ρομποτικής για ανάπτυξη ευφυών ρομποτικών βοηθών για ηλικιωμένα άτομα που διευκολύνει ουσιαστικά την καθημερινότητα τους. Επίσης στα θετικά αποτελέσματα που μπορεί να έχει η επικοινωνία ρομπότ με παιδιά (ηλικίας 5-12 ετών), για συνεργατικά παιγνίδια και μάθηση, αναφερόμενος ειδικότερα στα ελπιδοφόρα αποτελέσματα έρευνας του Πολυτεχνείου μετά την αποστολή ρομπότ σε Σχολεία ώστε να διερευνηθούν τα αποτελέσματα της μεταξύ τους αλληλεπίδρασης.

Σπύρος Ράπτης-Τι αναφέρει για την ελληνική γλώσσα

Μιλώντας στο ΑΠΕ/ΜΠΕ ο Σπύρος Ράπτης, συνιδρυτής και επικεφαλής έρευνας και ανάπτυξης της εταιρείας INNOETICS που εξειδικεύεται σε τεχνολογίες σύνθεσης φωνής από κείμενο (text-to-speech) τόνισε την ιδιαίτερη σημασία που έχουν αποκτήσει σε διεθνές επίπεδο οι φωνητικοί βοηθοί που ήδη χρησιμοποιούνται από εκατομμύρια ανθρώπους σε πλήθος καθημερινών δραστηριοτήτων τους.

Ειδικότερα, όπως ανέφερε στο ΑΠΕ/ΜΠΕ, την τρέχουσα χρονική περίοδο η Samsung, με την ουσιαστική συνδρομή και της INNOETICS, εξελίσσει σημαντικά την τεχνολογία φωνητικών βοηθών που διαθέτει, επεκτείνοντάς την παράλληλα και σε ποικίλες γλώσσες. Πρόσφατα κυκλοφόρησε εκδόσεις για τα Γερμανικά, Γαλλικά, Ισπανικά και Ιταλικά που προστέθηκαν στις ήδη υπάρχουσες εκδόσεις για αγγλικά και κορεατικά. Ερωτηθείς σχετικά για την ελληνική γλώσσα ανέφερε ότι, η επιδίωξη της INNOETICS είναι να την εντάξει στο συνολικό πλάνο.

Γενικότερα είπε ότι στην περιοχή των τεχνολογιών φωνής θα έχουμε να περιμένουμε πολύ περισσότερα στον τομέα εκφραστικότητας, κάτι που θα βοηθήσει ώστε ο διάλογος μεταξύ ανθρώπων και μηχανών να γίνεται ολοένα και πιο φυσικός. Η τεχνολογία σύνθεσης φωνής μπορεί να έχει πλήθος εφαρμογών, από κινητά τηλέφωνα έως οικιακές συσκευές ή και οποιαδήποτε άλλη συσκευή την οποία θα θέλουμε να χειριζόμαστε με απλό τρόπο, μας αναφέρει.

Αναφέρεται επίσης γενικότερα στην ανάπτυξη της διαλογικής τεχνητής νοημοσύνης και στην ολοένα και μεγαλύτερη διείσδυση των μηχανών στην προσωπική σφαίρα της ζωής των χρηστών τους, γεγονός που εγείρει ζητήματα ασφάλειας, αλλά, συχνά πλέον, και ηθικής για τα οποία απαιτείται ιδιαίτερη μέριμνα. Επισημαίνει επίσης ότι η επιστημονική και τεχνολογική κοινότητα έχει συναίσθηση των νέων αυτών προκλήσεων και συμβάλλει ενεργά με πρωτοβουλίες και δράσεις προς την κατεύθυνση αυτή στο νέο περιβάλλον που διαμορφώνεται.