Viv | Τεχνητή νοημοσύνη επόμενης γενιάς

Όταν η Apple ανακοίνωσε το το iPhone 4S στις 4 Οκτωβρίου του 2011, τα βλέματα δε στράφηκαν στο νέο του επεξεργαστή ή στη βελτιωμένη κάμερά του. Αντίθετα όλοι επικεντρώθηκαν σε ένα και μόνο στοιχείο. Την έξυπνη βοηθό, ονομαζόμενη Siri. 

Αρχικά το Siri διέθετε μια γυναικεία φωνή η οποία έμοιζε σχεδόν ανθρώπινη στον τρόπου που καταλάβαινε τι της έλεγες και πώς απαντούσε. Μπορούσε να εκτελέσει συγκεκριμένα ερωτήματα όπως το «Μπορείς να βάλεις το ξυπνητήρι στις 8 το πρωί?» ή «Τηλεφώνησε στο σταθερό του σπιτιού μου» (στα αγγλικά φυσικά). Και προσπαθούσε να έχει μια προσωπικότητα. Έτσι στην ερώτηση, αν υπάρχει θεός, η απάντηση ήταν: «Πιστεύω στο διαχωρισμό του πνεύματος από τα ηλεκτρονικά». 

Στους μήνες που ακολούθησαν τα όρια του τι μπορούσε να κάνει το Siri έγιναν προφανή. Αν τη ρωτούσες να κλείσει εισητήρια για μια πτήση, τότε θα άνοιγε ταξιδιωτικές ιστοσελίδες, αλλά δε θα έκλεινε την πτήση. Αν τη ρωτούσες να αγοράσει ένα e-book δε θα πραγματοποιήσει την εντολή ακόμα και αν το βιβλίο πωλείται στο iTunes της Apple. Από τότε η Apple επέκτεινε τις δυνατότητες του Siri κάνοντάς το ικανό να κλείσει τραπέζει μέσω του OpenTable. Όμως το Siri ακόμα δεν μπορεί να εκτελέσει απλά ερωτήματα όπως το να κλείσει τραπέζι όταν θα υπάρχει ελεύθερη μέρα στο ημερολόγιό σου. Το Siri μπορεί να χρησιμοποιήσει το OpenTable και μπορεί να ψάξει στο ημερολόγιο. Δεν μπορεί όμως να τα συνδυάσει. 

Τώρα μια μικρή ομάδα μηχανικών από μια startup που ονομάζεται Viv Labs, έρχεται να ξεπεράσει αυτά τα όρια παρουσιάζοντας ένα νέο πρόγραμμα προχωρημένης τεχνητής νοημοσύνης. Εκεί που το Siri μπορεί να εκτελέσει ερωτήματα για τα οποία έχει προγραμματιστεί από πριν, το νέο πρόγραμμα θα εκπαιδεύεται αποκτώντας σχεδόν απεριόριστες δυνατότητες.

«Το Siri είναι το πρώτο κεφάλαιο μιας πού μεγάλης ιστορίας» υποστηρίζει ο Dag Kittlaus, ένας εκ των συνιδρυτών της Viv Labs. Κάτι θα ξέρει, αφού ήταν μέρος της ομάδας που δημιούργησαν το Siri. Το ίδιο και οι υπόλοιποι συνιδρυτές, ο Adam Cheyer και ο Chris Brigham. 

Τα δυό τελευταία χρόνια η ομάδα εργάζεται στη δημιουργία ενός προϊόντος με την ονομασία Viv (από τη λατηνική λέξη «ζωή»).  Το project τους παραμένει κρυφό, αλλά ο Oren Etzioni, επικεφαλής του Allen Institute for Artificial Intelligence και ένας από τους λίγους που το έχουν δει αναφέρει ότι: «Το όραμά τους είναι είναι σπουδαίο. Αν η ομάδα επιτύχει το στόχο της, τότε μιλάμε για το μέλλον των έξυπνων ψηφιακών βοηθών και για μια βιομηχανία δισεκατομμυρίων».

Οι δημιουργοί του Viv θέλουν στο μέλλον η υπηρεσία τους να μπορεί να ενσωματωθεί σε πληθώρα συσκευών συνδεδεμένων στο διαδίκτυο. Υποστηρίζουν ότι θα διαθέτουν το Viv ως υπηρεσία για το κοινό όπως χρησιμοποιούμε το ηλεκτρικό ρεύμα. Απλά με την ομιλία θα μπορούμε να συνδεθούμε σε αυτό που ονομάζουν «global brain». Αυτός ο εγκέφαλος θα τροφοδοτεί εκατομμύρια εφαρμογών και συσκευών. 

AI inside 

«Είμαι περήφανος για το Siri και την επιρροή που έχει στον κόσμο, αλλά θα μπορούσε να είναι και πολύ μεγαλύτερο» αναφέρει ο Cheyer (ένας εκ των συνιδρυτών). «Τώρα θέλω να κάνω κάτι μεγαλύτερο από τα κινητά, μεγαλύτερο από τους υπολογιστές. Θέλω να κάνω κάτι το οποίο θα αλλάξει εντελώς τον τρόπο με τον οποίο κατασκευάζουμε λογισμικό». 

Σημέρα υπάρχει πληθώρα συστημάτων τα οποία χρησιμοποιούν τη φωνή ως στυλ αλληλεπίδρασης με το χρήστη, όπως το Google Now και η Cortana της Microsoft. Επίσης και η Amazon χρησιμοποιεί παρόμοιο λογισμικό στην Fire TV. Όμως ο Kittlaus αναφέρεται στο γεγονός ότι αυτές οι υπηρεσίες έχουν όρια. Το Google Now μπορεί να απαντήσει στο ερώτημα «Σε ποία πόλη γεννήθηκε ο Αβραάμ Λινκολν». Επίσης μπορεί να απαντήσει στο ερώτημα «Πόσο πληθυσμό έχει αυτή η πόλη». Όμως δεν μπορεί να απαντήσει στο ερώτημα «Πόσο πληθυσμό έχει η πόλη στην οποία γεννήθηκε ο Αβραάμ Λίνκολν». Το Google Now διαθέτει τις πληροφορίες για αυτά τα δύο ερωτήματα, δε διαθέτει όμως την ικανότητα να τις συνδυάσει και να δώσει τη σωστή απάντηση. Όπως και το Siri, δεν μπορεί να εκτελέσει ερωτήματα για τα οποία δεν έχει προγραμματιστεί από πριν.

Αυτά τα προβλήματα υπόσχεται να ξεπεράσει το Viv, παράγοντας μόνο του τον κώδικα που χρειάζεται. Στο ερώτημα «Κλείσε μια πτήση με μια θέση μου να χωράει τον Shaq», το Viv θα αναλύσει την πρόταση και θα παράξει αυτόματα ένα αποδοτικό πρόγραμμα για να συνδέσει πληροφορίες από τρίτες πηγές ώστε να βρει πτήσεις με θέσεις που διαθέτουν αρκετό χώρο για τα πόδια. Όλα αυτά σε κλάσματα του δευτερολέπτου.

Τo Viv είναι ένα ανοικτό σύστημα το οποίο θα επιτρέψει σε όλες τις εταιρίες και εφαρμογές να γίνουν μέρος του global brain του. Τα τεχνικά προβλήματα είναι ελάχιστα και απαιτούν απλά λίγη εκπαίδευση του συστήματος πριν να μπορεί να απαντήσει στα πάντα. Ο Kittlaus υποστηρίζει πως το τελικό πρϊόν θα είναι ένας ψηφιακός βοηθός ο οποίος θα γνωρίζει τι θέλουμε πριν το ρωτήσουμε. Φαντάζεται έναν μισομεθυσμένο να κρατάει το κινητό του έξω από ένα κλαμπ στις 2 το βράδυ  και να λέει μόνο «Είμαι μεθυσμένος». Τότε το Viv θα καλέσει ταξί και θα πληροφορήσει τον οδηγό για τη διεύθυνση που πρέπει να τον μεταφέρει και όλα αυτά ενώ ο πελάτης βρίσκεται ημιλυπόθυμος στο πίσω κάθισμα του ταξί. 

Εντυπωσιακό. Μήπως φοβάστε για την προστασία της ιδιωτικότητά σας?