Η αρχή της Χρυσομαλλούσας
Μπορούμε να διδάξουμε μηχανές να διαβάζουν την «Αλίκη στη Χώρα των Θαυμάτων»; Μπορούν οι μηχανές να καταλαβαίνουν τι διαβάζουν;
Στη δεκαετία του 1950, οι γλωσσολόγοι σκέφτηκαν ότι θα ήταν εύκολο να παράγουν ακριβείς μεταφράσεις άμεσα, με αυτόματο τρόπο. Όταν η «μηχανική» μετάφραση αποδείχτηκε αδύνατη, συνειδητοποίησαν ότι η επεξεργασία των ανθρώπινων γλωσσών ήταν εξαιρετικά πιο περίπλοκη από ό,τι είχαν αρχικά υποθέσει. Κατάλαβαν ότι, προκειμένου να μεταφραστεί μία γλώσσα σε μία άλλη, είναι απαραίτητη η κατανόηση της γραμματικής και των δύο γλωσσών, συμπεριλαμβανομένης και της μορφολογίας (της γραμματικής των λεξικών μορφών) και της σύνταξης (της γραμματικής των προτασιακών δομών). Για να κατανοήσουμε τη σύνταξη, πρέπει να κατανοήσουμε και τη σημασιολογία και το λεξικό, καθώς και την πραγματολογία, τη χρήση της γλώσσας. Έτσι, αυτό που ξεκίνησε ως η προσπάθεια μηχανικής μετάφρασης εξελίχθηκε στον κλάδο της υπολογιστικής γλωσσολογίας, που έχει σκοπό να κατανοήσει πώς μπορούν να αναπαρασταθούν, να κωδικοποιηθούν και να υποστούν επεξεργασία οι φυσικές γλώσσες με τη χρήση υπολογιστών.
Σήμερα, οι σύγχρονοι αλγόριθμοι είναι πλέον σε θέση να προβλέψουν απλές λέξεις που λείπουν από μια πρόταση μέσα σε ένα συγκεκριμένο πλαίσιο («συγκείμενο» = context), όπως για παράδειγμα «on» ή «to», ή ακόμα και ρήματα όπως «run» ή «eat», αλλά δεν μπορούν να προβλέψουν κοινά ουσιαστικά όπως «μπάλα», «τραπέζι» ή κύρια ονόματα. Αυτή τους την ικανότητα θέλουν να βελτιώσουν οι ερευνητές στο τμήμα Τεχνητής Νοημοσύνης του Facebook, οι οποίοι προσπαθούν να εκπαιδεύσουν ένα νευρωνικό δίκτυο (έναν υπολογιστή) να προσομοιώνει συμπεριφορά κατανόησης, δηλαδή, «να καταλαβαίνει τι διαβάζει», κάτι που αξιολογείται από το κατά πόσο μπορεί να προβλέπει λέξεις που λείπουν από προτάσεις. Το project ονομάζεται Children’s Book Test.
Τον Φεβρουάριο του 2016, το Facebook δημοσίευσε κάποια σύνολα δεδομένων (data sets) που χρησιμοποιεί για να εκπαιδεύσει τα νευρωνικά του δίκτυα. Σε αυτά περιλαμβάνονται κλασικά μυθιστορήματα για παιδιά, όπως το «Βιβλίο της ζούγκλας», τον «Πίτερ Παν», τις «Μικρές κυρίες», τη «Χριστουγεννιάτικη ιστορία» ή την «Αλίκη στη Χώρα των Θαυμάτων», που προέρχονται από τη δωρεάν online βιβλιοθήκη του Project Gutenberg. Στα παιδικά βιβλία τα κείμενα ανήκουν στον αφηγηματικό τύπο, όπου είναι σημαντικός ο ρόλος του ευρύτερου γλωσσικού πλαισίου.
Η μηχανή εκπαιδεύεται σε ένα δείγμα βιβλίων από τη λίστα. Στη συνέχεια, οι ερευνητές τής παρουσιάζουν σύντομα αποσπάσματα από κάποιες ιστορίες, τα οποία δεν έχει διαβάσει. Σε μια πρόταση υπάρχει ένα κενό. Ζητούν από τη μηχανή να επιλέξει μια λέξη από μια λίστα επιλογών (multiple choice) για να καλύψει το κενό στην τελική πρόταση. Ο υπολογιστής μαθαίνει να εξετάζει το πλαίσιο της φράσης ώστε να μπορέσει να προβλέψει με μεγαλύτερη ακρίβεια τα ουσιαστικά ή τα ονόματα που λείπουν — τα οποία είναι συχνά τα πιο σημαντικά τμήματα σε μια πρόταση (από την άποψη του νοήματος).
Στα συνήθη πρότυπα μελέτης και μοντελοποίησης της φυσικής γλώσσας (δηλαδή, της γλώσσας που μιλούμε εμείς οι άνθρωποι), η πρόβλεψη γίνεται με βάση τη συχνότητα εμφάνισης των λέξεων — εδώ όμως γίνεται με βάση τη συντακτική λειτουργία και το σημασιολογικό περιεχόμενο — δηλαδή το τι σημαίνουν οι λέξεις και οι προτάσεις. Είναι ενδιαφέρον ότι το μέγεθος (η «ποσότητα») του κειμένου που κωδικοποιείται σε μία ενιαία αναπαράσταση επηρεάζει την απόδοση της μηχανής: παρατηρήθηκε ότι η ακρίβεια στην πρόβλεψη της λέξης που λείπει από την πρόταση ήταν μεγαλύτερη όταν ο υπολογιστής εξέταζε μια ορισμένη («σωστή») ποσότητα λέξεων πριν και μετά το κενό — ούτε περισσότερες, ούτε λιγότερες. Αυτή είναι η λεγόμενη Aρχή της Χρυσομαλλούσας.
Σίγουρα έχουμε ακόμη πολύ δρόμο να διανύσουμε μέχρι οι μηχανές να είναι σε θέση να καταλάβουν τη φυσική ανθρώπινη γλώσσα. Πάντως, οι ερευνητές υποστηρίζουν ότι, εάν ένας υπολογιστής είναι σε θέση να απαντήσει σε τέτοιες ερωτήσεις, αυτό δείχνει ότι μια μονάδα Τεχνητής Νοημοσύνης μπορεί να παίρνει αποφάσεις αντλώντας από ένα ευρύτερο πλαίσιο μιας κατάστασης, μια ιδιαίτερα κρίσιμη δεξιότητα ενός οργανισμού στο πώς αναπαριστά, θυμάται ή και χρησιμοποιεί σύνθετα σύνολα πληροφοριών. Μέχρι τότε, τέτοιες έρευνες αξιοποιούνται στην κατασκευή χρήσιμων υπηρεσιών, όπως η M, η ψηφιακή μας βοηθός στο Messenger.
ΥΓ. Αυτή είναι η λίστα ανάγνωσης για μια ευφυή μηχανή που θέλει να μάθει να διαβάζει:
Andrew Lang, Prince Prigio
Andrew Lang, Prince Prigio («His Own Fairy Book»)
Andrew Lang, Prince Ricardo of Pantouflia
Andrew Lang, The Blue Fairy Book
Andrew Lang, The Brown Fairy Book
Andrew Lang, The Crimson Fairy Book
Andrew Lang, The Grey Fairy Book
Andrew Lang, The Lilac Fairy Book
Andrew Lang, The Orange Fairy Book
Andrew Lang, The Pink Fairy Book
Andrew Lang, The Red Fairy Book
Andrew Lang, The Violet Fairy Book
Andrew Lang, The Yellow Fairy Book
Charles Dickens, A Christmas Carol
Charles Dickens, The Cricket on the Hearth
Charles Kingsley, The Water-Babies
Harriet Elizabeth Beecher Stowe, Uncle Tom’s Cabin, Young Folks’ Edition
James Matthew Barrie, Peter Pan
James Matthew Barrie, Peter Pan in Kensington Gardens, Version 1
James Matthew Barrie, Peter Pan in Kensington Gardens, Version 2
James Matthew Barrie, Peter and Wendy
Lewis Carroll, Alice’s Adventures Under Ground
Lewis Carroll, Through the Looking-Glass
Lewis Carroll, Alice’s Adventures in Wonderland
Louisa May Alcott, Aunt Jo’s Scrap-Bag
Louisa May Alcott, Aunt Jo’s Scrap-Bag, τόμος 5
Louisa May Alcott, Aunt Jo’s Scrap- Bag, τόμος 6
Louisa May Alcott, Eight Cousins
Louisa May Alcott, Flower Fables
Louisa May Alcott, Jack and Jill
Louisa May Alcott, Jo’s Boys
Louisa May Alcott, Kitty’s Class Day And Other Stories
Louisa May Alcott, Little Men
Louisa May Alcott, Little Women
Louisa May Alcott, Marjorie’s Three Gifts
Louisa May Alcott, The Mysterious Key And What It Opened
Louisa May Alcott, Under the Lilacs
Lucy Maud Montgomery, Anne’s House of Dreams
Lucy Maud Montgomery, Anne Of Avonlea
Lucy Maud Montgomery, Anne Of Green Gables
Lucy Maud Montgomery, Anne Of The Island
Lucy Maud Montgomery, Chronicles of Avonlea
Lucy Maud Montgomery, Further Chronicles of Avonlea
Lucy Maud Montgomery, Kilmeny of the Orchard
Lucy Maud Montgomery, The Golden Road
Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1896 to 1901
Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1902 to 1903
Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1904
Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1905 to 1906
Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1907 to 1908
Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1909 to 1922
Lucy Maud Montgomery, Rainbow Valley
Lucy Maud Montgomery, Rilla of Ingleside
Lucy Maud Montgomery, The Story Girl
Nathaniel Hawthorne, Little Annie’s Ramble («Twice Told Tales»)
Nathaniel Hawthorne, Snow Flakes («Twice Told Tales»)
Nathaniel Hawthorne, Sunday at Home («Twice Told Tales»)
Nathaniel Hawthorne, Tanglewood Tales
Nathaniel Hawthorne, The Gorgon’s Head
Nathaniel Hawthorne, The Lily’s Quest («Twice Told Tales»)
Nathaniel Hawthorne, The Miraculous Pitcher
Nathaniel Hawthorne, The Paradise of Children
Nathaniel Hawthorne, The Seven Vagabonds («Twice Told Tales»)
Nathaniel Hawthorne, The Sister Years («Twice Told Tales»)
Nathaniel Hawthorne, The Three Golden Apples
Nathaniel Hawthorne, The Threefold Destiny («Twice Told Tales»)
Nathaniel Hawthorne, The Toll Gatherer’s Day («Twice Told Tales»)
Nathaniel Hawthorne, The Village Uncle («Twice Told Tales»)
Nathaniel Hawthorne, The Vision of the Fountain («Twice Told Tales»)
Nathaniel Hawthorne, Twice Told Tales
Oscar Wilde, The Happy Prince and Other Tales
Robert Louis Stevenson, Kidnapped
Robert Louis Stevenson, The Black Arrow
Robert Louis Stevenson, Treasure Island
Rudyard Kipling, Just So Stories
Rudyard Kipling, Kim
Rudyard Kipling, Puck of Pook’s Hill
Rudyard Kipling, The Jungle Book
Rudyard Kipling, The Second Jungle Book
Thornton Waldo Burgess, Blacky the Crow
Thornton Waldo Burgess, Bowser The Hound
Thornton Waldo Burgess, Lightfoot the Deer
Thornton Waldo Burgess, Mother West Wind’s Children
Thornton Waldo Burgess, Mother West Wind «How» Stories
Thornton Waldo Burgess, Mother West Wind «Where» Stories
Thornton Waldo Burgess, Mother West Wind «Why» Stories
Thornton Waldo Burgess, Mother West Wind’s Animal Friends
Thornton Waldo Burgess, Mrs. Peter Rabbit
Thornton Waldo Burgess, Old Granny Fox
Thornton Waldo Burgess, Old Mother West Wind
Thornton Waldo Burgess, The Adventures of Buster Bear
Thornton Waldo Burgess, The Adventures of Chatterer the Red Squirrel
Thornton Waldo Burgess, The Adventures of Danny Meadow Mouse
Thornton Waldo Burgess, The Adventures of Grandfather Frog
Thornton Waldo Burgess, The Adventures of Old Mr. Toad
Thornton Waldo Burgess, The Adventures of Jerry Muskrat
Thornton Waldo Burgess, The Adventures of Jimmy Skunk
Thornton Waldo Burgess, The Adventures of Lightfoot the Deer
Thornton Waldo Burgess, The Adventures of Mr. Mocker
Thornton Waldo Burgess, The Adventures of Paddy the Beaver
Thornton Waldo Burgess, The Adventures of Poor Mrs. Quack
Thornton Waldo Burgess, The Adventures of Prickly Porky
Thornton Waldo Burgess, The Adventures of Reddy Fox
Thornton Waldo Burgess, The Adventures of Unc’ Billy Possum
Thornton Waldo Burgess, Whitefoot the Wood Mouse
Thornton Waldo Burgess, Happy Jack
Thornton Waldo Burgess, The Adventures of Johnny Chuck
Washington Irving The Legend of Sleepy Hollow
[ Εικονογράφηση ].