Η αρχή της Χρυσομαλλούσας

L
Κατερίνα Χρυσανθοπούλου

Η αρχή της Χρυσομαλλούσας

Μπορούμε να διδάξουμε μηχανές να διαβάζουν την «Αλίκη στη Χώρα των Θαυμάτων»; Μπορούν οι μηχανές να καταλαβαίνουν τι διαβάζουν;

Στη δεκαετία του 1950, οι γλωσσολόγοι σκέφτηκαν ότι θα ήταν εύκολο να παράγουν ακριβείς μεταφράσεις άμεσα, με αυτόματο τρόπο. Όταν η «μηχανική» μετάφραση αποδείχτηκε αδύνατη, συνειδητοποίησαν ότι η επεξεργασία των ανθρώπινων γλωσσών ήταν εξαιρετικά πιο περίπλοκη από ό,τι είχαν αρχικά υποθέσει. Κατάλαβαν ότι, προκειμένου να μεταφραστεί μία γλώσσα σε μία άλλη, είναι απαραίτητη η κατανόηση της γραμματικής και των δύο γλωσσών, συμπεριλαμβανομένης και της μορφολογίας (της γραμματικής των λεξικών μορφών) και της σύνταξης (της γραμματικής των προτασιακών δομών). Για να κατανοήσουμε τη σύνταξη, πρέπει να κατανοήσουμε και τη σημασιολογία και το λεξικό, καθώς και την πραγματολογία, τη χρήση της γλώσσας. Έτσι, αυτό που ξεκίνησε ως η προσπάθεια μηχανικής μετάφρασης εξελίχθηκε στον κλάδο της υπολογιστικής γλωσσολογίας, που έχει σκοπό να κατανοήσει πώς μπορούν να αναπαρασταθούν, να κωδικοποιηθούν και να υποστούν επεξεργασία οι φυσικές γλώσσες με τη χρήση υπολογιστών.

Σήμερα, οι σύγχρονοι αλγόριθμοι είναι πλέον σε θέση να προβλέψουν απλές λέξεις που λείπουν από μια πρόταση μέσα σε ένα συγκεκριμένο πλαίσιο («συγκείμενο» = context), όπως για παράδειγμα «on» ή «to», ή ακόμα και ρήματα όπως «run» ή «eat», αλλά δεν μπορούν να προβλέψουν κοινά ουσιαστικά όπως «μπάλα», «τραπέζι» ή κύρια ονόματα. Αυτή τους την ικανότητα θέλουν να βελτιώσουν οι ερευνητές στο τμήμα Τεχνητής Νοημοσύνης του Facebook, οι οποίοι προσπαθούν να εκπαιδεύσουν ένα νευρωνικό δίκτυο (έναν υπολογιστή) να προσομοιώνει συμπεριφορά κατανόησης, δηλαδή, «να καταλαβαίνει τι διαβάζει», κάτι που αξιολογείται από το κατά πόσο μπορεί να προβλέπει λέξεις που λείπουν από προτάσεις. Το project ονομάζεται Childrens Book Test.

Τον Φεβρουάριο του 2016, το Facebook δημοσίευσε κάποια σύνολα δεδομένων (data sets) που χρησιμοποιεί για να εκπαιδεύσει τα νευρωνικά του δίκτυα. Σε αυτά περιλαμβάνονται κλασικά μυθιστορήματα για παιδιά, όπως το «Βιβλίο της ζούγκλας», τον «Πίτερ Παν», τις «Μικρές κυρίες», τη «Χριστουγεννιάτικη ιστορία» ή την «Αλίκη στη Χώρα των Θαυμάτων», που προέρχονται από τη δωρεάν online βιβλιοθήκη του Project Gutenberg. Στα παιδικά βιβλία τα κείμενα ανήκουν στον αφηγηματικό τύπο, όπου είναι σημαντικός ο ρόλος του ευρύτερου γλωσσικού πλαισίου.

Η μηχανή εκπαιδεύεται σε ένα δείγμα βιβλίων από τη λίστα. Στη συνέχεια, οι ερευνητές τής παρουσιάζουν σύντομα αποσπάσματα από κάποιες ιστορίες, τα οποία δεν έχει διαβάσει. Σε μια πρόταση υπάρχει ένα κενό. Ζητούν από τη μηχανή να επιλέξει μια λέξη από μια λίστα επιλογών (multiple choice) για να καλύψει το κενό στην τελική πρόταση. Ο υπολογιστής μαθαίνει να εξετάζει το πλαίσιο της φράσης ώστε να μπορέσει να προβλέψει με μεγαλύτερη ακρίβεια τα ουσιαστικά ή τα ονόματα που λείπουν — τα οποία είναι συχνά τα πιο σημαντικά τμήματα σε μια πρόταση (από την άποψη του νοήματος).

Στα συνήθη πρότυπα μελέτης και μοντελοποίησης της φυσικής γλώσσας (δηλαδή, της γλώσσας που μιλούμε εμείς οι άνθρωποι), η πρόβλεψη γίνεται με βάση τη συχνότητα εμφάνισης των λέξεων — εδώ όμως γίνεται με βάση τη συντακτική λειτουργία και το σημασιολογικό περιεχόμενο — δηλαδή το τι σημαίνουν οι λέξεις και οι προτάσεις. Είναι ενδιαφέρον ότι το μέγεθος (η «ποσότητα») του κειμένου που κωδικοποιείται σε μία ενιαία αναπαράσταση επηρεάζει την απόδοση της μηχανής: παρατηρήθηκε ότι η ακρίβεια στην πρόβλεψη της λέξης που λείπει από την πρόταση ήταν μεγαλύτερη όταν ο υπολογιστής εξέταζε μια ορισμένη («σωστή») ποσότητα λέξεων πριν και μετά το κενό — ούτε περισσότερες, ούτε λιγότερες. Αυτή είναι η λεγόμενη Aρχή της Χρυσομαλλούσας.

Σίγουρα έχουμε ακόμη πολύ δρόμο να διανύσουμε μέχρι οι μηχανές να είναι σε θέση να καταλάβουν τη φυσική ανθρώπινη γλώσσα. Πάντως, οι ερευνητές υποστηρίζουν ότι, εάν ένας υπολογιστής είναι σε θέση να απαντήσει σε τέτοιες ερωτήσεις, αυτό δείχνει ότι μια μονάδα Τεχνητής Νοημοσύνης μπορεί να παίρνει αποφάσεις αντλώντας από ένα ευρύτερο πλαίσιο μιας κατάστασης, μια ιδιαίτερα κρίσιμη δεξιότητα ενός οργανισμού στο πώς αναπαριστά, θυμάται ή και χρησιμοποιεί σύνθετα σύνολα πληροφοριών. Μέχρι τότε, τέτοιες έρευνες αξιοποιούνται στην κατασκευή χρήσιμων υπηρεσιών, όπως η M, η ψηφιακή μας βοηθός στο Messenger.

ΥΓ. Αυτή είναι η λίστα ανάγνωσης για μια ευφυή μηχανή που θέλει να μάθει να διαβάζει:

Andrew Lang, Prince Prigio

Andrew Lang, Prince Prigio («His Own Fairy Book»)

Andrew Lang, Prince Ricardo of Pantouflia

Andrew Lang, The Blue Fairy Book

Andrew Lang, The Brown Fairy Book

Andrew Lang, The Crimson Fairy Book

Andrew Lang, The Grey Fairy Book

Andrew Lang, The Lilac Fairy Book

Andrew Lang, The Orange Fairy Book

Andrew Lang, The Pink Fairy Book

Andrew Lang, The Red Fairy Book

Andrew Lang, The Violet Fairy Book

Andrew Lang, The Yellow Fairy Book

Charles Dickens, A Christmas Carol

Charles Dickens, The Cricket on the Hearth

Charles Kingsley, The Water-Babies

Harriet Elizabeth Beecher Stowe, Uncle Tom’s Cabin, Young Folks’ Edition

James Matthew Barrie, Peter Pan

James Matthew Barrie, Peter Pan in Kensington Gardens, Version 1

James Matthew Barrie, Peter Pan in Kensington Gardens, Version 2

James Matthew Barrie, Peter and Wendy

Lewis Carroll, Alice’s Adventures Under Ground

Lewis Carroll, Through the Looking-Glass

Lewis Carroll, Alice’s Adventures in Wonderland

Louisa May Alcott, Aunt Jo’s Scrap-Bag

Louisa May Alcott, Aunt Jo’s Scrap-Bag, τόμος 5

Louisa May Alcott, Aunt Jo’s Scrap- Bag, τόμος 6

Louisa May Alcott, Eight Cousins

Louisa May Alcott, Flower Fables

Louisa May Alcott, Jack and Jill

Louisa May Alcott, Jo’s Boys

Louisa May Alcott, Kitty’s Class Day And Other Stories

Louisa May Alcott, Little Men

Louisa May Alcott, Little Women

Louisa May Alcott, Marjorie’s Three Gifts

Louisa May Alcott, The Mysterious Key And What It Opened

Louisa May Alcott, Under the Lilacs

Lucy Maud Montgomery, Anne’s House of Dreams

Lucy Maud Montgomery, Anne Of Avonlea

Lucy Maud Montgomery, Anne Of Green Gables

Lucy Maud Montgomery, Anne Of The Island

Lucy Maud Montgomery, Chronicles of Avonlea

Lucy Maud Montgomery, Further Chronicles of Avonlea

Lucy Maud Montgomery, Kilmeny of the Orchard

Lucy Maud Montgomery, The Golden Road

Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1896 to 1901

Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1902 to 1903

Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1904

Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1905 to 1906

Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1907 to 1908

Lucy Maud Montgomery, Lucy Maud Montgomery, Short Stories, 1909 to 1922

Lucy Maud Montgomery, Rainbow Valley

Lucy Maud Montgomery, Rilla of Ingleside

Lucy Maud Montgomery, The Story Girl

Nathaniel Hawthorne, Little Annie’s Ramble («Twice Told Tales»)

Nathaniel Hawthorne, Snow Flakes («Twice Told Tales»)

Nathaniel Hawthorne, Sunday at Home («Twice Told Tales»)

Nathaniel Hawthorne, Tanglewood Tales

Nathaniel Hawthorne, The Gorgon’s Head

Nathaniel Hawthorne, The Lily’s Quest («Twice Told Tales»)

Nathaniel Hawthorne, The Miraculous Pitcher

Nathaniel Hawthorne, The Paradise of Children

Nathaniel Hawthorne, The Seven Vagabonds («Twice Told Tales»)

Nathaniel Hawthorne, The Sister Years («Twice Told Tales»)

Nathaniel Hawthorne, The Three Golden Apples

Nathaniel Hawthorne, The Threefold Destiny («Twice Told Tales»)

Nathaniel Hawthorne, The Toll Gatherer’s Day («Twice Told Tales»)

Nathaniel Hawthorne, The Village Uncle («Twice Told Tales»)

Nathaniel Hawthorne, The Vision of the Fountain («Twice Told Tales»)

Nathaniel Hawthorne, Twice Told Tales

Oscar Wilde, The Happy Prince and Other Tales

Robert Louis Stevenson, Kidnapped

Robert Louis Stevenson, The Black Arrow

Robert Louis Stevenson, Treasure Island

Rudyard Kipling, Just So Stories

Rudyard Kipling, Kim

Rudyard Kipling, Puck of Pook’s Hill

Rudyard Kipling, The Jungle Book

Rudyard Kipling, The Second Jungle Book

Thornton Waldo Burgess, Blacky the Crow

Thornton Waldo Burgess, Bowser The Hound

Thornton Waldo Burgess, Lightfoot the Deer

Thornton Waldo Burgess, Mother West Wind’s Children

Thornton Waldo Burgess, Mother West Wind «How» Stories

Thornton Waldo Burgess, Mother West Wind «Where» Stories

Thornton Waldo Burgess, Mother West Wind «Why» Stories

Thornton Waldo Burgess, Mother West Wind’s Animal Friends

Thornton Waldo Burgess, Mrs. Peter Rabbit

Thornton Waldo Burgess, Old Granny Fox

Thornton Waldo Burgess, Old Mother West Wind

Thornton Waldo Burgess, The Adventures of Buster Bear

Thornton Waldo Burgess, The Adventures of Chatterer the Red Squirrel

Thornton Waldo Burgess, The Adventures of Danny Meadow Mouse

Thornton Waldo Burgess, The Adventures of Grandfather Frog

Thornton Waldo Burgess, The Adventures of Old Mr. Toad

Thornton Waldo Burgess, The Adventures of Jerry Muskrat

Thornton Waldo Burgess, The Adventures of Jimmy Skunk

Thornton Waldo Burgess, The Adventures of Lightfoot the Deer

Thornton Waldo Burgess, The Adventures of Mr. Mocker

Thornton Waldo Burgess, The Adventures of Paddy the Beaver

Thornton Waldo Burgess, The Adventures of Poor Mrs. Quack

Thornton Waldo Burgess, The Adventures of Prickly Porky

Thornton Waldo Burgess, The Adventures of Reddy Fox

Thornton Waldo Burgess, The Adventures of Unc’ Billy Possum

Thornton Waldo Burgess, Whitefoot the Wood Mouse

Thornton Waldo Burgess, Happy Jack

Thornton Waldo Burgess, The Adventures of Johnny Chuck

Washington Irving The Legend of Sleepy Hollow

[ Εικονογράφηση ].