Η ικανότητα ανίχνευσης της χαμηλότερης μορφής εξυπνάδας θα μπορούσε να βοηθήσει την τεχνητή νοημοσύνη να αλληλεπιδράσει με τους ανθρώπους πιο φυσικά, λένε οι επιστήμονες
Ερευνητές στην Ολλανδία κατασκεύασαν έναν ανιχνευτή σαρκασμού με τεχνητή νοημοσύνη που μπορεί να εντοπίσει πότε αναπτύσσεται η χαμηλότερη μορφή εξυπνάδας και η υψηλότερη μορφή νοημοσύνης.
«Είμαστε σε θέση να αναγνωρίσουμε τον σαρκασμό με αξιόπιστο τρόπο και ανυπομονούμε να τον αναπτύξουμε», δήλωσε ο Ματ Κόλερ στο εργαστήριο τεχνολογίας ομιλίας του Πανεπιστημίου του Χρόνινγκεν. «Θέλουμε να δούμε πόσο μακριά μπορούμε να το προωθήσουμε».
Υπάρχουν περισσότερα στο έργο από τους αλγόριθμους διδασκαλίας που μερικές φορές ακόμη και τα πιο διάχυτα σχόλια δεν μπορούν να ληφθούν κυριολεκτικά και πρέπει, αντ’ αυτού, να ερμηνευθούν ως το διαμετρικά αντίθετο. Ο σαρκασμός διαποτίζει τον λόγο μας περισσότερο από ό,τι θα μπορούσαμε να εκτιμήσουμε, είπε ο Coler, επομένως η κατανόηση του είναι ζωτικής σημασίας εάν οι άνθρωποι και οι μηχανές θέλουν να επικοινωνούν απρόσκοπτα.
«Όταν ξεκινάς να μελετάς τον σαρκασμό, αποκτάς υπερ-συναίσθηση του βαθμού στον οποίο τον χρησιμοποιούμε ως μέρος του συνήθους τρόπου επικοινωνίας μας», είπε ο Κόλερ. «Αλλά πρέπει να μιλάμε στις συσκευές μας με πολύ κυριολεκτικό τρόπο, σαν να μιλάμε σε ένα ρομπότ, γιατί είμαστε. Δεν χρειάζεται να είναι έτσι».
Οι άνθρωποι είναι γενικά επιδέξιοι στο να εντοπίζουν τον σαρκασμό, αν και οι περιορισμένες ενδείξεις που βρίσκονται μόνο στο κείμενο τον καθιστούν πιο σκληρό από ό,τι σε μια πρόσωπο με πρόσωπο αλληλεπίδραση, όταν η παράδοση, ο τόνος και οι εκφράσεις του προσώπου αποκαλύπτουν την πρόθεση του ομιλητή. Κατά την ανάπτυξη της τεχνητής νοημοσύνης τους, οι ερευνητές διαπίστωσαν ότι πολλά στοιχεία είχαν σημασία για τον αλγόριθμο ώστε να διακρίνει το σαρκαστικό από το ειλικρινές.
Σε μια εργασία που παρουσιάστηκε σε μια κοινή συνάντηση της Ακουστικής Εταιρείας της Αμερικής και της Καναδικής Ακουστικής Ένωσης στην Οττάβα την Πέμπτη, ο Xiyuan Gao, ένας διδάκτορας στο εργαστήριο, περιέγραψε πώς η ομάδα εκπαίδευσε ένα νευρωνικό δίκτυο σε κείμενο, ήχο και συναισθηματικό περιεχόμενο βίντεο. κλιπ από κωμικές σειρές των ΗΠΑ, συμπεριλαμβανομένων των Friends και The Big Bang Theory. Η βάση δεδομένων, γνωστή ως Mustard, συντάχθηκε από ερευνητές στις ΗΠΑ και τη Σιγκαπούρη, οι οποίοι σχολίασαν προτάσεις από τις τηλεοπτικές εκπομπές με ετικέτες σαρκασμού για να δημιουργήσουν τον δικό τους ανιχνευτή.
Μια σκηνή στην οποία εκπαιδεύτηκε η τεχνητή νοημοσύνη ήταν η μάταιη προσπάθεια του Λέοναρντ να δραπετεύσει από ένα κλειδωμένο δωμάτιο στο The Big Bang Theory, που ώθησε τον Sheldon να παρατηρήσει: «Είναι απλώς ένα προνόμιο να προσέχεις το μυαλό σου στη δουλειά». Ένας άλλος από το Friends ζήτησε από τον Ross να προσκαλέσει τη Rachel να έρθει μαζί με τον Joey και τον Chandler για να φτιάξουν κάποια έπιπλα, προτρέποντας τον Chandler να σχολιάσει: «Ναι, και είμαστε πολύ ενθουσιασμένοι για αυτό».
Μετά από εκπαίδευση στο κείμενο και τον ήχο, μαζί με ενδείξεις που αντικατόπτριζαν το συναισθηματικό περιεχόμενο των λέξεων που έλεγαν οι ηθοποιοί, η τεχνητή νοημοσύνη μπορούσε να ανιχνεύσει σαρκασμό σε ανταλλαγές χωρίς ετικέτα από τις κωμωδίες σχεδόν στο 75% των περιπτώσεων. Περαιτέρω εργασία στο εργαστήριο έχει χρησιμοποιήσει συνθετικά δεδομένα για να αυξήσει περαιτέρω την ακρίβεια, αλλά αυτή η έρευνα αναμένει δημοσίευση.
Ο Shekhar Nayak, ένας άλλος ερευνητής στο έργο, είπε ότι, εκτός από τις συνομιλίες με βοηθούς τεχνητής νοημοσύνης πιο ρεαλιστικές, η ίδια προσέγγιση θα μπορούσε να χρησιμοποιηθεί για τον εντοπισμό του αρνητικού τόνου στη γλώσσα και τον εντοπισμό της κακοποίησης και της ρητορικής μίσους.
Ο Γκάο είπε ότι πρόσθετες βελτιώσεις θα μπορούσαν να προκύψουν από την προσθήκη οπτικών ενδείξεων στα δεδομένα εκπαίδευσης του AI, όπως κινήσεις φρυδιών και χαμόγελα. Αυτό εγείρει το ερώτημα πόσο ακριβής είναι αρκετά ακριβής; «Θα έχουμε μια μηχανή που να είναι 100% ακριβής;» είπε ο Γκάο. «Αυτό δεν είναι κάτι που ακόμη και οι άνθρωποι μπορούν να επιτύχουν».
Η εξοικείωση των προγραμμάτων με το πώς πραγματικά μιλάνε οι άνθρωποι θα βοηθήσει τους ανθρώπους να συνομιλούν με τις συσκευές πιο φυσικά, προσθέτει ο Coler, αλλά αναρωτιέται τι θα συμβεί εάν οι μηχανές ενστερνιστούν τις νέες δεξιότητές τους και αρχίσουν να μας σαρκάζουν. «Αν ρωτήσω: «Έχεις χρόνο για μια ερώτηση;» Και λέει: «Ναι, σίγουρα», μπορεί να σκεφτώ: έχει ή δεν έχει;»



