Voiko
koneella olla tunteita ? |
||||||||||||||||||||||||||||||
Laajempi
versio samasta aiheesta pdf muodossa Jussi Hanhijärvi |
||||||||||||||||||||||||||||||
Artikkelin innoituksen lähteenä on ollut Stanley Kubrickin ja Arhur C. Clarken ajankohtaisessa tieteisfantasiassa 2001: A Space Odyssey kuvatun tietokoneen HAL 9000 käyttäytyminen. Monien muiden seikkojen ohella HALlla oli kyky audiovisuaalisten vihjeiden perusteella lukea huulilta, arvioida piirustusten esteettistä sisältöä, tunnistaa miehistön tunnetiloja, omata tunteita ennustaa miehistön käyttäytymistä ja adaptiivisesti antaa personoituja vasteita. - Artikkelissa pyritään lyhyesti vastaamaan kysymykseen mitä tarkoitetaan konetunteilla, miten kone pystyy havaitsemaan käyttäjän tunteita ja miten voidaan tunteita syntetisoida.
Kun järjestelmä on ollut muutaman päivän hyvän
olon tilassa pyrkii se siirtymään utelias-tilaan, jolloin se yrittää etsiä
uusia keinoja annetun tehtävän suorittamiseksi (vastaavasti se ottaa tällöin
myös riskejä). Kun kone kärsii huonon olon tilasta se pyrkii allokoimaan
lisää resursseja ja yrittää ymmärtää käyttäjän toiveita. Käyttäjän asettaessa
uuden mutkikkaan sarjan toimintavaatimuksia koneelle pyrkii tämä arvioimaan
hyvän olon ja masennus tilaan johtaneita tilanteita. Arvioinnin tuloksena
se pyrkii hyvän olon tilaan eli valitsemaan sellaiset toiminnot, jotka
aikaisemman joko johtivat käyttäjän selvästi ilmaisemaan tyytyväisyyteen
tai käyttäjä suoriutui nopeammin ja tehokkaammin tehtävistään. Toisin
kuin kiinteästi ohjelmoidut tietokonejärjestelmät, niin tällainen adaptiivinen
henkilökohtainen apulainen ei vaadi täsmällisiä sääntöjä eikä edellytä
käyttäjältä yhdenmukaista vakioitunutta käyttäytymistä. Kone on tietoinen
käyttäjän dynaamisuudesta eikä käyttäjä aina muista ilmaista tyytyväisyyttään
ja toisinaan hän moittii koneen käyttäytymistä oikeudettomasti (tällöin
kone saattaa hieman nenäkkäästi kysyä selvityksiä).
b) Tunnetilat ovat koneen sisäisiä tiloja. c) Tunne tilasta toiseen siirtyminen tapahtuu joko ulkoisen herätteen seurauksena tai sisäisinä havaintoina. d) Ilmaisee ulospäin tunteensa, tilansa, ulkopuolisen havaitsijan ymmärtämällä tavalla. e) Kone on sopeutuvainen ympäristöönsä. Mitä ymmärretään tunteiden olevan ? Sanakirja määrittelee tunteen olevan "jonkin sielullisen tapahtuman tai tajunnansisällyksen elämyksellinen kokeminen mieluisan tai epämieluisan sävyisenä" (Lehtovaara 1964). Tunteilla on keskeinen merkitys ihmisen henkiinjäämisessä ja sopeutumisessa ympäristöönsä. Ne motivoivat tai käynnistävät tiettyjä moraaliseksi kutsuttuja käytöstapoja. Tapoja, jotka edelleen muodostavat merkittävän osan modernin sivilisaation perusteista. Tunteet vaikuttavat ratkaisevasti empaattiseen tai altruistiseen käyttäytymiseen ja niillä on suuri vaikutus ihmismielen luovassa toiminnassa. Tunteet eivät ole pelkästään tehokkaita ihmisten välisessä kanssakäymisessä vaan niillä on suuri osuus erilaisissa kehon, aivojen ja ajatus toiminnan säätely- ja ohjaustehtävissä. Niillä on havaittu olevan suuri merkitys ihmisen tekemissä päätösprosesseissa (Damasio 1994). Tunteilla on myös ratkaiseva merkitys maailman havaitsemisessa ja sen ilmiöiden tulkinnassa. (LeDoux 1996). Tiedetään ihmisen kyvyn tehdä järkeviä ja soveliaita ratkaisuja dynaamisesti muuttuvassa, kompleksisessa ja ennustamattomassa ympäristössä perustuvan hyvin pitkälle tunteisiin. Marvin Minsky - eräs tekoälytutkimuksen pioneereista - onkin todennut kuvaavasti "kysymys ei ole siitä voiko älykkäällä koneella olla tunteita, vaan voiko kone olla älykäs ilman tunteita" (Minsky 1994). Tunteiden syntymekanismista Kysymys siitä, miten tunteet oikein syntyvät on ollut tunnetutkimuksen eräs kiistanalaisimpia ongelmia. Ihmisten on helppo kuvitella asioita, jotka tekevät heidät surulliseksi tai iloiseksi mutta on huomattavasti vaikeampaa selittää täsmällisesti miten, ilo tai suru syntyy. Kysymys joudutaan pilkkomaan kolmeen osaan eli neurofysiologisiin, elimellisiin ja tajunnan sisäisiin tapahtumiin. Esimerkiksi tulehdus voi aiheuttaa kivun ja kipu edelleen voi johtaa vihan tunteeseen. Neurofysiologiset tutkimukset selittävät tämän siten, että primääriaistien ( näkö-, kuulo-, kosketus- jne. aistien) tuottamat signaalit vaeltavat hermoratoja pitkin limbiseen järjestelmään 1). Täältä aktivoituvat tunteet nopean, minimaallisen, automaattisen prosessin tuloksena. Tällä tavalla aktivoituneet tunteet eivät ole puhtaasti neokortexin (isojen aivojen poimuttuneiden keski- ja sivu-uurteiden kuorikerroksen) prosessoinnin tuloksia. Sen sijaan tunteet, jotka aktivoituvat ajatus tai muistitoiminnan tuloksena ajatellaan muodostuvan piiristä jossa informaatio välitetään väliaivoista neokortexiin. Tällaisen piirin katsotaan muodostavan neuraalisen pohjan tajunnansisäiselle tapahtumien arvioinnille ja arvioinnin tuloksen syntyneille tunteille. Väliaivoilla on ratkaiseva osuus ulkoisten tunneilmaisujen esiintymisessä, erityisesti autonomisen hermoston sekä ilmeitä ja eleitä säätelevän motorista toimintaa ohjaavien järjestelmien säätelemisessä [Ilmoniemi]. Esimerkiksi vihassa saattaa sydämen lyönti- ja hengitystiheys kasvaa, kasvojen ilmeet muuttua jne. Tunteiden kognitiivisesta - tajunnansisäisestä - syntymekanismista ei vielä ole täyttä varmuutta. Tutkijoiden joukossa esiintyy useita koulukuntia ja näkemyksiä. Monet teoriat ovat kuitenkin yhtä mieltä siitä, että tunteen syntymisessä pitää ensinnäkin esiintyä tietty stimulus, jota pyritään arvioimaan autonomisena ja automaattisena joko tiedostamattomana (primitiivisenä) tai tiedostettuna (symbolisena) prosessina. Esiintyy erilaisia näkemyksiä siitä, miten tämä arviointi (ns. valensointi) tehdään. Eräät tutkijat korostavat arvioinnin elementteinä olevan miellyttävyys, varmuus, ennakoitavissa oleva vaiva, hallittavuus, havaittava este ja laillisuus. Bernard Weinerin taasen on esittänyt tuntomerkkiteorian, jonka mukaan tapahtumien syiden havaitseminen voidaan luonnehtia kolmella periaatteellisella tavalla, jotka taasen vaikuttavat moneen tunnekokemukseen. Havaittavat tapahtumien syyt voidaan luonnehtia alueellisesti (joko ihmiselle ulkoisesti tai sisäisesti), stabiiliuden mukaan (henkilön luonteenpiirteen tai hetkellisen olotilan mukaan) ja hallittavuuden mukaan (ihminen voi tai ei voi hallita tunnetta tai tilannetta). Miten koneet voivat havaita käyttäjien tunteita Edellä olevasta on siis selvää, että tunteet muodostavat koko ihmiskehoa, aivoja ja tajunnan sisäisiä prosesseja säätävän ja ohjaavan kokonaisuuden. Kun haluamme koneellisesti tunnistaa tunteita on meillä useita mahdollisuuksia. Tunnistaminen voi perustua visuaalisiin vihjeisiin, äänihavaintoihin, fysiologisten tai neurokemiallisten prosessien mittaamiseen. Visuaalisessa tunteiden tunnistamisessa on tutkimuksen painopiste tähän saakka keskittynyt kasvon ilmeiden tunnistamiseen. Tämä voidaan tehdä joko tutkimalla still kuvista ilmeiden ääriarvoja tai selvittää erilaisin videosekvenssein ilmeiden muutoksia. Valtaosa demon- stroiduista järjestelmistä pyrkii luokittelemaan havaitut kasvon ilmeet tai ilmesekvenssit tiettyihin perusryhmiin (esimerkiksi onneen, suruun, yllättyneisyyteen, vihaan, pelkoon tai inhoon). Still kuvista tehtyjen analyysien tarkkuuksien on havaittu olevan heikkoja, jopa samalla henkilöllä esiintyvien tunneilmeiden välillä (Rosenblum 1994). Analysoimalla video sekvenssejä ollaan saavutettu parempia tuloksia. Kokeellisesti onkin havaittu, tietyt kasvonlihakset liikkuvat kaikilla ihmisillä samaan suuntaan samoja tunteita esittäessään, esimerkiksi vihastuessaan liikkuvat kulmakarvat alaspäin tunteen alussa kun taas henkilön yllättyessä liikkuvat kulmakarvat aluksi ylöspäin ja tunteen vaimentuessa ajan mukaan alaspäin. Videosekvenssin tulkintaan on käytetty erilaisia hahmontunnistusmenetelmiä. Rosenblum & al. käyttivät kolmitasoista luokitinta jossa alimmalla hierarkiatasolla käytettiin visuaalista piirreirrotusta huulista ja kulmakarvoista, hierarkian seuraavalla tasolla sovellettiin stokastisia ns. RBF funktioita opetettuihin 6 perustunnetta tunnistaviin hermoverkkoihin ja ylimmällä tasolla käytettiin myös hermoverkkoihin pohjautuvaa luokitinta tulkitsemaan alemman tason tulokset (Rosenblum). Vaikka he saavuttivat kohtalaisen hyvän tunnistustarkkuuden (n. 70 - 80 %), niin menettely ei kuitenkaan ollut kovin robusti kun henkilö liikkui tai valaistusolosuhteet muuttuvat. Huomattavasti paremmat tulokset saavutti Lien piilotettuihin Markov malleihin (HMM) perustuvassa tunnistimessaan (Lien 1998) Tässä piirreirrotukseen käytettiin useampaa menetelmää mm. jäykän kappaleen (kallon) liikkeen tunnistusta, gradienttianalyysia (poimujen ja ryppyjen havaitsemiseksi), muodon normalisointia jne. Piirreirrotuksen tulokset johdettiin vektorikvanttisoijaan (eräänlaiseen koodikirjaan), jonka tulokset tunnistettiin HMM luokittimella ja muodostettiin ns. maksimum likelihood estimaatit. Nämä estimaatit yhdistettynä intensiteetti estimointiin antoivat tuloksenaan diskreetin luokitellun tunne termin. HAL tunnisti astronautti Dave Bowmannin kiihtymyksen äänitiedon perusteella. Äänen pohjautuva tunteiden tunnistus on ollut kiivaan tutkimuksen kohteena ja tulokset ovat olleet melko lupaavia. Erilaisia hermoverkkoihin ja Markov malleihin perustuvia luokittimia on demonstroitu. Menettelyt pohjautuvat hyvin pitkälle spektrogrammeihin eli äänen eri taajuus- komponenttien intensiteetin vaihteluihin ajan mukaan. Merkitseviä tekijöitä ovat äänen perustaajuuden ja resonanssitaajuuksien (formattien) ajalliset vaihtelut kuten myös puheessa esiintyvät tauot. Petrushin on laatinut koejärjestelyn, jossa eri tunnevoimaisesti lausuttiin koelauseita.(Petrushin) Inhimillinen tarkkailujoukko pyrki luokittelemaan nämä tiettyihin tunneluokkiin. Analysoimalla eri luokkiin kuuluvia lausuntojen ajallisesti muuttuvaa spektraalista jakaumaa muodostettiin opetusdata eri tyyppisille hahmontunnistimille (HMM, hermoverkko jne.). Hän raportoi saavutetun 60 - 70 % tunnistustarkkuuden (paitsi surulle, jonka sekä koneellinen tunnistin että tarkkailujoukko helposti sekoittivat pelkoon). HAL käytti tunteiden tunnistamiseen sekä auraalista että visuaalista informaatiota siltä ilmeisesti puuttui koskettava anturointi. Suurin osa ihmisistä käyttää nykyään tietokonetta koskettamalla fyysisesti joko näppäimistöä tai hiirtä (onkin todettu, että modernilla ihmisellä on intensiivimpi fyysinen kontakti tietokoneeseen kuin lähimmäiseen). Voidaanko fysikaalista mittausta käyttää tunteiden ja stressin mittaamiseen? Voidaan. Healy väitöskirjassaan laati mittausmenettelyn, jossa mitattiin ihon sähkönjohtokykyä, sydämen lyöntitiheyttä ja veripulssien intensiteettiä, hengitystiheyttä ja lihasten aktivointia (Healey 2000) Anturointi johdettiin opetettuun HMM luokittimeen ja pyrittiin tunnistamaan neutraalia tunnetta, suuttumusta, vihaa, murhetta, veljellistä rakkautta, seksuaalista himoa, iloa ja kunnioitusta. Hän raportoi saavuttaneensa 81 % henkilökontekstista riippuvan tunnistustarkkuuden.. Koneen reagoinnista Jos koneemme pystyisi tunnistamaan käyttäjän tunteet, turhautuneisuuden ja stressin asteen miten sen pitäisi reagoida? Kun koneeni tilttailee tai esittää iänikuista "Unrecognized command" tai "Error 60" -promptiaan, pitäisikö sen kehottaa ottamaan rahoittavia, istumaan alas ja harkitsemaan tilannetta viileästi? Tuskin. Vaikka kysymys onkin perusluonteeltaan psykologinen eikä tekninen niin se lienee tärkeä. Koneet, jotka pystyvät havaitsemaan käyttäjän tyytymättömyyden tai tyytyväisyyden, voivat yrittää kokeilla eri vaihtoehtoja nähdäkseen mikä lopulta tuottaa soveliaimman vasteen. Edelleen tämä tulos voidaan johtaa adaptiiviseen oppimisrutiiniin ja näin parantaa koneen tulevaa mielekästä vasteisuutta. Toiseksi kone voi mukauttaa toimintaansa, erillisten inter- aktiivisten visuaalisten agenttien avulla käyttäjän mielentilan ja aikaisemman kokemuksen perusteella tilanteeseen sopivammaksi. Esimerkiksi auton ohjausjärjestelmä voi mukauttaa kiihtyvyys- ja nopeusparametrit sen mukaan kuinka kiihtynyt käyttäjä on. Kolmanneksi turhautuneisuutta tunnistava adaptiivinen järjestelmä voi mukauttaa informaation haun ja esittämisen käyttäjälle sopivammaksi, sellaisissa tilanteissa missä informaatio on joko moniselitteinen tai johtaa joko lisääntyvään turhautuneisuuteen tai seuraukset ovat ennustamattomia. Tunteiden synteesi Koska koneemme pystyvät ainakin jossain määrin tunnistamaan tiettyjä luokiteltuja tunteita edellä mainituin menetelmin, nousee helposti esiin kysymys voivatko koneet myös syntetisoida tunteita. Erityisen mielenkiinnon kohteena on ollut erilliset älykkäät ja yhteistoi- minnalliset agentit, joita voidaan soveltaa mm. tietokoneavusteisessa opetuksessa, suunnittelussa (sanan planning merkityksessä) ja jopa robottien ohjauksessa. Erilaisista kognitiivisista malleista valitettavasti vain muutama soveltuu hyvin tietokonepohjaiseen, algoritmiseen tunteiden synteesiin. Kirjallisuudessa esiintyneistä malleista Orhonyn, Cloren ja Collinsin esittämä OCC malli on saavuttanut lähes de facto aseman (Picard 1997). Alun perin Ortonyn, Cloren ja Collinsin laatima teoria oli tarkoitettu tekoälysovelluksissa esiintyvien päättelysääntöjen formulointiin (Orhony 1988) Heidän mielestään ei ole kovin olennaista onko koneilla tunteita sen sijaan olennaista on että tekoälyjärjestelmät pystyvät käsittelemään säännöstöillään erilaisia tunteita erityisesti sellaisissa sovelluksissa kuten luonnollisen kielen pragmaattisessa sisällön ymmärtämisessä, yhteistoiminnallisissa ongelmanratkaisu tilanteissa ja suunnittelutehtävissä. OCC mallissa tunteita ei esitetä käyttämällä joukkoa (atomistisia) perustunteita vaan ryhmittelemällä tunteet erilaisin kognitiivisin esiintymisehdoin. Erityisesti siinä oletetaan tunteiden syntyvän subjektiivisesti (positiivisesti tai negatiivisesti) arvioitujen tiettyihin tilanteisiin liittyvien reagointien tuloksena. Näitä tilanteita heidän mallissaan ovat tapahtumat, agentit ja objektit. Tällaisella arkkitehtuurilla Orhony Clore ja Collins tunnistivat 22 erilaista tunnetta ryhmiteltynä tunnetyypin mukaan. OCC mallissa tunteiden synteesi tietokoneella on suhteellisen helppoa. Tarkastellaan esimerkiksi miten ilo generoidaan mallissa.
|
||||||||||||||||||||||||||||||