Big dataa ja vääriä tulkintoja

25.11.2019

Näyttökertoja 989

Kirjoittanut: Konsta Linkola - tiimistä Eventa.

Esseen tyyppi: Yksilöessee / 2 esseepistettä.

Esseen arvioitu lukuaika on 4 minuuttia.

Puhutaan, että datasta on tullut aikamme yksi tärkeimmistä varallisuuden ja vallankäytön muodoista. Uusia liiketoimintoja syntyy viikoittain, jossa tarkoituksena ei ole kuin kerätä dataa ja myydä sitä eteenpäin. Dataa kerätään kaikista yhteiskunnan ja liiketoiminnan osa-alueista, varsinkin kuluttajien käyttäytymisestä. Sitä tarvitaan, kun kehitetään uusia teknologioita, markkinoidaan tuotteita tarkemmin valituille kohderyhmille tai kun ratkaistaan ongelmia, jotka vaativat paljon informaatioita.

Data on kuitenkin vain informaatiota, ja sitä syntyy ja kerätään muutenkin kuin sähköisesti. Kuuntelemalla tiimikaveriasi kokouksessa keräät dataa hänestä. Flirttailemalla nätin pojan tai tytön kanssa keräät dataa hänestä.

Datalle ominaista on, että se kerätään aina käyttäen tarkkaan määriteltyjä mittareita, ja siitä on hyötyä vain, jos dataa osataan tulkita oikein, ja asettaa ratkaistava kysymys oikein. Kun dataa on valtavasti saatavilla ja sitä kerätään kaikkialla, on olemassa riski, että sitä tulkitaan väärin.

Annan kolme esimerkkiä:

Slushin tuotekehittelijöille suunnatussa sivutapahtumassa Ready to Launchissa 20.11.2019 puhui Spotifyn tuotekehityksen päällikkö Gustav Söderström. Spotify on yksi tämän hetken suosituimmista musiikin ja podcastien kulutuskanavista, jota käyttää jopa 248 miljoonaa käyttäjää joka kuukausi. Dataa syntyy kaikesta, mitä sovelluksessa teet: mitä kuuntelet, milloin, kuinka kauan, milloin vaihdat genreä, mitä teet iltaisin ja muuta mielenkiintoista. Tätä dataa Söderström pyrkii hyödyntämään paremman palvelun kehittämiseksi. Sisältöjen suosittelu on tärkeä osa älykkäitä palveluita.Spotifyllä on huomattu, että ihmiset ovat kehnoja löytämään uusia sisältöjä, joita kuunnella, jolloin syntyy vaara, että he kyllästyvät ja lopettavat palvelun käytön. Siispä heille suositellaan henkilökohtaisesti uutta sisältöä sen perusteella, dataa heistä on kerätty. Jos kuuntelet paljon 80-luvun diskoa, sinulle on loogista suositella juuri sitä.Suosittelu on kuitenkin vaikeaa. Söderström vertasi musiikin suosittelua automaattisiin ajoneuvoihin. Ollessasi automaattisen auton kyydissä, haluat auton tekevät ennakoitavia ja säännönmukaisia valintoja: pysähdytään punaisiin valoihin, käännytään vasemmalle, jos on ryhmitytty vasemmalle kaistalle, väistetään jalankulkijaa. Musiikki kuitenkin toimii eri lailla. Jos kuuntelet diskoa liian kauan, kyllästyt. Vaikka siis haluat kuulla lisää diskoa, jossain vaiheessa et haluakkaan. Tämän takia Spotify tutkii syitä ja merkityksiä datan takana. Miksi kuuntelet diskoa juuri tuohon aikaan päivästä ja milloin kyllästyt. Uutena ominaisuutena he ovat kehittäneet keskeytysominaisuuden, joka keskeyttää diskon suosittelun, ja suosittelee sen sijasta jotain ihan muuta, jotta et kyllästy palveluun. Jonkun toisen Spotify käyttäjän data voi näyttää, että hän kuuntelee paljon pianomusiikkia. Tarkoittaako se, että hän pitää siitä, ja hänelle kannattaa suositella lisää sitä? Ei välttämättä. Voihan olla, että hän soittaa pianokappaleita vauvalleen rauhoittaessaan tätä tai lapsilleen, kun he opiskelevat.

Kasvonilmeemme syntyvät lukuisten lihasten yhteisvaikutuksesta. Tieteellisen tutkimuksen ja sitä hyödyntävien laitosten, esimerkiksi oikeuslaitos ja kasvontunnistuspalvelut, avuksi on kehitetty järjestelmä, jossa kaikki kasvon lihakset ja niiden liikkeet on koodattu. FACS:in (Facial Action Coding System) avulla voidaan tunnistaa ja eritellä tarkkaan eri ilmeet ja niiden vaatimat lihakset. Tämä perustuu siihen ajatukseen, että ymmärrämme kaikki toistemme kasvonilmeet samalla lailla. Kun nostat suunpieliäsi ja poskipäitäsi, näyttää siltä, että hymyilet (koodi 6+12) ja tulkitsen, että olet iloinen. Kuulostaa järjettömän yksinkertaiselta ja turhalta, vai mitä?Papua-Uusi Guinealla on kuitenkin saari nimeltä Trobriandsaaret, ja siellä asuu yksi maailman vielä hyvin eristyksissä olevista alkuperäisheimoista, Trobriandit. Eräässä kulttuuriantropologien tekemässä tutkimuksessa tutkittiin, tulkitaanko nämä kasvonilmeet universaalisti samoin. Tutkimuksessa näytettiin ensin sarja kuvia, joissa ihmisillä oli erilaisia ilmeitä, Madridilaisille ala-astelaisille. Lapset tunnistivat tutut ilmeet helposti. Ilo, viha, yllätys, pelko ja monet muut tunteet ja niitä esittävät ilmeet ovat meille kaikille tuttuja. Vaan ei Trobriandeille. Näytettäessään heimolaisille kuvaa, jonka Madridilaiset lapset kaikki tunnistivat vihaiseksi ihmiseksi, tulkitsivat heimolaiset kuvan näin: 20% onnellinen, 17% surullinen, 30% pelokas, 20% kokee vastenmielisyyttä ja 6% muita tunteita. Vain 7% heimolaisista tulkitsi ilmeen vihaiseksi. Sama ilmeni muissakin ilmeissä. Se, mikä meille näytti pelokkaalta ihmiseltä, näytti Trobrianditelle pelottavalta ihmiseltä.Trobriandit ovat tietysti olleet kauan eristyksissä meidän kulttuurivaikutteilta, jotka ovat muovanneet meidän käsitystä ilmeiden tarkoituksesta. Heidän geeniperimänsä on kuitenkin lähes identtinen meihin, eikä tulkintojen ero tutkimuksen mukaan voinut johtua siitä. Sama ilmiö on todettu muillakin eristyksessä olevilla heimoilla, ja historioitsijat aavistelevat ilmiön todennäköisyyttä myös historiallisesti kaukaisilla kulttuureilla.
Tulkitsemme toisia ihmisiä joka päivä heidän kasvoistaan, ja olemme luoneet sille jopa systemaattisen järjestelmän, jonka on tarkoitus auttaa mm. oikeuslaitosta, vaikka ilmeisesti ilmeet eivät näytä kertovan paljoa meidän sielunelämästä.
Tekoälyn tutkimus ja kehitys on edennyt jo melko pitkälle. Itseasiassa jo vuosia on puhuttu, että läpimurto on aivan kulman takana. Silti tutkijat löytävät koko ajan uusia ongelmia ja haasteita, kun ihmisen aivoista pyritään tekemään digitaalista kopiota. TED Talkissaan tutkija Janelle Shane kertoo miksi. On käynyt ilmi, että aivomme ovatkin yllättävän monimutkaiset, ja tekevät tulkintoja ja päätelmiä maailmasta nojaten todella pitkään evolutiiviseen historiaan ja kulttuuriseen kontekstiin. Kun pitää liikkua paikasta A paikkaan B, toimimme me tiedostettujen rajojen puitteissa: fysiikka, laki, teknologia ja moraali. Nämä ovat kaikki pitkän evolutiivisen prosessin kautta viimeisteltyjä kokonaisuuksia.Tekoäly toimii massadatalla, josta se etsii loogisia tekijöitä ja eroavaisuuksia. Sille pitää siis syöttää dataa, jonka avulla se ratkaisee sille annetun tehtävän. Voimme antaa tekoälylle tehtävän kulkea paikasta A paikkaan B ja se suorittaa sen kyllä, mutta tavalla josta ei ole meille mitään hyötyä. Se ei ymmärrä reaalimaailmaa, sen monimutkaisuutta ja rajoitteita eikä meillä jo olevia mahdollisuuksia ja työkaluja, ellei niitä kerrota sille. Sen pitää siis oppia kaikki maailmasta, ennen kuin se voi suoriutua tehtävästä niin, että siitä on meille hyötyä. Suosittelen katsomaan Shanen videon, koska hänellä on tapauksesta hyviä esimerkkejä.

Myös Mikko Hyppönen puhui Slushissa tekoälystä. Hyppönen on kokenut tietoturvan asiantuntija, ja kertoi, miten tekoälyä voi huijata. F-Secure hyödyntää jo nyt tekoälyä tietoturvapalveluidensa kehittämiseen, ja on siinä yksi maailman parhaita. Koska tekoäly toimii massadatalla, josta etsitään poikkeavuuksia, voi sitä häiritä syöttämällä sille väärää ja huonolaatuista dataa. Se antaa tekoälylle väärän kuvan maailmasta ja siitä ongelmasta, mikä koneelle on annettu ratkaistavaksi. Se tulkitsee, että haluat kuunnella pianomusiikkia, vaikket halua. Se tulkitsee, että olet vihainen ja uhka, vaikka et ole.

Näitä kaikkia esimerkkejä yhdistää niiden uniikki konteksti. Data on vain dataa, ja sitä voidaan tulkita väärin, koska se ei kerro koko totuutta. Tämä pätee kaikkeen dataan niin yritystoiminnassa kuin henkilökohtaisessa kommunikaatiossa. Viestintä Whatsappissa on kauheaa, koska saat niin vähän dataa keskustelukumppanistasi, ja haluat kuitenkin tehdä monimutkaisia tulkintoja siitä tiedosta mitä saat. Mitä tuo hymiö tarkoittaa ja miksi hän laittoi tuohon pisteen ja tuohon huutomerkin.

Datan lisääntyessä maailmassa ja yhteiskunnan muuttuessa kompleksisemmaksi tulee meidän varoa omia tulkintojamme ja johtopäätöksiämme, koska ne riippuvat aina siitä datasta, jonka keräämme ympäriltämme. Kysy siis aina itseltäsi, mittaanko oikeaa tekijää ja etsinkö vastausta oikeaan ongelmaan.

Lähteet:

Crivelli, C., Russell, J. A., Jarillo, S., & Fernández-Dols, J. M. 2016. The fear gasping face as a threat display in a Melanesian society. Proceedings of the National Academy of Sciences of the United States of America. Saatavilla sähköisesti: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5098662/

Gladwell, M. 2019. Talking to Strangers. Allen Lane

Hyppönen, M. F-Secure. 2019. Why AI will be inhuman. Key note presentaatio. Slush 21.11.2019. Helsinki

Shane, J. 2019. The danger of AI is weirder than you think. TED. Saatavilla sähköisesti: https://www.youtube.com/watch?v=OhCzX0iLnOc

Söderström, G. Spotify. 2019. Product strategy in the age of artificial intelligence and machine learning. Key note presentaatio. Slush 20.11.2019. Helsinki

Wikipedia. Facial Action Coding System. Luettu 25.11.2019. https://en.wikipedia.org/wiki/Facial_Action_Coding_System

Aihetunnisteet:

Proakatemian esseepankki

Big dataa ja vääriä tulkintoja

Tunnetilasi esseen jälkeen

Konsta Linkola

Kommentoi cancel reply

Proakatemian esseepankki

Big dataa ja vääriä tulkintoja

Tunnetilasi esseen jälkeen

Konsta Linkola

Kommentoi cancel reply

Related Posts

Teknologian vaikutus työelämässä tulevaisuudessa

Digitaalinen markkinointi nyt ja tulevaisuudessa