Kun prosessien automaatio ja tekoälyn onnistuminen lepää pitkälti datan laadun ja saatavuuden varassa, myös tiedonhallinnan tarve korostuu. Tuotteistustyössä selkeytetään sekä tiedon omistajuus, muoto, historia, rooli ja hallintatavat. Tässä artikkelissa kerromme, mitä datatuotteistus käytännössä tarkoittaa.
Mikä on moderni datatuote?
Moderni datatuote on huolella valittu, hallittu ja arvolähtöinen kokonaisuus, joka palvelee käyttäjäänsä riippumatta siitä, onko tämä ihminen, järjestelmä vai algoritmi. Se voi olla joko organisaation yhteistä näkemystä tukeva yleiskäyttöinen ydintietotuote (foundational data product) tai pitkälle jalostettu erityistuote, kuten vaikkapa asiakassegmentin ostokäyttäytymistä kuvaava tietojoukko markkina-analyysia varten.
Datan tarkastelu tuotteena kiinnittää siihen aina rajauksen tiettyyn käyttötarkoitukseen. Monitoiminen järjestelmä taas sisältää dataa useisiin tuotteisiin, joten sellaista järjestelmää ei itsessään voi kehittää yhtenä tuotteena. Datasta tulee tietoa, informaatiota, vasta, kun sillä on otsikko eli tässä tapauksessa datatuotteelle annetaan nimi.
Ilman tuotteistamista data jää helposti hajanaiseksi, vaikeasti löydettäväksi ja epäluotettavaksi. Tekoäly ja agentit vaativat datatuotteilta entistä terävämpää laatua. Tekoälyn dynaamisuus vaatii datalta entistä enemmän, tasaisempaa laatua sekä selkeitä kuvauksia: datatuotteen tekijän on mahdotonta arvata, mitä tiedonjyvästä tai niiden yhdistelmää agentti tuotteesta hakee. Myös ajantasaisuuden vaatimus korostuu, kun tiedot saattavat uida mihin tahansa käyttötilanteisiin siten, että ihmisen tekemä kognitiivinen varmistaminen saattaa jäädä hyvin kevyeksi.
Hyvällä datatuotteella on dokumentoitu, selkeä käyttötarkoitus, johdonmukainen rakenne sekä luotettava ja selkeästi ymmärrettävä liiketoiminnan kehittämiseen hyödyllinen sisältö. Sillä on myös nimetty omistaja, joka vastaa tuotteen sisällöstä, elinkaaresta ja siitä, että data on saatavilla oikeassa muodossa, oikeaan aikaan. Hyvin rakennettu datatuote on helppo löytää, ymmärtää ja käyttää ilman syvää teknistä osaamista. Se tarjoaa selkeät rajapinnat, määritellyt käyttötavat ja läpinäkyvät palvelulupaukset.
Datatuotteet rakentuvat muun datatyön varaan
Tuoteajattelu muistuttaa Data Mesh -ajatusmallista, jossa datan käyttötarkoitus korostuu, ja vastuu oikean datan keräämisestä ja hyödyntämisestä siirtyy keskitetystä IT-tiimistä sinne, missä data syntyy –liiketoimintaan. Tavoitteena on rakentaa dataa kuten mitä tahansa tuotetta: omistettuna, jatkuvasti ylläpidettynä, selkeästi kuvattuna ja arvoa tuottavana kokonaisuutena. Kuten muillakin tuotteilla, datatuotteella on versiot, tiekartta ja palautekanavat – ja sen tuottamaa arvoa mitataan.
Ideaalitilanteessa datatuotteita rakennetaan tilanteessa, jossa liiketoiminnan tärkein data on jo yhtenäistetty ydintietotyön yhteydessä. Ydintietotyö tunnetaan myös Master Data Managementina (MDM). Datatuotteiden jakeluun tarvitaan jonkinlainen jakelualusta. Usein tähän tarkoitukseen erikoistunut data-alusta on suositeltava ratkaisu. Kun tuotteet ovat valmiina, ne ovat luonnollisia jaeltavia: kerran kiteytetty tietojoukko on tarkoituksenmukaista tarjota myös sovellusten, raporttien ja tekoälyn käytön pohjaksi.
Organisaation tiedolla johtamisen kyvykkyys ei kuitenkaan koskaan rakennu täydellisessä järjestyksessä, vaan se on suunniteltava jo lähtökohtaisesti kehittyväksi. Tuoteajattelu auttaa datan käytettävyyden parantamisessa, vaikka ympäristö kehittyisikin vasta myöhemmin.
.png?width=1200&height=628&name=Untitled%20(2).png)
Datatuotteen kriteeristö kehittyy digitalisaation myötä
Viime vuosikymmenen aikana datatuotteeksi on helposti kutsuttu mitä tahansa vakiorakenteista raakadatajoukkoa. Samaan aikaan käyttökohteet ovat kuitenkin kehittyneet raportoinnista kohti prosessiautomaatiota ja tekoälyagentteja, jotka vaativat tuotteilta paljon enemmän.
Datatuotteita ei rakenneta vain ihmisille, vaan myös agenteille, automaatioille ja orkestrointikerroksille. Tämä asettaa selkeän vaatimuksen: datatuotteen täytyy olla kuvattu eikä ei saa vaatia piilotettua asiantuntemusta. Käsitemalli (ontologiat, taksonomiat) hallinnoidaan usein erillisessä kerroksessa, jotta useat datatuotteet voivat viitata yhteiseen käsitteistöön ja pysyä yhdenmukaisina.
Nykyaikaisen datatuotteen on oltava kontekstuaalinen, semanttisesti rikastettu ja liiketoimintasidonnainen. Kuten Gartner ja DAMA korostavat: datatuotteen ei tarvitse toimia täydellisenä prosessityökaluna, mutta sen on kyettävä tarjoamaan riittävästi liiketoimintakontekstia ja semanttisia viittauksia, jotta se toimii itsenäisesti ja saumattomasti eri käyttäjien ja agenttien kanssa. Ilman tällaista semanttista yhteyttä riski on "data silo 2.0" – tilanne, jossa jokainen datatuote kuvaa itseään eri tavoin eivätkä agentit pysty yhdistämään niitä automaattisesti.
Kulttuuri datatuotteen taustalla
Datatuotteiden toteuttaminen vaatii muutosta ajattelussa ja kulttuurissa. Oleellista on irtaantua IT:n keskushallinnosta, ja opetella rakentamaan datan laatua liiketoimintakeskeisesti ja ketterästi. Tämä vaatii sitä, että datan käytöstä ja laadusta osataan keskustella: tarvitaan yhteinen kieli tiedonhallinnan ympärille.
Data tarvitsee myös selkeitä omistajia. Domain-ajattelu auttaa tässä: esimerkiksi asiakasdatan omistajuus kuuluu liiketoimintayksikölle, joka tuntee asiakkaat parhaiten. Näin dataa kehitetään käyttäjän tarpeista käsin. Kestävyyden ja pitkän tähtäimen arvon varmistaa liiketoimintalähtöisyyden vastavoimana toimiva kurinalainen datan hallintamalli, jonka käytännöt asettavat laadun minimivaatimukset, selkeät vastuumallit ja jatkuvuuden.
Ilman selkeitä vastuita ja rakenteita syntyy helposti "nobody’s land" -dataa, jolla ei ole omistajaa, tarkoitusta tai laatutakuuta. Silloin dataa ei pystytä hyödyntämään liiketoiminnassa eikä tekoälyllä ole siihen mitään tarttumapintaa.
Muutoksen läpivientiin liittyy myös paljon viestintää ja yhteistyötä eri sidosryhmien kanssa organisaatiossa, jotta datatuotteet saadaan mahdollisimman laajalti hyötykäyttöön ja niitä myös ylläpidetään uusien vaatimusten noustessa. Tämänkin koordinoinnissa datan omistajalla on keskeinen rooli. Tietysti datan omistajien ei tarvitse yksin suoriutua muutoshallinnan tehtävistä vaan usein hänen tukenaan toimii enemmän keskitetty ”data office”, joka auttaa muutoksen läpiviennissä ja mahdollistaa sen datatuotteiden käytön turvallisesti, tehokkaasti ja liiketoimintaa tukien.
Datatuotteiden laatu on iso osa tekoälyvalmiutta
Tekoälyratkaisut eivät ole irrallisia projekteja, vaan ne sulautuvat osaksi älykästä liiketoimintaa. Moderni datatuote muodostaa tämän perustan.
Dataa voidaan syöttää tekoälyyn vain, jos se on löydettävissä, ymmärrettävissä ja luotettavaa. Siksi moderni datatuote tarjoaa kokonaisuuden, joka varmistaa nämä edellytykset. Yritysdatan ytimessä on kattava datakatalogi, joka dokumentoi mitä dataa on, missä se sijaitsee ja miten sitä voi käyttää. Lisäksi tarvitaan selkeä omistajuus, joka takaa datan laadun, jatkuvuuden ja kehittämisen. Lopulta jakelukyky varmistaa, että data liikkuu saumattomasti järjestelmien, agenttien ja yksiköiden välillä.
Olemme matkalla kohti maailmaa, jossa agenttitekoäly – on se sitten räätälöityä tai tuotepohjaista – kykenee datakatalogien ja prosessidokumenttien avulla navigoimaan liiketoiminnan viidakossa esimerkiksi etsiessään tehostamismahdollisuuksia, avustaessaan tilintarkastusta tai vaikka tunnistaessaan yksiköiden välisen yhteistyön kehittämiskohteita. Tällaiset laajat skenaariot vaativat datavarastojen kasvamista aidoiksi tietämysverkoiksi, mikä on vuosikymmenten prosessi.
Hyvin rakennettu datatuote on kuitenkin ensimmäinen askel tällä polulla. Jo tässä vaiheessa hyvä data mahdollistaa tekoälyn ja älykkään liiketoiminnan, jossa tekoäly ei ole irrallinen ratkaisu, vaan sulautuu saumattomasti osaksi arjen prosesseja. Seuraavissa kehitysaskelissa datatuotteiden väliset yhteydet vahvistuvat niin, että tekoälyn ote ulottuu yksittäisistä ongelmista kokonaisiin prosesseihin ja liiketoiminta-alueisiin. Juuri tästä syystä datatuotteet ovat tärkeä ensiaskel matkalla kohti yritystason tekoälyä.