Tiedon etsiminen ja yhteenvetäminen on muuttunut radikaalisti kevään 2025 aikana. Tässä artikkelissa avaamme Deep Research -agenttien toimintaa ja käyttökohteita.
Lähes kaikilla tekoälytoimijoilla on nykyisin tarjota jonkinlainen Deep Research -ratkaisu. Kyseessä on yleensä käyttöliittymässä oleva erillinen toiminto, jolla käyttäjä ilmaisee, että esitetty kysymys on sellainen, jonka vastausta järjestelmällä on lupa harkita pidempään - laatu ja kattavuus on nopeutta tärkeämpää.
Deep Research -vastaus on tyypillisesti sivuja pitkä essee, joka on lähdeviitteistetty huolellisesti. Valmistuminen kestää tyypillisesti useita minuutteja, mahdollisesti jopa puoli tuntia. Lähdeaineistona on joukko internet-hakuja, jotka agentti osaa itse valita ja suorittaa.
Mihin tutkimusagentit sopivat?
Deep research on parhaimmillaan tilanteissa, joissa internetistä löytyy aiheesta runsaasti aineistoa, jonka lukeminen ja yhteensaattaminen vie paljon aikaa. Ideaalisia käyttökohteita ovat esimerkiksi markkinatutkimus, ilmiöiden analysointi ja monialaisten uutisten tiivistäminen. Tässä esimerkkejä viimeaikaisista omista tutkimuskohteistani:
- Digital twins -teknologioiden kysyntä ja käyttökohteet valmistavassa teollisuudessa, onnistumiset ja epäonnistumiset eriteltynä
- Reaktiot USA:n AI Diffusion -sääntelykehikkoon EU:n alueella
- Model Context Protocol -standardin maturiteetti ja käyttöönoton aste
- Suomalaisten IT-talojen Microsoft Fabric -tarjooma
- Asiakkaamme digistrategian erottuvuus kilpailijoista
Tutkimusagentin käyttö on muuttanut radikaalisti omaa työtapaani. Työpäivääni kuuluu nykyisin usein se, että heti aamulla käynnistän muutaman Deep Research -työn, jotka valmistuvat päivän mittaan. Tutkimustehtävät määrittelen sen mukaan, mihin teemoihin joudun tänään paneutumaan. Palaverien väleissä yritän ehtiä lukemaan nämä valmiit briefit, jotta pystyisin osallistumaan itse kokoukseen valmistautuneena.
Miten tutkimusagentti toimii?
Deep Research on ehkä tämän päivän konkreettisin esimerkki agenttiratkaisusta. Agentilla tarkoitetaan sitä, että tekoälyratkaisu toimii pitkäjänteisesti ja osin itsenäisesti käyttäjän asettaman tavoitteen ratkaisemiseksi. Teknisesti ottaen kyse ei ole mistään uudesta "agenttimallista", vaan siitä, että mallien ympärillä pyörivä sovellus käyttää kielimalleja ja muita lähteitä tehtävän käsittelyyn. Arkkitehtuurisessa mielessä ratkaisussa on neljä olennaista innovaatiota:
Ensinnäkin, tutkimusagentti nojaa kielimallien päättelykykyyn (reasoning). Mallit ovat nykyisin jo melko kyvykkäitä purkamaan ongelman osiin ja päättelemään, mitä seuraavaksi kannattaisi tehdä - esimerkiksi "Mitä tietoa seuraavaksi hakisin?", "Miten voisin varmistaa tämän lähteen oikeellisuuden?" ja "Milloin tietoa on haettu tarpeeksi käyttäjän tarpeisiin?".
Toisekseen, agentin toiminta nojaa sille annettuihin työkaluihin. Tutkimusagenttien tapauksessa ylivoimaisesti tärkein työkalu on internet-hakukone ja kyky lukea verkkosivuja. Agenttien kehittyessä apuna käytetään myös enenevässä määrin matemaattisten pulmien ratkaisuun ja tiedon visualisointiin keskittyviä työkaluja. Tällä hetkellä tutkimusagenttien vastaukset ovat lähinnä tekstiä, mutta numeerisen datan käsittely ja visualisointi kehittyy jatkuvasti.
Kolmanneksi, toiminnan kannalta olennaista on muisti. Kuten moni on kielimalleja kokeillessaan todennut, liian pitkäksi kasvava prompti ei enää paranna laatua. Tehtävän palasteluun tarvitaan välivarastointia: Agentti poimii kustakin luetusta tietolähteestä olennaiset tiedonjyväset, varastoi ne muistiin, arvioi niiden perusteella tarvittavat seuraavat askeleet, ja lopulta tiivistää muistiin kerätyn tiedon raportiksi.
Neljänneksi, hallusinaatioiden ja tulkintavirheiden riski pienenee, kun aineistoa tarkastellaan useampaan kertaan. Tutkimusagentit toteuttavatkin tyypillisesti jonkinlaista maker/checker-toimintatapaa, jossa tekoäly toimii kahdessa roolissa: ensinnäkin tekijänä (tiedon jäsentäjänä), ja toisaalta varmistajana (oikeellisuuden analysoijana). Vaikka molemmat vaiheet tekisikin sama malli, vaikutus tiedon oikeellisuuteen on erittäin merkittävä.
Tutkimusagentit tulevat arkeemme
Tutkimusagenttien tarve on kiistaton. Ei ole epäilystäkään siitä, etteikö työelämässämme olisi yllin kyllin tilanteita, joissa on vertailtava ja analysoitava laajoja, mahdollisesti keskenään ristiriitaisia aineistoja. Tällä hetkellä esimerkiksi ChatGPT:n Deep Research helpottaa sellaista työtä merkittävästi - silloin kun tieto sattuu löytymään internetistä. Suuriin haasteisiin törmätään, kun tutkimuskohde sijaitseekin yrityksen sisäpuolella.
Esimerkiksi "Vertaile viime vuoden tuotekehityssuunnitelmaa ja tänä vuonna julkaistuja versioita, ja luettele poikkeamat" olisi hyvä esimerkki tutkimusagentille sopivasta tehtävästä, mutta tällä hetkellä mahdotonta. Tätä kirjoitettaessa tutkimusagentit eivät vielä kaivele organisaation sisäistä dataa. Tilanne on kuitenkin muuttumassa juuri julkaistun Microsoft 365:n Researcher-agentin myötä.
Valitusta työvälineestä riippumatta syvä ja analyyttinen tekoälypohjainen tiedonhaku on tulossa osaksi arkeamme. Meidän tehtävämme on tunnistaa ne tehtävät ja tilanteet, joissa voimme valmistautua tehtäviimme entistä paremmin keräämällä aineiston valmiiksi. Toivottavasti jonain päivänä sen tehtävän hoitaa kalenterini tunteva agentti, joka tarjoaisi joka aamu minulle selostuksen päivän työtehtävistä ja niihin tarvittavat taustatiedot.