
Kulissien takana: Microsoft Fabricin toimitusmallit tutuiksi
The progress of Microsft Fabric’s deployment features might not have been as rapid as many of us hoped, but it is getting closer and closer to a well-working enterprise-grade setup.
The progress of Microsft Fabric’s deployment features might not have been as rapid as many of us hoped, but it is getting closer and closer to a well-working enterprise-grade setup.
Monilla aloilla, meidän data-alamme mukaan lukien, uusia ideoita, malleja ja ratkaisuja syntyy huimaa tahtia. On motivoivaa toimia alalla, joka kehittyy jatkuvasti ja tarjoaa uusia mahdollisuuksia ja haasteita. Uusien mallien seassa navigoidessa on välillä hyvä pysähtyä palauttamaan mieleen myös perusasioita ja syitä käytettyihin ratkaisuihin. Menneisiin malleihin ei pidä jäädä jumiin, mutta on aivan yhtä tärkeätä muistaa mitä ongelmia pyrittiin ratkaisemaan ja mistä nämä haasteet syntyivät. Teknologian kehittyessä, täytyy välillä myös arvioida mitkä ongelmista perustuivat teknologisiin rajoitteisiin, ja ovatko ne edelleen olemassa.
Power BI:ssä, kuten aika monissa muissakin analytiikka välineissä, on aina ollut haasteita, kun siirrytään todella suuriin tietomääriin. Kuten nyt vaikkapa miljardin rivin taulun analysointi. Tällaiseen ongelmaan on pyritty yleensä vastaamaan tallentamalla osa tiedoista analytiikka työvälineen muistiin, jota yleensä on rajoitetusti, ja ohjaamalla sitten tarkennettuja kyselyitä tietokantaan. Vielä muutama vuosi takaperin, testaillessani miten Databricks suoriutuisi Power BI:n suorista kyselyistä, jouduin pettymään. Nopeus ei ihan ollut toiveiden mukaista. Ja tällaisen samanlaisen kommentin kuulin menneellä viikolla myös raportti kehittäjältä. Mutta tokihan nyt jonkin verran asian on täytynyt parantua parissa vuodessa?
Data Mesh on yksi data maailman kuumimmista termeistä. Blogi esittelee ideologian joitakin tiedon hallinnallisia käsitteitä, jotka soveltuvat hyödynnettäväksi myös Data Meshin ulkopuolella. Suuremmin teknologiaan pureutumatta, tutustu millaisiia haasteita Data Mesh pyrkii vastaamaan, ja millaisia käytännön keinoja niiden toteuttamiseksi voi soveltaa.
Keskustelu Azure Purviewin ympärillä käy kuumana ja aihe on monilla mielessä. Sen mahdollisuudet ja toiminnallisuudet vakioprosessien ulkopuolelta jäävät kuitenkin usein vähemmälle huomiolle. Blogissa esitellään käyttötapauksia, jotka vaativat Purviewin toiminnallisuuksien laajentamista, sekä millaisia vaihtoehtoja näiden toteuttamiseksi on olemassa.
Uusien datalähteiden aiheuttamat tiedon laadun ongelmat aiheuttavat uusia haasteita myös data-alustoille.
IoT-dataa, sosiaalisen median lähteitä sekä sanomapohjaisia datalähteitä yhdistää se, että monissa tapauksissa niiden käyttäytymistä ei tunneta ennakkoon.
Data Platform on datan keruuseen, tallentamiseen, jalostamiseen ja jakelemiseen keskittyvä järjestelmä.