maanantai 16. tammikuuta 2012

The Data Hub Suomi avoimelle datalle avattu

En lähde tässä syvällisesti pohtimaan avoimen datan yhteiskunnallisia jne. hyötyjä, koska näihin on jo nytkin netti pullollaan hyviä tietolähteitä. Sen sijaan otan konkreettisemman lähestymistavan ja kerron mitä on tehty että olemme saaneet Open Knowledge Suomi vetoisesti datakatalogin kaikkien vapaaseen ja avoimeen käyttöön.

Miksi?

Oma motivaationi projektiin lähti mahdollisuudesta tehdä oma osuuteni yhteiskunnallisesti ja kansainvälisesti merkittävässä ilmiössä. Lisäksi tarjota oma osaaminen ja kokemukseni hyvän asian puolesta. Koska olen yrittäjä niin luonnollisesti haluan olla myös mukana luomassa avoimen datan ympäristöä josta kaikki hyötyy ja jonka ympärille voi pitkässä juoksussa rakentaa tervettä ja toimivaa liiketoimintaa. Tiettävästi mitään suuria avoimen datan ympärille syntyneitä menestystarinoita ei vielä ole, joten esimerkkejä ja mahdollistajia kaivataan. Toivottavasti tämä datakatalogi projekti yhtenä konkreettisena mahdollistajana auttaa siihen että näitä menestystarinoita alkaa syntymään. Tämä on perusedelletys sille että myös yritykset pitkässä juoksussa sitoutuvat avoimen datan tarjoamiin mahdollisuuksiin sovelluskehittäjinä, datan avaajina, palveluntarjoajina jne. Ilokseni nämä tahot ilmoittautuivatkin heti julkaisemaan avaamiaan datojaan heti kun katalogi saadaan auki: Ambitigo Oy, Mustcode Oy, Floapps Oy, Finnkino Oy, Sanoma Oy, Verohallinto. Tämä on hyvä alku mutta esimerkkejä datan avaamiseen tarvitaan katalogiin paljon lisää. Toistaiseksi katalogi on on tyhjä mutta alta löytyvien ohjeiden kautta kaikki yo. tahot ja muutkin voivat alkaa julkaisemaan aineistojaan.

Mitä tehtiin?

Aloitin tutustumaan ja käyttämään nyt avatun http://fi.thedatahub.org pohjana käytettävään Open Knowledge Foundationin (www.okfn.org) kehittämää avoimen lähdekoodin CKAN ohjelmistoa noin 1,5 vuotta sitten. Kyseistä ohjelmistoa käytetään mm. Helsinki Region Infoshare http://www.hri.fi verkkopalvelun taustalla toimivana metatietokanta. Täältä listaa laajemmin maailmalta missä ohjelmistoa myös käytetään: http://wiki.ckan.org/Instances



Koska esimerkiksi HRI verkkopalvelu keskittyy pääasiallisesti pääkaupunkiseudun ja ympäristökuntien  julkisiin tietovarantoihin on pidempään ollut huutava tarve saada yleinen datakatalogi suomenlaajuisesti niin yritysten, yksityisten, yhteisöjen, oppilaitosten, kirjastojen, kuntien, virastojen jne. käyttöön. Pitkään mielessä ollut projekti sai lähtölaukauksen marraskuussa 2011 kun esittelin ajatuksen kauppakorkeakoululla pidettyssä Open Knowledge Finland tapaamisessa http://fi.okfn.org/2011/11/11/ok_suomi_meetup/

Projektin myötä syntyneet sivustot

Datakatalogi - http://fi.thedatahub.org 
- tämä on varsinainen datakatalogi

Datakatalogin tukisivusto yhteisön käyttöön  - https://github.com/okf-finland/CKAN-Finland/
- wikisivusto ohjeille, oppaille jne. tiedon jakoon
- tikettijärjestelmä fi.thedatahub.org kehitysideoiden, bugien jne. raportointiin
- versionhallinta lähdekoodiin

Kuka teki?

Niin tässä kuin muissakaan projekteissa ei mitään synny jos joku ei tee jotain. Koska tämän hankkeen tekemiseen ei ollut maksajaa enkä halunnut jäädä odottamaan sen ilmestymistä niin suurkiitos yrityksille joita ilman ei tämäkään katalogi olisi nähnyt päivänvaloa (ainakaan tässä muodossa ja näin nopealla aikataululla):

- Epte Oy www.epte.fi , konesali/sähköpostipalvelu
- Floapps Oy www.floapps.com , CKAN ohjelmiston asennus, GitHub pystytys
- Emobit Oy www.emobit.fi suomi-käännökset, OKF/CKAN projektinhallinta, ohjeistus

Kuka voi julkaista dataa ja miten se tapahtuu?

Datan osalta ei ole mitään rajoitteita. Lähtökohta on se että data on koneluettavassa muodossa, hyväksyy yleiset lisenssiehdot ja datan avaaja syöttää tiedot ja määrittää itse millä lisenssi se julkaistaan. Toistaiseksi myös itse data-aineistot pitää datan avaajan järjestää ladattavaksi jostain verkosta. Datakatalogiin ainoastaan linkataan mistä aineisto löytyy. Githubiin on luotu wiki-sivu jossa on ohjeet kuinka The Data Hub Suomi sivuston käytössä pääsee alkuun:

https://github.com/okf-finland/CKAN-Finland/wiki/Ohjeet-The-Data-Hub-Suomi

Ohjeita saa ja onkin toivottovaa täydentää/päivittää jos puutteita löytyy. Ohjeiden päivitys ei vaadi muuta kuin henkilökohtaisen GitHub käyttäjätilin luonnin.

Tämän lisäksi yleisiltä Githubin wiki-sivuilta löytyy mm. ohjesivuja palvelun ylläpitoon ja kuka/miten sitä ylläpidetään:
https://github.com/okf-finland/CKAN-Finland/wiki/_pages

Nyt vaan kaikki aktiivisesti dataa julkaisemaan ;-)





perjantai 13. tammikuuta 2012

Uusi vuosi ja uudet kujeet

Lyhyt talviloma lapissa antoi taas erinomaisen sykäyksen taas aktivoitua blogikirjoitteluun. Ulkoilu, hiihtäminen ja mökkeily lapin maisemissa on ehkä juuri sitä parasta mitä kiireen keskelle välillä todella kaipaa. Lapissa on kyllä sitä jotain, jota kai myös Lapin taiaksi kutsutaan.


Päätin jo viime vuoden puolella avata tämän kolmannen blogini, koska oli tarve saada pystyyn yleisempi ja vapaamuotoisempi eikä puhtaasti tiettyyn teemaan pureutuva, vaan laajemmin erilaisiin ilmiöihin, elämänalueisiin ja teknologioihin liittyvä blogi. Ensimmäisen syksyllä käynnistämäni blogi keskittyy tuottavuuteen http://projektikaaos.blogspot.com . Toinen avaamani blogi käsittelee henkilökohtaista robotiikkaa/tekoälyä ja näihin liittyviä tulevaisuuden teknologioita http://singulariteetti.blogspot.com .

Ensimmäiseksi aiheeksi tälle uunituoreelle blogille ei ollut vaikea valita avointa dataa, jonka parissa olen tehnyt töitä noin 1,5 vuotta ja sittemmin kiinnostuksen myötä olen teemaan keskittynyt myös enemmän harrastuspohjalta. Mikäli avoin data aiheena ei ole tuttu niin täällä mainio Antti Poikolan aiheesta tekemä esitys Slidesharessa. Ensimmäinen varsinainen kirjoitukseni tuleekin käsittelemään tämän teeman ympärillä marraskuun lopussa käynnistynyttä yhteisövetoista The Data Hub Suomi datakatalogi projektia, josta keräsin tuollaisen Google doc muotoisen projektidokumentin

Tämä datakatalogi-projekti on tarkoitus saada päätökseen ja julkaistua 16.1.2012, joten ainakin tämän osalta näyttää että maaliin päästään suunnitellusti tammikuun aikana. Sen jälkeen pallon voikin heittää aktiivisen avoimen datan yhteisön, kansalaisten, yritysten ja julkistahojen harteille. Sen verran paljon olen itse käyttänyt aikaa projektin eteenpäin viemiseen että ei voi muuta toivoa kuin että homma ottaisi laajemmin tuulta alleen. Vielä viikonloppuna vähän mm. ohjeiden kirjoittelua ja eiköhän sitten homma ole siinä.

Hyvää alkanutta Uutta Vuotta!