SkillAgentSearch skills...

Aura

Suomalaisen avoimen datan discovery- ja ymmärryspalvelu — MCP-server tekoälyille, avoin web-palvelu ihmisille

Install / Use

/learn @trotor/Aura

README

Aura

Suomalaisen avoimen datan discovery- ja ymmärryspalvelu

Dokumentaatio · What's New · Datasettikatalogi · Dataformaatit · Datalähteet

7 200+ datasettiä · 17 000+ resurssia · 370+ organisaatiota · ~2 TB avointa dataa

30 datalähteestä: avoindata.fi, SYKE, HRI, Tilastokeskus, LUKE, Digitraffic, Digitransit, Finap/NAP, FMI, Paikkatietoikkuna, Suomi.fi-koodistot, Overture Maps, GTK, Traficom, Metsäkeskus, MML, Väylävirasto, Valtiokonttori, Ruokavirasto, THL Sotkanet, STUK, LIPAS, PaItuli, Vaalirahoitusvalvonta, Lajitietokeskus, Kuntien paikkatiedot (36 kuntaa) ym.

Aura kyntää suomalaisen avoimen datan esiin piilostaan ja tekee sen ymmärrettäväksi. Palvelu toimii MCP-serverinä tekoälyille sekä avoimena web-palveluna ihmisille.

Aura — kyntöaura kääntää maan pintaan piiloutuneen esiin. Aura on myös valon kehä auringon tai kuun ympärillä — hohde joka tekee näkyväksi sen mikä muuten jää piiloon. Samalla tavalla tämä työkalu tuo esiin Suomen avoimen datan ja antaa sille näkyvyyden.

Mitä Aura tekee?

  • Aggregoi metadatan 30 avoimen datan lähteestä
  • Normalisoi CKAN, PxWeb, OData, WFS, OpenAPI ja GTFS -formaatit yhtenäiseen muotoon
  • Tekee hakukelpoiseksi — FTS5-täystekstihaku luonnollisella kielellä
  • Arvioi datakoon — jokaiselle datasetille arvioitu koko
  • Laatupisteyttää — automaattinen laadun arviointi neljällä dimensiolla
  • Rikastaa joukkoistamalla — MCP-sessiot kerryttävät tietoa dataseteistä
  • Tunnistaa skeemoja — päättelee kenttänimet ja tyypit esikatselusta
  • Palvelee tekoälyjä MCP-serverin kautta (Claude, GPT, jne.)
  • Mahdollistaa reaaliaikakyselyt — agentti voi hakea dataa suoraan rajapinnoista (Digitraffic, PxWeb, WFS, OData ym.)

Vaatimukset

  • Python 3.11+ — tarkista: python3 --version
  • pip tai uv pakettien asennukseen
  • git repon kloonaamiseen

SQLite tulee Python 3.11:n mukana (FTS5-tuki sisäänrakennettu). Erillistä SQLite-asennusta ei tarvita.

Valinnainen:

  • MML API-avain — Maanmittauslaitoksen aineistoihin (ks. Rajausaineistot)

Käyttöönotto

Claude Code (toimii sellaisenaan)

Auran repo sisältää .mcp.json-tiedoston, joka konfiguroi MCP-serverin automaattisesti. Ei tarvitse tehdä mitään ylimääräistä:

git clone https://github.com/trotor/aura.git
cd aura
python3 -m venv .venv
source .venv/bin/activate
pip install -e .

claude   # Aura MCP-server käynnistyy automaattisesti

Claude Code tunnistaa .mcp.json:n ja käynnistää serverin taustalle. Voit heti kysyä: "Mitä avoimia datasettejä Helsingin kaupunki tarjoaa?"

Claude Desktop

Lisää Auran MCP-server Clauden asetustiedostoon:

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "aura": {
      "command": "/polku/aura/.venv/bin/python",
      "args": ["-m", "aura.cli", "serve"]
    }
  }
}

Korvaa /polku/aura kloonatun repon absoluuttisella polulla. Käytä virtuaaliympäristön Pythonia (.venv/bin/python).

Cursor

Lisää .cursor/mcp.json projektin juureen tai globaalisti ~/.cursor/mcp.json:

{
  "mcpServers": {
    "aura": {
      "command": "/polku/aura/.venv/bin/python",
      "args": ["-m", "aura.cli", "serve"]
    }
  }
}

Windsurf

Lisää ~/.codeium/windsurf/mcp_config.json:

{
  "mcpServers": {
    "aura": {
      "command": "/polku/aura/.venv/bin/python",
      "args": ["-m", "aura.cli", "serve"]
    }
  }
}

Muu MCP-yhteensopiva työkalu

Aura on standardi MCP-server. Mikä tahansa työkalu joka tukee MCP-protokollaa voi käyttää Auraa. Käynnistyskomento:

/polku/aura/.venv/bin/python -m aura.cli serve

Tai uv:llä ilman erillistä asennusta:

uv --directory /polku/aura run aura serve

Komentorivityökalu

source .venv/bin/activate

# Hae datasettejä
aura search "väestö helsinki"
aura search "joukkoliikenne"

# Tilastot ja lähteet
aura stats
aura sources

# Päivitä data
aura harvest              # kaikki lähteet
aura harvest avoindata.fi  # yksittäinen lähde
aura harvest --list        # listaa saatavilla olevat
aura refresh              # harvest + laatupisteet + health + skeema
aura infer-schemas        # päättele kenttätyypit esikatselusta

# Rikastukset
aura export-enrichments -o contributions/omat.json
aura import-enrichments contributions/*.json

Huom: Tietokanta (data/aura.db) tulee repon mukana valmiina — ei tarvitse harvestoida erikseen.

MCP-työkalut

Haku ja selaus:

| Työkalu | Kuvaus | |---------|--------| | search | Hae datasettejä luonnollisella kielellä (suodattimet: lähde, formaatti, organisaatio, saatavuus, alue) | | search_structured | Hae datasettejä ja palauta JSON tekoälyagenteille | | search_by_region | Hae alueellisesti (kunta, maakunta, postinumero) | | describe | Kuvaa datasetti yksityiskohtaisesti (sis. skeema, laatu, rikastukset) | | query_data | Esikatsele tai kyselöi datasetin sisältöä (CSV, JSON, PxWeb, WFS, OData) | | recommend | Suosittele parhaita datasettejä aiheesta | | compare | Vertaile datasettejä rinnakkain (2–5 kpl) | | find_related | Etsi samankaltaiset datasetit | | suggest_questions | Ehdota esimerkkikysymyksiä teemoittain ja alueittain |

Alueanalyysi:

| Työkalu | Kuvaus | |---------|--------| | area_profile | Alueprofiili: datasetit, laatu, puutteet | | compare_municipalities | Vertaile kuntien datatarjontaa rinnakkain (2–5 kpl) | | lookup_municipality | Hae kuntatiedot nimellä, koodilla tai postinumerolla |

Laatu:

| Työkalu | Kuvaus | |---------|--------| | quality_report | Datasetin laatupisteet dimensioittain | | quality_overview | Yhteenveto laatupisteistä | | quality_ranking | Parhaiten pisteytetyt datasetit | | quality_gaps | Metatiedon puutteet ja parannusehdotukset |

Rikastus ja tutkimus:

| Työkalu | Kuvaus | |---------|--------| | enrich | Rikasta datasetin tietoja (avainsanat, kuvaukset, laatuhuomiot) | | batch_enrich | Tallenna useita rikastuksia kerralla | | get_enrichments_tool | Näytä datasetin rikastukset | | suggest_yso_tags | Ehdota YSO-ontologian avainsanoja | | log_finding | Kirjaa löydös tutkimuksen aikana | | list_findings | Näytä session löydökset | | save_session_findings | Tallenna löydökset enrichmenteiksi |

Hallinta:

| Työkalu | Kuvaus | |---------|--------| | stats | Näytä tilastot tietokannasta | | list_organizations | Listaa datan julkaisijat | | list_formats | Listaa saatavilla olevat dataformaatit | | harvest | Hae datasettien metatiedot lähteistä | | list_sources | Listaa datalähteet ja harvestoinnin tila | | probe_sizes | Mittaa paikkatietoaineistojen koot | | health_check | Tarkista resurssien saatavuus (HTTP) | | health_report | Saatavuusraportti aiempien tarkistusten perusteella | | reference_status | Viiteaineistojen tila | | populate_reference | Lataa viiteaineistot kantaan |

Rajapintojen suora käyttö agentissa

Aura ei ole pelkkä hakemisto — tekoälyagentti voi hakea dataa suoraan rajapinnoista käyttäjän puolesta. Kun käyttäjä kysyy esimerkiksi junan aikataulua, agentti etsii Aurasta oikean rajapinnan ja kyselee sitä reaaliajassa.

Esimerkkejä

Junaliikenne:

"Moneltako IC147 saapuu Kuopioon tänään?"

Agentti etsii Aurasta Digitraffic rata-API:n ja hakee aikataulun: rata.digitraffic.fi/api/v1/trains/2026-03-30/147

Tilastot:

"Mikä on Tampereen väkiluku?"

Agentti löytää Tilastokeskuksen PxWeb-taulun ja kyselee sen query_data-työkalulla.

Sää:

"Mikä on lämpötila Helsingissä?"

Agentti hakee Ilmatieteen laitoksen WFS-rajapinnasta reaaliaikahavainnon.

Tuetut rajapintatyypit

| Rajapinta | Suora kysely | Esimerkkilähde | |-----------|-------------|----------------| | REST/JSON | query_data tai suora HTTP | Digitraffic (tie, rata, meri), Sotkanet | | PxWeb | query_data (suodattimet) | Tilastokeskus, LUKE | | WFS | query_data (bbox, tyyppi) | FMI, SYKE, MML, Väylävirasto | | OData v4 | query_data (filter) | Traficom | | CSV | query_data (rivit) | avoindata.fi, HRI | | GTFS | GTFS-tiedostojen URL:t | Digitransit (32 operaattoria) | | GraphQL | Vaatii rekisteröitymisen | Digitransit Routing API |

Huom: Osa rajapinnoista (Digitransit GraphQL, MML OGC API) vaatii API-avaimen. Agentti ohjaa rekisteröitymiseen tarvittaessa.

Datalähteet

Katso täydellinen datasettikatalogi: docs/CATALOG.md Katso lähteiden tekniset tiedot: docs/SOURCES.md Katso tuetut dataformaatit: docs/formats.md

| Lähde | Tyyppi | Datasettejä | Arvioitu koko | |-------|--------|-------------|---------------| | avoindata.fi | CKAN API | 1 738 | 102 GB | | Tilastokeskus | PxWeb API | 1 524 | 7,1 GB | | Paikkatietoikkuna | Oskari API | 689 | — | | LUKE | PxWeb API | 662 | 3,1 GB | | SYKE | CKAN API | 614 | 18 GB | | HRI (hri.fi) | CKAN API | 549 | 39 GB | | Suomi.fi-koodistot | REST API | 511 | — | | Digitraffic | REST/OpenAPI | 162 | 1,5 GB | | Ilmatieteen laitos | WFS 2.0 | 160 | 14 GB | | Digitransit | GTFS/GraphQL | 40 | — | | LUKE avoin tutkimusdata | CKAN | 124 | 2,1 GB | | Valtiokonttori | REST API | 48 | — | | Metsäkeskus | WFS/WCS/ZIP | 43 | 1,2 TB | | Kuntien paikkatiedot (36 kuntaa) | WMS/WFS/ArcGIS | 36 | 57 GB | | Ruokavirasto | INSPIRE/GeoServer | 33

Related Skills

View on GitHub
GitHub Stars5
CategoryDevelopment
Updated9d ago
Forks2

Languages

Python

Security Score

90/100

Audited on Mar 30, 2026

No findings