Aura
Suomalaisen avoimen datan discovery- ja ymmärryspalvelu — MCP-server tekoälyille, avoin web-palvelu ihmisille
Install / Use
/learn @trotor/AuraQuality Score
Category
Development & EngineeringSupported Platforms
README
Aura
Suomalaisen avoimen datan discovery- ja ymmärryspalvelu
Dokumentaatio · What's New · Datasettikatalogi · Dataformaatit · Datalähteet
7 200+ datasettiä · 17 000+ resurssia · 370+ organisaatiota · ~2 TB avointa dataa
30 datalähteestä: avoindata.fi, SYKE, HRI, Tilastokeskus, LUKE, Digitraffic, Digitransit, Finap/NAP, FMI, Paikkatietoikkuna, Suomi.fi-koodistot, Overture Maps, GTK, Traficom, Metsäkeskus, MML, Väylävirasto, Valtiokonttori, Ruokavirasto, THL Sotkanet, STUK, LIPAS, PaItuli, Vaalirahoitusvalvonta, Lajitietokeskus, Kuntien paikkatiedot (36 kuntaa) ym.
Aura kyntää suomalaisen avoimen datan esiin piilostaan ja tekee sen ymmärrettäväksi. Palvelu toimii MCP-serverinä tekoälyille sekä avoimena web-palveluna ihmisille.
Aura — kyntöaura kääntää maan pintaan piiloutuneen esiin. Aura on myös valon kehä auringon tai kuun ympärillä — hohde joka tekee näkyväksi sen mikä muuten jää piiloon. Samalla tavalla tämä työkalu tuo esiin Suomen avoimen datan ja antaa sille näkyvyyden.
Mitä Aura tekee?
- Aggregoi metadatan 30 avoimen datan lähteestä
- Normalisoi CKAN, PxWeb, OData, WFS, OpenAPI ja GTFS -formaatit yhtenäiseen muotoon
- Tekee hakukelpoiseksi — FTS5-täystekstihaku luonnollisella kielellä
- Arvioi datakoon — jokaiselle datasetille arvioitu koko
- Laatupisteyttää — automaattinen laadun arviointi neljällä dimensiolla
- Rikastaa joukkoistamalla — MCP-sessiot kerryttävät tietoa dataseteistä
- Tunnistaa skeemoja — päättelee kenttänimet ja tyypit esikatselusta
- Palvelee tekoälyjä MCP-serverin kautta (Claude, GPT, jne.)
- Mahdollistaa reaaliaikakyselyt — agentti voi hakea dataa suoraan rajapinnoista (Digitraffic, PxWeb, WFS, OData ym.)
Vaatimukset
- Python 3.11+ — tarkista:
python3 --version - pip tai uv pakettien asennukseen
- git repon kloonaamiseen
SQLite tulee Python 3.11:n mukana (FTS5-tuki sisäänrakennettu). Erillistä SQLite-asennusta ei tarvita.
Valinnainen:
- MML API-avain — Maanmittauslaitoksen aineistoihin (ks. Rajausaineistot)
Käyttöönotto
Claude Code (toimii sellaisenaan)
Auran repo sisältää .mcp.json-tiedoston, joka konfiguroi MCP-serverin automaattisesti. Ei tarvitse tehdä mitään ylimääräistä:
git clone https://github.com/trotor/aura.git
cd aura
python3 -m venv .venv
source .venv/bin/activate
pip install -e .
claude # Aura MCP-server käynnistyy automaattisesti
Claude Code tunnistaa .mcp.json:n ja käynnistää serverin taustalle. Voit heti kysyä: "Mitä avoimia datasettejä Helsingin kaupunki tarjoaa?"
Claude Desktop
Lisää Auran MCP-server Clauden asetustiedostoon:
macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%\Claude\claude_desktop_config.json
{
"mcpServers": {
"aura": {
"command": "/polku/aura/.venv/bin/python",
"args": ["-m", "aura.cli", "serve"]
}
}
}
Korvaa
/polku/aurakloonatun repon absoluuttisella polulla. Käytä virtuaaliympäristön Pythonia (.venv/bin/python).
Cursor
Lisää .cursor/mcp.json projektin juureen tai globaalisti ~/.cursor/mcp.json:
{
"mcpServers": {
"aura": {
"command": "/polku/aura/.venv/bin/python",
"args": ["-m", "aura.cli", "serve"]
}
}
}
Windsurf
Lisää ~/.codeium/windsurf/mcp_config.json:
{
"mcpServers": {
"aura": {
"command": "/polku/aura/.venv/bin/python",
"args": ["-m", "aura.cli", "serve"]
}
}
}
Muu MCP-yhteensopiva työkalu
Aura on standardi MCP-server. Mikä tahansa työkalu joka tukee MCP-protokollaa voi käyttää Auraa. Käynnistyskomento:
/polku/aura/.venv/bin/python -m aura.cli serve
Tai uv:llä ilman erillistä asennusta:
uv --directory /polku/aura run aura serve
Komentorivityökalu
source .venv/bin/activate
# Hae datasettejä
aura search "väestö helsinki"
aura search "joukkoliikenne"
# Tilastot ja lähteet
aura stats
aura sources
# Päivitä data
aura harvest # kaikki lähteet
aura harvest avoindata.fi # yksittäinen lähde
aura harvest --list # listaa saatavilla olevat
aura refresh # harvest + laatupisteet + health + skeema
aura infer-schemas # päättele kenttätyypit esikatselusta
# Rikastukset
aura export-enrichments -o contributions/omat.json
aura import-enrichments contributions/*.json
Huom: Tietokanta (
data/aura.db) tulee repon mukana valmiina — ei tarvitse harvestoida erikseen.
MCP-työkalut
Haku ja selaus:
| Työkalu | Kuvaus |
|---------|--------|
| search | Hae datasettejä luonnollisella kielellä (suodattimet: lähde, formaatti, organisaatio, saatavuus, alue) |
| search_structured | Hae datasettejä ja palauta JSON tekoälyagenteille |
| search_by_region | Hae alueellisesti (kunta, maakunta, postinumero) |
| describe | Kuvaa datasetti yksityiskohtaisesti (sis. skeema, laatu, rikastukset) |
| query_data | Esikatsele tai kyselöi datasetin sisältöä (CSV, JSON, PxWeb, WFS, OData) |
| recommend | Suosittele parhaita datasettejä aiheesta |
| compare | Vertaile datasettejä rinnakkain (2–5 kpl) |
| find_related | Etsi samankaltaiset datasetit |
| suggest_questions | Ehdota esimerkkikysymyksiä teemoittain ja alueittain |
Alueanalyysi:
| Työkalu | Kuvaus |
|---------|--------|
| area_profile | Alueprofiili: datasetit, laatu, puutteet |
| compare_municipalities | Vertaile kuntien datatarjontaa rinnakkain (2–5 kpl) |
| lookup_municipality | Hae kuntatiedot nimellä, koodilla tai postinumerolla |
Laatu:
| Työkalu | Kuvaus |
|---------|--------|
| quality_report | Datasetin laatupisteet dimensioittain |
| quality_overview | Yhteenveto laatupisteistä |
| quality_ranking | Parhaiten pisteytetyt datasetit |
| quality_gaps | Metatiedon puutteet ja parannusehdotukset |
Rikastus ja tutkimus:
| Työkalu | Kuvaus |
|---------|--------|
| enrich | Rikasta datasetin tietoja (avainsanat, kuvaukset, laatuhuomiot) |
| batch_enrich | Tallenna useita rikastuksia kerralla |
| get_enrichments_tool | Näytä datasetin rikastukset |
| suggest_yso_tags | Ehdota YSO-ontologian avainsanoja |
| log_finding | Kirjaa löydös tutkimuksen aikana |
| list_findings | Näytä session löydökset |
| save_session_findings | Tallenna löydökset enrichmenteiksi |
Hallinta:
| Työkalu | Kuvaus |
|---------|--------|
| stats | Näytä tilastot tietokannasta |
| list_organizations | Listaa datan julkaisijat |
| list_formats | Listaa saatavilla olevat dataformaatit |
| harvest | Hae datasettien metatiedot lähteistä |
| list_sources | Listaa datalähteet ja harvestoinnin tila |
| probe_sizes | Mittaa paikkatietoaineistojen koot |
| health_check | Tarkista resurssien saatavuus (HTTP) |
| health_report | Saatavuusraportti aiempien tarkistusten perusteella |
| reference_status | Viiteaineistojen tila |
| populate_reference | Lataa viiteaineistot kantaan |
Rajapintojen suora käyttö agentissa
Aura ei ole pelkkä hakemisto — tekoälyagentti voi hakea dataa suoraan rajapinnoista käyttäjän puolesta. Kun käyttäjä kysyy esimerkiksi junan aikataulua, agentti etsii Aurasta oikean rajapinnan ja kyselee sitä reaaliajassa.
Esimerkkejä
Junaliikenne:
"Moneltako IC147 saapuu Kuopioon tänään?"
Agentti etsii Aurasta Digitraffic rata-API:n ja hakee aikataulun:
rata.digitraffic.fi/api/v1/trains/2026-03-30/147
Tilastot:
"Mikä on Tampereen väkiluku?"
Agentti löytää Tilastokeskuksen PxWeb-taulun ja kyselee sen
query_data-työkalulla.
Sää:
"Mikä on lämpötila Helsingissä?"
Agentti hakee Ilmatieteen laitoksen WFS-rajapinnasta reaaliaikahavainnon.
Tuetut rajapintatyypit
| Rajapinta | Suora kysely | Esimerkkilähde |
|-----------|-------------|----------------|
| REST/JSON | query_data tai suora HTTP | Digitraffic (tie, rata, meri), Sotkanet |
| PxWeb | query_data (suodattimet) | Tilastokeskus, LUKE |
| WFS | query_data (bbox, tyyppi) | FMI, SYKE, MML, Väylävirasto |
| OData v4 | query_data (filter) | Traficom |
| CSV | query_data (rivit) | avoindata.fi, HRI |
| GTFS | GTFS-tiedostojen URL:t | Digitransit (32 operaattoria) |
| GraphQL | Vaatii rekisteröitymisen | Digitransit Routing API |
Huom: Osa rajapinnoista (Digitransit GraphQL, MML OGC API) vaatii API-avaimen. Agentti ohjaa rekisteröitymiseen tarvittaessa.
Datalähteet
Katso täydellinen datasettikatalogi: docs/CATALOG.md Katso lähteiden tekniset tiedot: docs/SOURCES.md Katso tuetut dataformaatit: docs/formats.md
| Lähde | Tyyppi | Datasettejä | Arvioitu koko | |-------|--------|-------------|---------------| | avoindata.fi | CKAN API | 1 738 | 102 GB | | Tilastokeskus | PxWeb API | 1 524 | 7,1 GB | | Paikkatietoikkuna | Oskari API | 689 | — | | LUKE | PxWeb API | 662 | 3,1 GB | | SYKE | CKAN API | 614 | 18 GB | | HRI (hri.fi) | CKAN API | 549 | 39 GB | | Suomi.fi-koodistot | REST API | 511 | — | | Digitraffic | REST/OpenAPI | 162 | 1,5 GB | | Ilmatieteen laitos | WFS 2.0 | 160 | 14 GB | | Digitransit | GTFS/GraphQL | 40 | — | | LUKE avoin tutkimusdata | CKAN | 124 | 2,1 GB | | Valtiokonttori | REST API | 48 | — | | Metsäkeskus | WFS/WCS/ZIP | 43 | 1,2 TB | | Kuntien paikkatiedot (36 kuntaa) | WMS/WFS/ArcGIS | 36 | 57 GB | | Ruokavirasto | INSPIRE/GeoServer | 33
Related Skills
node-connect
352.2kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
claude-opus-4-5-migration
111.1kMigrate prompts and code from Claude Sonnet 4.0, Sonnet 4.5, or Opus 4.1 to Opus 4.5
frontend-design
111.1kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
Hook Development
111.1kThis skill should be used when the user asks to "create a hook", "add a PreToolUse/PostToolUse/Stop hook", "validate tool use", "implement prompt-based hooks", "use ${CLAUDE_PLUGIN_ROOT}", "set up event-driven automation", "block dangerous commands", or mentions hook events (PreToolUse, PostToolUse, Stop, SubagentStop, SessionStart, SessionEnd, UserPromptSubmit, PreCompact, Notification). Provides comprehensive guidance for creating and implementing Claude Code plugin hooks with focus on advanced prompt-based hooks API.
