Turun seudun osoitedata

Tuolla on keskusteltu Väestörekisterikeskuksen osoitedatan importoinnista. Sitä ilmeisesti ei ole ainakaan kokonaan tehty, koska datan laatu on vaihtelevaa. Turun kaupunki on julkaissut oman aineistonsa, jossa on Turun seudun osoitteet. Onko olemassa tietoa, onko tämä data riittävän laadukasta importointia varten ja jos ei ole, niin miten asian voisi mahdollisesti selvittää?

Mikä laadussa mietityttää? Asiasta voi kysyä laittamalla sähköpostia osoitteeseen avoindata@turku.fi

Ainakin siinä VRK:n aineistossa oli kuulemma ollut sellaista, ettei numero osu aina rakennuksen kohdalle. Mutta joo, otan tuonne Turun kaupunkiin yhteyttä.

Samalla pitää varmaan kysyä sitä lisenssiasiasta, että riittääkö attribuutio siellä Openstreetmapin tekijänoikeustiedoissa niin kuin Maanmittauslaitoksen datan osalta.

https://wiki.openstreetmap.org/wiki/Key:source:addr

Tuollainenkin tagi näköjään on sitä attribuutioasiaa ajatellen.

Nyt tuli Turun kaupungin sähköpostiosoitteesta tuollainen viesti:

Eli lisensointikysymys olisi ilmeisesti kunnossa.

Nyt pitäisi seuraavaksi varmaan yrittää tarkastella, miten nuo koordinaatit sijoittuisivat OpenStreetMapin karttakuvien päälle. Millähän työkalulla nuo saisi kivuttomimmin vaikka siihen GeoJSON-muotoon? Yritin yhtä muunnostyökalua jonka pitäisi tuota ETRS-GK23-koordinaattijärjestelmää tukea, mutta se jostain syystä lykkäsi kaikki osoitteet johonkin pohjoisnavalle.

Yritin katsella dataa JOSM:n ja opendata-pluginin avulla, mutta siitä tuli tuommoisen näköinen kuva:

Koordinaatiston pitäisi olla oikein eli ETRS-GK23. Silti osoitepisteet ovat aivan sekaisin.

Nyt olen kirjoitellut tuonne tuollaista:

https://wiki.openstreetmap.org/wiki/Fi:Suomalaiset_osoitetiedot#Turku

Sain siis nuo osoitetiedot näkymään oikein QGIS:n avulla. Samoin ne toimivat nyt jostain syystä myös JOSM:n avulla. Ehkä minulla oli sittenkin joku väärä koordinaatisto.

Mutta joo. Mitenhän tuo importointi kannattaisi tehdä, jos se tehdään? Pääsääntöisesti osoitetiedot vaikuttavat järkeviltä, mutta puutteitakin on. Esimerkiksi Nouselaintien lähistöllä Nousiaisissa on tuonnäköistä dataa. Paljon rakennuksia puuttuu ja pisteitä on myös roiskittu vähän miten sattuu:

Turun osalta osoitetiedot taas vaikuttaisivat pääosin järkeviltä. Tämä varmaan pitää tehdä niin, että kartalta valitaan manuaalisesti alueita, joissa osoitetiedot näyttävät olevan kunnossa ja niitä sitten lähetetään.

Mitä olette mieltä, että onko hyväksyttävää, että tiedot tuodaan osoitepisteinä sen sijaan, että osoitteet lisättäisiin suoraan rakennusten tageihin? Ainakin se olisi parempi kuin nykytila eli se, että osoitteita ei monin paikoin ole ollenkaan. Ja osoitepisteitähän käytetään joka tapauksessa OSM:ssä silloin, kun samalla rakennuksella on useampi osoite.

Sorry for answering in english, but the examples in ‘Turun seudun osoitedata’
are offset by x_0+=23000000, compared to the EPSG ETRS-GK23FIN definition:


# ETRS89 / ETRS-GK23FIN
<3130> +proj=tmerc +lat_0=0 +lon_0=23 +k=1 +x_0=500000 +y_0=0 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs  <>

If you add this offset to your projection definition, then the results look good.


Turku;Piispanpelto;11;6705678;23460513
Turku;Aurakatu;11;6704723;23459507
Turku;Kauppiaskatu;10;6704804;23459596
Turku;Aurakatu;13;6704787;23459466

$ cs2cs -f "%.9f" +proj=tmerc +lat_0=0 +lon_0=23 +k=1 +x_0=23500000 +y_0=0 +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +units=m +no_defs +to +init=epsg:4326
23460513 6705678
22.282324733    60.461243693 0.000000000
23459507 6704723
22.264236356    60.452573585 0.000000000
23459596 6704804
22.265836938    60.453309418 0.000000000
23459466 6704787
22.263478448    60.453143828 0.000000000

Mikähän mahtaisi olla sopiva työkalu osoitteiden deduplikointiin? Jos tuosta datasta saisi pois sellaiset osoitteet, jotka on jo syötetty OpenStreetMapiin, niin sitten ainakin näkisi, että mistä kaikkialta osoitteita puuttuu. Se olisi parempi kuin qa.poole.ch, joka hälyttää kaiken maailman koirankopeista, joille ei osoitemerkintää tarvitakaan.

Sitten kun on duplikaatit poistettu, niin voidaan alkaa vakavasti keskustella importista.

There is another EPSG code with correct false easting parameters https://epsg.io/3877

Ei ihan suoraan liity osoitteisiin, mutta tein osoitedatan ja overpassista vedetyn Turun katuverkon kanssa ristivertailun ja tein listan puuttuvista kaduista, kävin ne läpi ja lisäsin puuttuvat kadunnimet kartalle. Myös typoja löytyi. Muutama rajatapaus tarvitsee vielä maastokäynnin. Tästä löytyy koko lista.