Voorstel mechanical edit van onjuiste/niet relevante gegevens

Bij het testen van OpenPoiMap (aka taglocator) stuitte ik een aantal malen op de volgende verwijzing:
source_rcn=gpsfietsroutes.nl
tevens zag ik:
gpsfietsroute(s)_nl_ref=nnnnn
De website gpsfietsroutes.nl bestaat niet meer en verwijst bovendien naar een website van FietsConnect waarop ook al niets valt te zien.
Bovenstaande link (naar een dus niet meer functionerende website) komt ruim 2500 keer voor in Nederland. Ik geloof niet (maar heb dat niet onderzocht) dat de website buiten Nederland is gebruikt.
Naar aanleiding hiervan is op het forum een discussie gevoerd, en ik vraag iedereen die nu op dit bericht wil reageren die forumdiscussie ook te lezen zodat we niet allerlei argumenten gaan herhalen.
http://forum.openstreetmap.org/viewtopic.php?id=30998

Mijn voorstel is het volgende:
Middels een zgn. mechanical edit wil ik de OSM-dataset opschonen en ontdoen van deze niet meer relevante gegevens. Het gaat dus om het verwijderen van de tag:

source_rcn

als, en ook alléén maar als deze verwijst naar gpsfietsroutes.nl
en het verwijderen van de daarbijbehorende:

gpsfietsroute(s)_nl_ref=nnnnn

Ik wil dat doen middels een mechanical edit waarvoor ik een speciaal account heb aangemaakt: marczoutendijk_mechanical.
Bij deze edit worden dus in één keer alle betreffende nodes gewijzigd.
Er wordt geen enkele node verwijderd en de geschiedenis van de dataset blijft volledig behouden. Wel kan het voorkomen dat na verwijdering van bovenstaande gegevens een node overblijft waarop geen enkele tag staat. Het gaat dan vaak om fietsknooppunten die verplaatst zijn, waarbij degene die ze heeft verplaatst niet de overige tags heeft meegenomen.

Waarom?
De belangrijkste reden voor deze opschoning is dat het aanwezig zijn van niet relevante of ronduit verkeerde informatie ervoor zorgt dat allerlei overige software die gebruik maakt van die data, ook niet meer goed werkt en ook die onjuiste gegevens gaat verspreiden!
Een voorbeeld daarvan is bv. de mogelijkheid die ik in openpoimap heb zitten om, als er een molen op de kaart staat, óók een link te geven naar de molendatabase.
Die link staat in de OSM database. Nu besluit de beheerder van de molendatabase ermee te stoppen. Vanaf dat moment krijgt iedereen die in openpoimap een externe molenlink aanklikt een niet werkende website te zien.
Pas als ik zelf weet dat dat het geval is kan ik openpoimap aanpassen. Maar veel beter is het als de bron van de fout wordt aangepakt en niet meer bestaat. Dan merkt openpoimap er niets van en functioneert foutloos. Hooguit zal een gebruiker zien dat er minder informatie is te zien dan in het verleden, maar hij wordt niet doorgestuurd naar een niet (meer) bestaande website.

En zo zijn er veel meer kaarttools en apps (ook uit het verleden) die, gebruikmakend van de OSM data, beter functioneren - en gebruikersvriendelijker - als ze kunnen putten uit betrouwbare data.

Wanneer?
Ik wil deze verwijdering in augustus 2015 gaan uitvoeren, nadat op de mailinglist en het forum nog reacties kunnen worden gegeven.
Het staat eenieder natuurlijk vrij om zelf al - zodra hij deze tags ergens tegenkomt - voor verwijdering te zorgen.

Zet m op Marc, het is een redelijke plak werk :wink: Its so funny heeft zo’n slag met AND gemaakt, als hij je 't niet afraad dan is 't uitvoerbaar.

Met het volgende JOSM filter kan je verweesde nodes filteren:

type:node  untagged -child

Let er wel op dat als je ze verwijderd ze niet aan een way of relatie zijn gekoppeld, dus ook de onderliggende osm data rond die node moet je downloaden om er zeker van te zijn dat ze geen enkele band meer hebben met andere data.

Even een plaatje, ik kwam net weer zo’n knooppunt tegen:

Wat kan weg:
network
gpsfietsroute_nl_ref
source_rcn

Bewaard moet blijven:
rcn_ref
rwn_ref
rhn_ref
Die kunnen namelijk alledrie op één knoop zitten

expected_xxx_route_relations

Bij de relaties moeten de relaties met de netwerken zonder meer bewaard blijven, die met de routes mogen weg. Knooppunten hoeven geen relatie met de route te hebben, die hebben indirect al via de weg waar ze deel vanuit maken. De relatie knoop-route werkt alleen maar verstorend.
Je hoeft ze niet weg te halen, maar als het gebeurt, dan is het niet erg.
Verbroken relaties met netwerken zijn wel storend, dan wordt de knoop een wees.

Bedoel je dat, als ik toch bezig ben, ik die ook maar mee moet nemen in mijn aanpassingen?
Geldt dat alleen voor network=rcn of voor alle waarden die voor network zijn ingevuld?

Die network=rcn kun je verwijderen, de relaties kun je gewoon laten zitten. Het ging mij erom om aan te geven, welke relaties echt belangrijk zijn.
Ik vermoed dat die network=rcn ook meegekomen is uit de gpsroutes
Ik denk niet dat er network=rwn of network=rhn voorkomt, maar inderdaad de key network kan weg
Van welke netwerken de knoop deel uitmaakt, kan worden afgeleid uit de rxx_ref key en uit de relatie met het netwerk.

En dat staat nog steeds op mijn planning.
Er zijn geen verdere commentaren binnengekomen van de Nederlandse “community” over deze actie (behalve bovenstaande, en één andere instemming op de mailinglist).
Ik zal deze aanpassingen per provincie doorvoeren.

Het zijn er wel een stuk minder geworden. :slight_smile:
Afgelopen tijd ben ik druk geweest met fietsknooppuntnetwerk en als ik een dergelijke node tegen kwam, heb ik gelijk opruiming gehouden.

Dat was me al opgevallen… :sunglasses:

Vandaag heb ik de wijzigingen (zoals in mijn voorstel omschreven), uitgevoerd.
Deze wijzigingen zijn terug te vinden onder deze naam: marczoutendijk_mechanical.

Marc, ik klik op een willekeurig knooppunt en zie staan rcn_ref =76 en source =AND
Volgens mij zijn die rcn_ref zeker niet uit de AND import gekomen.
Kijk je in de geschiedenis, http://www.openstreetmap.org/node/48431257/history dan staat er als eerste edit namelijk AND_nodes=4334 source=AND, maw rcn_ref komt niet uit AND import maar de source slaat op AND_nodes, dus die source tag moet eigenlijk ook weg.

Ik twijfelde al toen ik die al die “verweesde” tags zag staan, maar wilde niet direct ingrijpen omdat ik alleen wilde verwijderen wat ik in mijn voorstel had geschreven.
Feitelijk had @It’s so funny_mechanical die beter kunnen verwijderen bij het opruimen van al die overbodige AND tags een aantal maanden geleden.

Edit:
Ik heb ze vandaag onderhanden genomen en bij alle rcn_ref waar ook een source=AND stond, deze verwijderd.
Omdat in mijn eerste slag een aantal gpsfietsroute_nl_ref=* tags waren blijven staan (omdat ze niet gekoppeld waren aan: source_rcn=gpsfietsroutes.nl - en dat was mijn eerste opzet van deze hele actie), heb ik die nog overblijvende nu ook verwijderd.