“Enig heen en weer mailen over met name statistieken” is wat mij (DM) betreft iets te kort door de bocht. Statistieken op zich zijn niet relevant (geen doel op zich), maar wel de werkelijkheid die door statistieken worden weergegeven.
Dat lijkt een goede oplossing, waarmee gedeeltelijk aan mijn (DM) bezwaren tegemoet wordt gekomen
Nadeel is dat de historie mogelijk nóg verder vervuild raakt met meerdere Changesets per Object. Althans indien en voor zover er highways bestaan zonder een van deze twee tags, maar wel met andere AND* tags. Veel lijken dat er niet te zijn.
Om mijn eigen bezwaren tegen deze opschoningsactie te kwantificeren heb ik vanavond even alle AND* tags op alle highways virtueel (dus nog niet echt) verwijderd.
(1) Overpass (http://overpass-turbo.eu/): Query per highway type:
<query type="way">
<!--
Select Author, user name is case sensitive
<user name="YourName"/>
-->
<has-kv k="highway" regv="cycleway"/>
<has-kv k="AND_nosr_r"/>
<bbox-query {{bbox}}/>
</query>
<query type="way">
<!--
Select Author, user name is case sensitive
<user name="YourName"/>
-->
<has-kv k="highway" regv="cycleway"/>
<has-kv k="AND:importance_level"/>
<bbox-query {{bbox}}/>
</query>
<union>
<item/>
<recurse type="down"/>
</union>
<print mode="meta"/>
(2) Overpass: Exporteer Data naar JOSM
(3) JOSM: Search for objects, Search string = highway:cycleway
(Filter dus nogmaals om gevonden Nodes en Polygonen buiten deze Changeset te houden)
(4) Verwijder alle AND* tags binnen deze selectie.
Voor grote recordsets: selecteer voor de query eerst Noord-Nederland t/m Utrecht en daarna Zuid-Nederland onder Utrecht. Exporteer beide queries naar JOSM, zodat er binnen JOSM één Selectie en dus één Changeset wordt aangemaakt.
Herhaal dit voor alle highway types. Eventueel kunnen kleinere sets worden gecombineerd, bijvoorbeeld:
Dit levert de volgende aantallen op:
cycleway = 3.530
track = 3.073
path = 302
footway = 1.322
pedestrian = 1.711
living_street = 296
bridleway = 7
residential = 7.676
service = 6.075
unclassified = 117.146
secondary = 17.829
tertiary = 46.706
primary = 271
motorway = 16
trunk = 34
Totaal: 205.994 highways.
En dit zijn alleen de highways. Overige Ways, Nodes, Polygonen zijn niet meegeteld.
Geldt voor deze aantallen: “op persoonlijke titel wat van die overbodige tags weg halen”?
Of wordt hier in één klap een enorme hoeveelheid relevante informatie, Author, de laatste “survey_mapper”, verplaatst naar de historie en verwijderd als primaire property van een highway?
Waarna het niet meer mogelijk is (althans ik kan het niet) om op (historische) “Author” te selecteren.
Hierbij wordt geen inhoudelijke wijziging doorgevoerd, het is nog steeds dezelfde highway met dezelfde properties, dezelfde bochten, dezelfde lengte, dezelfde routering.
Alleen de Author is gewijzigd en een aantal overbodige tags zijn verwijderd. En juist de Author zou ongewijzigd moeten blijven in het geval van een niet inhoudelijke wijziging.
Bijna héél Nederland staat na deze correctie op naam van “It’s so funny_mechanical” met uitzondering van de gebieden waarin “It’s so funny” (vooral) actief is en “AnkEric” ooit (vooral) actief was.
En nee, ik vind dat niet grappig
De selectie op basis van Author (laatste “survey_mapper”) beschouw ik als relevant voor:
- Het corrigeren van eigen fouten
- Het corrigeren van fouten van anderen
- Kwaliteitsaanduiding van Tags tijdens mappen (“Mijn” JOSM toont altijd een “List of people working on the selected objects”: Authors)
- Kwaliteitsaanduiding van Tags tijdens renderen
- Kwaliteitsaanduiding van Tags tijdens de beoordeling van een gemaakte route.
Sommige Mappers vertrouw ik blindelings, met sommige anderen ben ik het vrijwel nooit eens. Juist van deze laatste groep verwacht ik niet dat zij tussen nu en eind november deze beide tags tags (AND_nosr_r en AND:importance_level) zelf zullen verwijderen. Het is de vraag of zij via dit forum of de mailing list bereikt worden en zij gebruiken waarschijnlijk geen JOSM. En vooral van deze groep vind ik het belangrijk dat zij als Author bewaard blijven.
Statistiek is zeker geen doel op zich, maar het geeft wel inzicht.
Zeker in het begin vond ik het leuk en stimulerend om te zien hoeveel wegen, nodes en relaties ik had gewijzigd, toegevoegd of verwijderd.
De verhouding [“last modifier of” / “modified”] (http://hdyc.neis-one.org/) is een kwaliteitsaanduiding voor een specifieke mapper. Hier word ik afgestraft voor het feit dat ik te lui ben om [surface=asphalt] aan een cycleway toe te voegen. Maar meer relevant: hier zag ik ook dat ik structurele fouten maakte die door anderen werden gecorrigeerd. Leerpunt en dus nuttig.
Ik heb in het verleden zelf ook de fout gemaakt om van alle data rondom mijn - binnen JOSM geïmporteerde - tracks alle AND* tags te verwijderen. Gevolg is dat een groot aantal wegen ten onrechte op mijn naam is gezet. Ik heb deze wegen nooit expliciet bekeken.
Mea culpa: ik was een “Remote Mapper” ofwel “Armchair Mapper”. Misschien mag ik hier wel nog het woordje “ook” toevoegen…
Ik heb “It’s so funny” voorgesteld om de mogelijkheid te onderzoeken om deze data te verwijderen zonder dat hierbij de Author wordt gewijzigd én zonder dat de historie wordt vervuild met een historie op overbodige tags.
Zodra overbodige tags op deze manier worden verwijderd wordt hiermee én de database daadwerkelijk geschoond én het informatieniveau van de resterende data verhoogd.
Maar: *“Ook Paul Norman (DWG) doet niet een slimme truc om een nieuwe historie in mechanical edits te vermijden”.
*Hiermee lijkt het alleen mogelijk te zijn om deze overbodige tags op een onherstelbare en schadelijke manier te verwijderen.
Vervuiling van de historie.
Verlies aan informatie!
Ik hoop alleen wel dat er per Object (Node of Way) maximaal één Changeset aan de historie zal worden toegevoegd (en niet x Changesets voor x gevonden AND tags per highway).