doppelt gemappte Adressen künftig vermeiden

Mal interessierte Frage: Beim rumschauen in letzter Zeit in der Hinsicht bin ich immer wieder auf mapper gestoßen, die absichtlich doppelt mappen, auf Hausumriss UND als Node. Was spricht da dagegen, wo liegen technische Probleme, wieso kann das sinnvoll sein?

Ich bin grundsätzlich für Adresse an Eingangsnode > Adresse am Gebäudeumriss > Adresse als Node irgendwo im Gebäude, aber nirgends doppelt. Hatte ich eh schon mal erwähnt.
Wo liegen wirkliche Probleme, wenn es z. B. der User IceAgeMike absichtlich so gemacht hat? Muss man das wirklich reverten?

OffTopic: Hatten wir uns nicht darauf verständigt, dass es zu keiner Anprangerung mehr kommt?

Ich empfinde das namentliche nennen/anprangern von Usern - welche bemüht waren gute Arbeit zu leisten - als schlechte Umgangsform und möchte zum wiederholten Male bitten dies zu unterlassen. Danke!

Adresse auf Gebäude und parallel auf den Entrance Node habe ich auch öfters gemacht, und mir hierbei nichts gedacht. Es geht wohl eher darum dass eine Adress- Suche einen vernünftigen Landungspunkt benötigt. Landungspunkte sind:

  • die betriebliche Adresse
  • der Eingang, wenn uns ein solcher nicht bekannt ist, das Hauptgebäude.

Adressen auf Haupt und auf dem Nebengebäuden ergibt keinen Sinn, da meldeamtstechnisch eine Adresse immer einzigartig zu sein hat.
Eine weitere Untergliederung benötigt einen Adress- Appendix.

Zu den Anprangerungen möchte ich nichts sagen. Jedoch, den genannten Sachverhalt als “gute Arbeit” zu bezeichnen, ist doch weit übertrieben. Unabhängig, wie der User nun heißt und er wurde auch von anderen Usern hier direkt angeschriebe, jedoch ohne Erfolg.
Bedauerlicherweise hat sich gezeigt, dass offenbar dieser genannte User bisher einen “Mappingstil” praktiziert hat (wenn ich das so bezeichnen darf), wie sonst niemand anderer.
Hier geht und ging es in der Vergangenheit nicht darum, “ein paar Duplikate” rauszufischen, sondern Landstrichweise bis zu 5 Adressduplike je Hausnummer (mehr habe ich selbst nicht gefunden) zu löschen.
Im Grunde ist es egal, wie der User heißt. Kernfrage hier sollte sein, wie man diese Duplikate zuverlässig, möglichst einfach und schnell wieder rausbekommt. Ich denke, dass ist für die Diskussion am zielführendsten.

Lt. dzt. wiki von OSM sind Adressen auf das Gebäude zu legen, nicht auf einen eigenen Node. Der Eingang des gebäudes ist mir als Mapper oftmals nicht bekannt bzw. am Luftbild auch nicht erkennbar. Daher lege ich die Adresse nie auf den Eingang, ausgenommen ein Gebäude hat mehrere Hausnummern (z.B. 30 und 30a) oder - wie in Großstädten es vorkommt - ein Gebäude, 2 komplett unterschiedliche Hausnummern/Adressen. DA kann man die eine Adresse auf den einen Eingang legen, die andere auf den Zweiten.

Hallo wiki the map,

Im deutschen Forum gilt die ungeschriebene Regel, dass zwar über die Änderungen eines bestimmten Benutzers diskutiert werden kann und auch der Name genannt werden darf. Es ist jedoch nicht in Ordnung, den Namen prominent im Betreff zu nennen. Daher möchte ich dich, wiki the map, hiermit darum bitten, den Titel dieses Threads anzupassen.

Kannst du deinen Frust, dass deine Änderungen in Wien revertiert worden sind, bitte endlich mal ablegen?

Viele Grüße

Michael
(als Moderator)

Die Vorgangsweise wie nun bekannt hätte ich in Wien gerne gesehen. Unsere Lernkurve funktioniert doch.

Unabhänig davon was der andere User gemappt hat.
Ist die Frage ja auch wie definieren wir Doppelte Adressen genau.

als Beispiel da ich am WE endlich dazu gekommen bin einen gemeldeten Kartenfehler in meiner Gegend zu erledigen. Dabei habe ich die in diesem Neubaugebiet errichteten Reihenhäuser gleich mit erfasst.

https://www.openstreetmap.org/#map=18/47.96597/16.42342

Im Carto sieht das ganze unsinnig und doppelt aus. Was aber daran liegt, dass der hier notwendige addr:flats (was meiner Ansicht nach richtig wäre) nicht gerändert wird. Ist dies jetzt eine doppelte Adresse oder nicht? Unabhängig von den Ästhetik.
Und das Mappen als addr:housenumber 4/1 erscheint mir auch nicht ganz richtig. Obwohl ich annehme dass die Bewohner diese Form verwenden.

Wie sind eure Meinungen dazu.

Entschuldige Miflo dass ich dich unterbreche, ich möchte in Kärnten vorankommen, das was du da anschneidest sind
Adress Appendixe, und keine doppelten Adressen. Das ist ein eigenes Thema und passt nicht in diese Diskussion. Unsere Nebengebäude in Kärnten haben keine Sub Adressen. Das was du da mappst sind Top Nummern. Angesichts massenhafter Adresslücken über ganz Österreich verteilt, führst du die Diskussion mittels solcher Details aufs Glatteis.
Vielleicht klärst du uns kurz darüber auf, was Du mit Top Nummern zur Adressvervollständigung in Österreich beitragen möchtest. Wenn es dir Spaß macht Top Nummern zu Mappen, ich sehe darin kein Problem.

Wen das relevant sein soll, dann passen wir die Overpass Prüf Abfrage auf doppelte Adressen eben um die paar wenigen Code Zeilen an. Aber wir werden selten Gelegenheit finden, das anzuwenden.

Konkret siehst Du im Ergebnis der JOSM Suche aktuell rechts im Roten Rechteck eine Zeile mit addr:flats , du kannst vor einem eventuellen löschen anderer doppelter Adressen, diese mittels der JOSM Such Funktion “aus der Auswahl entfernen” ausklammern.

Problem gelöst.

Lg Johann

sieht seltsam aus, lt wiki stimmt es aber, meiner Meinung.

Ein Problem des Renderers, aber ansonsten technisch OK, in diesem Theard aber kein Thema.
Wenn du das weiter diskutieren möchtest, bitte ich dich ein eigenes Thema aufzumachen.

Grüße Johann

Ich hab mal einen Test für den JOSM-Validator zusammengebastelt. Ich bin noch nicht so weit, dass ich es als Patch-Vorschlag einreichen möchte, aber prinzipiell funktioniert es schon und kann getestet werden: https://github.com/Luzandro/josm-address-validator

POIs, konkret im Moment shop, amenity und tourism werden ignoriert und nicht als Duplikat angesehen (einfach nur die, die mir gerade untergekommen sind).

Units und Flats werden grundsätzlich berücksichtigt, wobei es im Moment zu falschen Warnungen kommen kann, wenn bei einer Adresse beides vorkommt (sollte eigentlich sowieso fast nie vorkommen, aber dank Miflo bin ich gleich auf so einen Fall gestoßen :wink: )

Die Maximale Entfernung für Duplikate ist aktuell 200m

Ich weiß, die Beschreibung der Fehlerkategorie als “Hausnummern verdoppeln” ist ein Blödsinn, aber ich verwende zum Teil die schon vom alten Test zur Prüfung von associatedStreets vorhandenen Texte und die Übersetzung ist da schon die ganze Zeit falsch.

Aus praktischer Erfahrung ist das zu wenig.
Denn, auch Duplikate, die unbewußt entstehen, werden dann gefunden, wenn sie weiter von einander entfernt stehen. Ich würde daher den Umrkeis auf gut 2000-5000m setzen. Mehr schadet nicht, bringt aber was.

Jein - es wird nicht überprüft innerhalb welcher Gemeindegrenzen eine Adresse liegt. Für Adressen, die kein addr:city angegeben haben, kann es damit zu Duplikaten kommen, wenn es die Adresse in 2 benachbarten Gemeinden gibt, was glaube ich wahrscheinlicher ist, als Probleme mit tatsächlichen Duplikaten, die so weit auseinander liegen.

edit: was allerdings noch auf der TODO-List steht ist, dass es als Duplikat angesehen wird, wenn eine addr:city angegeben hat und die andere nicht

Umso besser, wenn sie dann auch angezeigt werden. Denn, dann hat man auch visuell den Hinweis, da gibt es was zu tun (nämlich addr:city z.B. zu ergänzen)
Leider habe ich selbst Duplikate (die ich ehrlicherweise selbst eingearbeitet hatte) so gefunden. Wie? Gerade am Lande, wo es keine Adressen auf Straßennamenbasis gibt, sondern auf Ortsnamenbasis (addr:place) kann es ganz leicht passieren, wenn 2 Gebäude unweit von einander stehen (200m sind nix), dass beide das gleiche addr:place tragen. Ich habe bei etwa 60.000 Adressen selbst 5 Fehler dieser Art gefunden. Das ist klarerweise wenig, hat aber auch mit der Arbeitsweise zu tun, wie man Adressen einarbeitet - nicht alle arbeiten mit dem adresshelper!

Vielen Dank!

Es ist nicht wirklich falsch ohne addr:city und Nominatim ignoriert das bspw. sowieso (was man jetzt nicht positiv finden muss…). Aber ich werde den Punkt nochmal überdenken, evtl. könnte man in den Fällen die Fehlerkategorie auch von Warnung auf Info herabstufen.
Was es aber auf jeden Fall auch noch zu beachten gibt, ist dass generell “nur” die Daten betrachtet werden, die lokal heruntergeladen wurden.

Wenn du spatiale Abfragen machen könntest, wäre eher ein “in welchem Ort (Grenzrelation) liegt die Adresse?” sinnvoll. Für PostGIS ist das ein Klacks.

Gruss
walter

Hallo Thomas, schön dass du dich wieder in OpenStreetMap einbringst, willkommen zurück.
Ich hoffe du bist mit der gefundenen Lösung für die Ortsteile in Wals-Siezenheim zufrieden.

Grüße Johann

**Indizien auf einen maschinellen Import. **

Ich habe den gegenständlichen User kontaktiert, und gebeten, die oben angeführte Vorgangsweise https://forum.openstreetmap.org/viewtopic.php?pid=699275#p699275 zum bereinigen doppelter Adressen selbst anzuwenden. Ich habe hierbei angeboten, beim schließen dadurch entstehender temporärer Adresslücken zu helfen.
Der User hat mein Schreiben gelesen, aber darauf nicht reagiert. Daraus leite ich nun Vorsatz ab, OpenStreetMap durch vorsätzliches falsches Tagging, in diesem Fall durch fluten mit einer massiven Zahl an doppelten Adresse zu beeinträchtigen. Sieht man sich die betreff-lichen Changesets genauer an, so fällt auf, dass eingebrachte doppelte Adressen gar nicht mittels Addresshelper gesetzt worden sind, sondern es sich hierbei vielmehr um jeweils maschinelle Importe handelt, welche mit der AddressHelper Signatur maskiert worden sind.

Hierdurch wurde die JOSM App Austria AddressHelper diskreditiert.

Ja, ich hatte nichts gefunden, wie ich das in JOSM bei einem OsmPrimitive schnell und einfach abfragen kann, aber ich bin für jeden Hinweis dankbar. Das erste Ziel ist jetzt erst einmal die 90% low hanging fruits zu erwischen und dabei möglichst wenig false positives generieren, durch die es von den meisten gleich wieder ignoriert oder deaktiviert werden würde. Bei Adressen, die so nahe beieinander sind und nicht explizit unterschiedliche cities angegeben haben, gehe ich davon aus, dass das fishy und zu 99% falsch ist - sogar wenn die Angabe von city unterschiedlich ist, ist es eher suspekt und könnte ein Tippfehler, unterschiedliche Schreibweise, oder eine Verwechslung bei zusammengewachsenen Ortschaften sein, aber es scheint diese Fälle durchaus zu geben: Rustenfeldgasse 26, 1100 Wien ist gerade einmal 3 Häuser von Rustenfeldgasse 26, 2333 Leopoldsdorf entfernt.

Ich habe den Punkt mit der Entfernung jetzt feiner gegliedert, aber dazu möchte ich noch etwas zur allgemeinen Logik vorausschicken: die simpelste korrekte Adresse enthält nur housenumber und street/place - ich möchte allerdings auch Duplikate erkennen unabhängig davon, wie viele zusätzliche optionale Adress-Attribute jeweils noch angegeben sind. Im ersten Schritt wird also ein Schlüssel aus den Werten street, place, housenumber, unit und flats erzeugt, der Groß-/Kleinschreibung und Abstände/Bindestriche in Straßennamen ignoriert, also “Mozart-Gasse”, “Mozart Gasse” und “Mozartgasse” werden gleich angesehen. Kommt es dann zu einem Match, werden folgende Entscheidungen getroffen:

  • wenn beide ein addr:city angegeben haben und dieses ident ist, gibt es falls auch noch der Postcode gleich oder nicht vorhanden ist (momentan der einzige Fall, wo ich Postcode überhaupt betrachte) eine Warnung, bei unterschiedlichem Postcode zumindest noch eine Info (muss in JOSM unter “unwichtige Warnungen” aktiviert werden). Distanz spielt da überhaupt keine Rolle, es wird alles geprüft, was in der aktuellen Datenebene ist.

  • wenn sich city dagegen unterscheidet, aber die Adressen sehr nahe (200m) beieinander liegen kommt dennoch eine Info - ich bin mir beim Grenzwert und der Warnstufe nicht ganz sicher. Wenn man es auf “Warnung” erhöht, wäre wohl ein eigener Text dafür sinnvoll, nachdem der Unterschied ja explizit angegeben ist.

  • wenn zumindest bei einer Adresse kein addr:city angegeben ist, gibt es eine Warnung, wenn sie sehr nahe beieinander liegen, ansonsten nur eine Info (sollte wohl auch noch eine PLZ-Überprüfung bekommen)

Zu den Objekten, die ignoriert werden, habe ich jetzt noch leisure, emergency, craft, entrance und auch name hinzugefügt. Letzteres ohne weiteren spezifischeren Tags deutet zwar darauf hin, dass diese fehlen, aber zum einen gibt es nicht unbedingt immer etwas passendes und v.a. ist das ein anderes Problem und hat nichts mit den Adressen zu tun.

Was zu den 10% der “Früchte” zählt, die mich aktuell nicht interessieren, sind Adressen, die ausschließlich associatedStreet ohne addr:street/place verwenden. Die werden nicht als Duplikat erkannt, wenn man welche ohne associatedStreet anlegt, wobei in den Gegenden wo diese Relationen verwendet wurden, die ich mir angesehen habe, sowieso beides angegeben wurde.

Aktuelle Version zum Testen: https://github.com/Luzandro/josm-address-validator/raw/master/josm-custom.jar