doppelt gemappte Adressen künftig vermeiden

Die Vorgangsweise wie nun bekannt hätte ich in Wien gerne gesehen. Unsere Lernkurve funktioniert doch.

Unabhänig davon was der andere User gemappt hat.
Ist die Frage ja auch wie definieren wir Doppelte Adressen genau.

als Beispiel da ich am WE endlich dazu gekommen bin einen gemeldeten Kartenfehler in meiner Gegend zu erledigen. Dabei habe ich die in diesem Neubaugebiet errichteten Reihenhäuser gleich mit erfasst.

https://www.openstreetmap.org/#map=18/47.96597/16.42342

Im Carto sieht das ganze unsinnig und doppelt aus. Was aber daran liegt, dass der hier notwendige addr:flats (was meiner Ansicht nach richtig wäre) nicht gerändert wird. Ist dies jetzt eine doppelte Adresse oder nicht? Unabhängig von den Ästhetik.
Und das Mappen als addr:housenumber 4/1 erscheint mir auch nicht ganz richtig. Obwohl ich annehme dass die Bewohner diese Form verwenden.

Wie sind eure Meinungen dazu.

Entschuldige Miflo dass ich dich unterbreche, ich möchte in Kärnten vorankommen, das was du da anschneidest sind
Adress Appendixe, und keine doppelten Adressen. Das ist ein eigenes Thema und passt nicht in diese Diskussion. Unsere Nebengebäude in Kärnten haben keine Sub Adressen. Das was du da mappst sind Top Nummern. Angesichts massenhafter Adresslücken über ganz Österreich verteilt, führst du die Diskussion mittels solcher Details aufs Glatteis.
Vielleicht klärst du uns kurz darüber auf, was Du mit Top Nummern zur Adressvervollständigung in Österreich beitragen möchtest. Wenn es dir Spaß macht Top Nummern zu Mappen, ich sehe darin kein Problem.

Wen das relevant sein soll, dann passen wir die Overpass Prüf Abfrage auf doppelte Adressen eben um die paar wenigen Code Zeilen an. Aber wir werden selten Gelegenheit finden, das anzuwenden.

Konkret siehst Du im Ergebnis der JOSM Suche aktuell rechts im Roten Rechteck eine Zeile mit addr:flats , du kannst vor einem eventuellen löschen anderer doppelter Adressen, diese mittels der JOSM Such Funktion “aus der Auswahl entfernen” ausklammern.

Problem gelöst.

Lg Johann

sieht seltsam aus, lt wiki stimmt es aber, meiner Meinung.

Ein Problem des Renderers, aber ansonsten technisch OK, in diesem Theard aber kein Thema.
Wenn du das weiter diskutieren möchtest, bitte ich dich ein eigenes Thema aufzumachen.

Grüße Johann

Ich hab mal einen Test für den JOSM-Validator zusammengebastelt. Ich bin noch nicht so weit, dass ich es als Patch-Vorschlag einreichen möchte, aber prinzipiell funktioniert es schon und kann getestet werden: https://github.com/Luzandro/josm-address-validator

POIs, konkret im Moment shop, amenity und tourism werden ignoriert und nicht als Duplikat angesehen (einfach nur die, die mir gerade untergekommen sind).

Units und Flats werden grundsätzlich berücksichtigt, wobei es im Moment zu falschen Warnungen kommen kann, wenn bei einer Adresse beides vorkommt (sollte eigentlich sowieso fast nie vorkommen, aber dank Miflo bin ich gleich auf so einen Fall gestoßen :wink: )

Die Maximale Entfernung für Duplikate ist aktuell 200m

Ich weiß, die Beschreibung der Fehlerkategorie als “Hausnummern verdoppeln” ist ein Blödsinn, aber ich verwende zum Teil die schon vom alten Test zur Prüfung von associatedStreets vorhandenen Texte und die Übersetzung ist da schon die ganze Zeit falsch.

Aus praktischer Erfahrung ist das zu wenig.
Denn, auch Duplikate, die unbewußt entstehen, werden dann gefunden, wenn sie weiter von einander entfernt stehen. Ich würde daher den Umrkeis auf gut 2000-5000m setzen. Mehr schadet nicht, bringt aber was.

Jein - es wird nicht überprüft innerhalb welcher Gemeindegrenzen eine Adresse liegt. Für Adressen, die kein addr:city angegeben haben, kann es damit zu Duplikaten kommen, wenn es die Adresse in 2 benachbarten Gemeinden gibt, was glaube ich wahrscheinlicher ist, als Probleme mit tatsächlichen Duplikaten, die so weit auseinander liegen.

edit: was allerdings noch auf der TODO-List steht ist, dass es als Duplikat angesehen wird, wenn eine addr:city angegeben hat und die andere nicht

Umso besser, wenn sie dann auch angezeigt werden. Denn, dann hat man auch visuell den Hinweis, da gibt es was zu tun (nämlich addr:city z.B. zu ergänzen)
Leider habe ich selbst Duplikate (die ich ehrlicherweise selbst eingearbeitet hatte) so gefunden. Wie? Gerade am Lande, wo es keine Adressen auf Straßennamenbasis gibt, sondern auf Ortsnamenbasis (addr:place) kann es ganz leicht passieren, wenn 2 Gebäude unweit von einander stehen (200m sind nix), dass beide das gleiche addr:place tragen. Ich habe bei etwa 60.000 Adressen selbst 5 Fehler dieser Art gefunden. Das ist klarerweise wenig, hat aber auch mit der Arbeitsweise zu tun, wie man Adressen einarbeitet - nicht alle arbeiten mit dem adresshelper!

Vielen Dank!

Es ist nicht wirklich falsch ohne addr:city und Nominatim ignoriert das bspw. sowieso (was man jetzt nicht positiv finden muss…). Aber ich werde den Punkt nochmal überdenken, evtl. könnte man in den Fällen die Fehlerkategorie auch von Warnung auf Info herabstufen.
Was es aber auf jeden Fall auch noch zu beachten gibt, ist dass generell “nur” die Daten betrachtet werden, die lokal heruntergeladen wurden.

Wenn du spatiale Abfragen machen könntest, wäre eher ein “in welchem Ort (Grenzrelation) liegt die Adresse?” sinnvoll. Für PostGIS ist das ein Klacks.

Gruss
walter

Hallo Thomas, schön dass du dich wieder in OpenStreetMap einbringst, willkommen zurück.
Ich hoffe du bist mit der gefundenen Lösung für die Ortsteile in Wals-Siezenheim zufrieden.

Grüße Johann

**Indizien auf einen maschinellen Import. **

Ich habe den gegenständlichen User kontaktiert, und gebeten, die oben angeführte Vorgangsweise https://forum.openstreetmap.org/viewtopic.php?pid=699275#p699275 zum bereinigen doppelter Adressen selbst anzuwenden. Ich habe hierbei angeboten, beim schließen dadurch entstehender temporärer Adresslücken zu helfen.
Der User hat mein Schreiben gelesen, aber darauf nicht reagiert. Daraus leite ich nun Vorsatz ab, OpenStreetMap durch vorsätzliches falsches Tagging, in diesem Fall durch fluten mit einer massiven Zahl an doppelten Adresse zu beeinträchtigen. Sieht man sich die betreff-lichen Changesets genauer an, so fällt auf, dass eingebrachte doppelte Adressen gar nicht mittels Addresshelper gesetzt worden sind, sondern es sich hierbei vielmehr um jeweils maschinelle Importe handelt, welche mit der AddressHelper Signatur maskiert worden sind.

Hierdurch wurde die JOSM App Austria AddressHelper diskreditiert.

Ja, ich hatte nichts gefunden, wie ich das in JOSM bei einem OsmPrimitive schnell und einfach abfragen kann, aber ich bin für jeden Hinweis dankbar. Das erste Ziel ist jetzt erst einmal die 90% low hanging fruits zu erwischen und dabei möglichst wenig false positives generieren, durch die es von den meisten gleich wieder ignoriert oder deaktiviert werden würde. Bei Adressen, die so nahe beieinander sind und nicht explizit unterschiedliche cities angegeben haben, gehe ich davon aus, dass das fishy und zu 99% falsch ist - sogar wenn die Angabe von city unterschiedlich ist, ist es eher suspekt und könnte ein Tippfehler, unterschiedliche Schreibweise, oder eine Verwechslung bei zusammengewachsenen Ortschaften sein, aber es scheint diese Fälle durchaus zu geben: Rustenfeldgasse 26, 1100 Wien ist gerade einmal 3 Häuser von Rustenfeldgasse 26, 2333 Leopoldsdorf entfernt.

Ich habe den Punkt mit der Entfernung jetzt feiner gegliedert, aber dazu möchte ich noch etwas zur allgemeinen Logik vorausschicken: die simpelste korrekte Adresse enthält nur housenumber und street/place - ich möchte allerdings auch Duplikate erkennen unabhängig davon, wie viele zusätzliche optionale Adress-Attribute jeweils noch angegeben sind. Im ersten Schritt wird also ein Schlüssel aus den Werten street, place, housenumber, unit und flats erzeugt, der Groß-/Kleinschreibung und Abstände/Bindestriche in Straßennamen ignoriert, also “Mozart-Gasse”, “Mozart Gasse” und “Mozartgasse” werden gleich angesehen. Kommt es dann zu einem Match, werden folgende Entscheidungen getroffen:

  • wenn beide ein addr:city angegeben haben und dieses ident ist, gibt es falls auch noch der Postcode gleich oder nicht vorhanden ist (momentan der einzige Fall, wo ich Postcode überhaupt betrachte) eine Warnung, bei unterschiedlichem Postcode zumindest noch eine Info (muss in JOSM unter “unwichtige Warnungen” aktiviert werden). Distanz spielt da überhaupt keine Rolle, es wird alles geprüft, was in der aktuellen Datenebene ist.

  • wenn sich city dagegen unterscheidet, aber die Adressen sehr nahe (200m) beieinander liegen kommt dennoch eine Info - ich bin mir beim Grenzwert und der Warnstufe nicht ganz sicher. Wenn man es auf “Warnung” erhöht, wäre wohl ein eigener Text dafür sinnvoll, nachdem der Unterschied ja explizit angegeben ist.

  • wenn zumindest bei einer Adresse kein addr:city angegeben ist, gibt es eine Warnung, wenn sie sehr nahe beieinander liegen, ansonsten nur eine Info (sollte wohl auch noch eine PLZ-Überprüfung bekommen)

Zu den Objekten, die ignoriert werden, habe ich jetzt noch leisure, emergency, craft, entrance und auch name hinzugefügt. Letzteres ohne weiteren spezifischeren Tags deutet zwar darauf hin, dass diese fehlen, aber zum einen gibt es nicht unbedingt immer etwas passendes und v.a. ist das ein anderes Problem und hat nichts mit den Adressen zu tun.

Was zu den 10% der “Früchte” zählt, die mich aktuell nicht interessieren, sind Adressen, die ausschließlich associatedStreet ohne addr:street/place verwenden. Die werden nicht als Duplikat erkannt, wenn man welche ohne associatedStreet anlegt, wobei in den Gegenden wo diese Relationen verwendet wurden, die ich mir angesehen habe, sowieso beides angegeben wurde.

Aktuelle Version zum Testen: https://github.com/Luzandro/josm-address-validator/raw/master/josm-custom.jar

Zur Diskussion IceAgeMike Adressen auflösen: https://forum.openstreetmap.org/viewtopic.php?pid=699882#p699882

Edit: IceAgeMike und AddressHelper Themen getrennt.

Das ist ja echt arg, alleine in Kärnten. :roll_eyes: Bei uns in der Stmk. habe ich im Bezirk LB sowie die südliche GU auch noch einiges gefunden. Schlimm, hast du doch den User im damaligen Thread noch (indirekt) verteidigt und meine damalige Urgenz als übertrieben dargestellt. Offenbar ist es ärger.
Wie kann man solch einen Vandalismus künftig verhindern? Auch daran wird man in OSM arbeiten müssen hinkünftig.

Zum Thema: Es wird wohl nicht anders gehen, als dass sich User bereit erklären, strukturiert (nach Regeln und nicht irgendwie) die Duplikate raus zu löschen, vermutlich manuell oder “halb-Automatisch” nach Durchsicht.

Aus meiner Sicht kann sowas wie folgt ablaufen:

  • Eine eindeutig und klar definierte Abfrage erstellen mittels Overpass-Turbo. Idealerweise strukturiert nach Gemeinde oder max. Bezirk, die alles beinhaltet und alles ausschließt, was benötigt/nicht benötigt wird. (nicht, dass sich im Nachhinein herausstellt, dass man was vergessen hat oder zu viel gelöscht hat).

  • Klare, einfach verständliche Anleitung, wie man Punkt für Punkt vorgehen muss - damit es auch User erledigen können, die keine-wenig Erfahrung mit OSM/Programmierung haben.

  • Hoffen, dass sich in der jeweilig betreffenden Region User finden, die sich der Sache annehmen.

  • Fragliche Adressen (was potentiell fraglich ist, habe ich hier schon einige Male gepostet) extern notieren und an die Gemeinden melden - damit schafft man zugleich einen Qualitätscheck der vorhandenen Adressen.

  • Etwas Zeit lassen - sowas wird Monate dauern.

nop

edit: Themen IceAgeMike und AddressHelper getrennt

Wie geht es nun mit der App AddressHelper weiter.
ich lese hier, es ist eine JOSM integrierte Validator Prüfung auf doppelte Adressen geplant.

Meine Bitte, bei der App vorläufig in der Version einen Schritt zurückzugehen, aktuell habe ich bei meiner JOSM Installation, die Auto Plugin Update Funktion deaktiviert, was naturgemäß nicht lange gut gehen kann, da solches auch den Update Prozess bei den anderen Plugins beeinträchtigt.

Ich finde das super, dass du das machen willst, (Danke dafür!) aber ich denke es wäre gut, auch wenn du das nicht gern hörst, wenn du das zumindest kurz auf der Mailingliste erwähnst, bevor du startest. Vielleicht kann ja dort auch jemand etwas nützliches noch beisteuern.