OSMSuspects - Qualitätssicherung Adressen (Deutschland)

Das wäre sicherlich hilfreich, ja.

Kleine Hilfe zur Selbsthilfe: https://osm-suspects.gbconsite.de/debug Dort in das Eingabefeld den Wert aus dem Popup (“der falsche Ortsname”) 1:1 reinkopieren und “Suchen”. Wenn im Ergebnis ein Datensatz mit Levenshtein-Distanz 0 auftaucht und der Name trotzdem auf der Karte angemotzt wird, dann ist was faul in meiner Auswertung.

Gruß, Frank

Moin moin,

mal unabhängig von der Ignorieren-Methode:
Der Straßenname bzw. die Benennung der Straße endet nicht zwangsläufig am Ortsschild bzw. der geschlossenen Bebauung, er gilt ggf. auf dem gesamten Gemeindegebiet.
Die Beschilderung wird in der Regel nur bei der Bebauung durchgeführt, da sie nur dort zur Orientierung benötigt wird.
Auch Straßen/Wege ohne Anwohner sind häufig benannt, aber nicht unbedingt beschildert.
Sowohl Benennung wie Beschilderung hängt vom Gusto der Gemeinde(vertreter) ab.

Grüße, Georg

+1. Das war mir lange auch nicht klar, ist aber nur zu wahr. Mit einer gewissen Vorsicht kann man die außerörtliche Benennung solcher Straßen z.B. in Maps4BW erkennen …

Im OSM-Datenbestand 2017-02-13T21:42:44Z gibt es 34.967 x addr:housename, davon ca. 26.660 unterschiedliche addr:housename in Deutschland. Davon sind viele Phantasienamen, Hausnummern, etc.

Im Moment tendiere ich eher dazu, vorhandene addr:housename als eigenständigen Fehler anzusehen, weil in Deutschland eher unüblich. Zumindest ist mir keine solche Adresse bekannt. Gibts es da Beispiele? Also solche, bei denen statt Hausnummer der Hausname korrekt wäre?

Die Übersichts-Liste hab ich hier abgelegt: https://osm-suspects.gbconsite.de/download/addr_housename.csv (529kB, UTF-8, Feldtrenner: |, mit Header)

Zum Beispiel Geisingbergbaude:
http://www.openstreetmap.org/node/294926104#map=15/50.7662/13.8027

Der Postkasten mit Anschrift befindet sich hier. http://osm.org/go/0MKlkCN9V–?m=

Ok, das ist schon ein Sonderfall. Ich bezweifle, dass ein Navi oder ein neuer Briefträger diese Adresse zuordnen kann:

Bergbaude Geisingberg
Geisingberg Geisingbergbaude
01773 Altenberg

name
addr:place (statt Straßenname) addr:housename (statt Hausnummer)
addr:postcode addr:city

Die einzige Adresse laut Impressum ist die vom Betreiber, welche natürlich weit entfernt vom POI ist.

Andere Internet-Dienste zeigen den POI an sich ohne Straßenname an, mein Garmin findet “Geisberg 1” als Straße + Hausnummer am Ende des Weges.

Hm. Keine Ahnung… Gibts von dem Postkasten ein Bild mit der Anschrift?

Gruß, Frank

Diese Adresse in Weilheim an der Teck:

http://www.openstreetmap.org/node/847876963

wird nicht als fehlerhaft erkannt, obwohl addr:city=Weilheim zumindest „suboptimal“ ist (es gibt so viele Weilheims). Liegt das einfach daran, dass es irgendein anderes Weilheim gibt, bei dem addr:city=Weilheim korrekt wäre?

Richtig erkannt. Es gibt “Weilheim” und “Weilheim an der Teck”, welche nichts miteinander zu tun haben. Durch den “nur Namen”-Vergleich wird der Node oben nicht als fehlerhaft erkannt.

Ich werde in Kürze (so wie es die Zeit zulässt), mal testen, ob ich die addr:city nicht doch gegen die OSM-eigenen Admin-Grenzen teste.

Gruß, Frank

Bild vom Briefkasten habe ich nicht. Vielleicht im Frühjahr.

“Geisber 1” ???

Die benachbarte Kohlhaukuppe - auch mit Baude - hat damals eine Nummer von der Gemeinde erhalten:
http://www.openstreetmap.org/way/119207212

Schau:

Hmpf, ich hatte oben “Geisberg 1” geschrieben, sorry.

Das wäre natürlich toll. Wenn die Auswertung damit auch noch so gut läuft (und nicht irgendwelche anderen Probleme auftauchen), wäre das eine weitere große Verbesserung! Aber auch jetzt schon mal vielen Dank – viele Grüße, Chrysopras

Rüberkopiert aus dem Adressen-Thread.

Ich ändere das mal testweise am Wochenende auf ca. 1500m und beobachte wie es von der Laufzeit her hinkommt. Ich möchte die Auswertungen halt spätestens 06:00 morgens fertig haben.

Das hat aber woanders negative Auswirkungen:
Ich hatte eine Straße, die war 100 m lang richtig getaggt, hatte dann aber einen falschen Namen. Erst die Häuser am Ende nach ca. 500 m (mit richtiger Adresse) wurden dann moniert. Dadurch fiel der Fehler im Straßenname auf.

Ein Suchradius von 1500 m für Straßen scheint mir viel zu groß. Dadurch gehen alle Adressen als ok durch, wenn im Dorf nur irgendeine Straße so heißt. Sogar 500 m finde ich sehr reichlich. So weit ist im residential kein Haus von der Straße entfernt.
Da bleiben tendenziell viele Fehler unentdeckt (missing positives).

Was anderes ist es mit addr:place. Das kommt vor allem in der Pampa vor, wo in der Nähe typischerweise nichts mit anderem Namen liegt.

Das stimmt natürlich. Ich hatte mich für 500m als Kompromiss entschieden, weil es doch einige Gebäude, gibt, die etwas weiter von der Straße entfernt sind. Nun, mal die Auswertung morgen abwarten. Der Parameter ist ja schnell geändert.

Das ist wie bei praktisch allen solchen Überwachungstools ein Kompromiss zwischen zu vielen missing positives und zu vielen false alarms. Problem ist, dass fehlende Punkte viel schwerer zu entdecken sind als welche zu viel, nur die letzteren fallen aber ins Auge.

Wie der eine oder andere vielleicht gemerkt hat, ist OSMSuspects u.U. heute etwas zäh. Das liegt daran, dass ich im Moment die Auswertung etwas umstelle und Laufzeiten getestet habe, um realistische Werte zu erhalten.

Der ungenaue Check auf addr:city (nur Schreibweise, keine räumliche Prüfung) hat mich ja schon eine Weile gestört und ich habe dazu auch ein paar Fragen bekommen. Ich habe das jetzt folgendermaßen umgestellt: Prüfung auf Namen von den administrativen Boundaries aus OSM und (per Verknüpfung über amtliche Gemeindeschlüssel) “gen” aus den VG250-Daten UND ein räumlicher Check, ob das Adress-Objekt innerhalb der admin-Boundaries liegt. Der Vergleich mit den Namen aus den PLZ-Notes ist dafür weggefallen.

U.a. wie und was geprüft wird, kann man jetzt auf meiner Benutzerseite im Wiki nachlesen: https://wiki.openstreetmap.org/wiki/User:Dooley

Nachteil des neuen Verfahrens: Eventuell dauert die Auswertung nun “etwas” länger, bisher war sie um ca. 04:00 fertig, dass ist nicht mehr erreichbar. Aber wenn sie um 06:00 fertig ist, bin ich auch zufrieden.

Im Augenblick (18.02. 19:40) habe ich nochmal einen kompletten Durchlauf der Auswertung manuell gestartet. Wenn der erfolgreich durch ist, werde ich die Statistik-Seite am Montag auf “null” setzen, da die Werte so nicht mehr vergleichbar sind.

Edit: Ausserdem habe ich gestern einen schweren Fehler gefunden, den ich gestern abend noch behoben habe für die heutige Auswertung: ich hatte admin_level 7-9 verwendet statt 6-8. Daher in der Statistik vom 18.02 auch die Riesensprünge.

Super! Schon werden zahlreiche weitere Problemfälle gefunden, die vorher nicht entdeckt wurden.

Allerdings fallen mir auch ein paar falsch-positive Treffer auf. Wahrscheinlich sind diese nie ganz vermeidbar. Hier hätte ich zwei Gebäude, die jeweils (so wie derzeit gemappt) „auf“ der Gemeindegrenze stehen, wobei sie jeweils mit dem größeren Teil auf der „richtigen“ Seite stehen. addr:city stimmt also jeweils. Wahrscheinlich ist es nicht zu vermeiden, ja sogar sinnvoll, sie dennoch anzuzeigen, weil sie ja Zweifelsfälle sind; oder was meinst Du/Ihr?

https://osm-suspects.gbconsite.de/#17/49.06445/9.11233/osm-wrongcity
= https://www.openstreetmap.org/way/109588687

https://osm-suspects.gbconsite.de/#15/49.0521/9.0958/osm-wrongcity
= https://www.openstreetmap.org/way/143770010

In der Gegend gibt es noch mehrere ähnliche Fälle. Immer wenn ein ein Gebäude (oder ein leisure etc.) direkt auf der Grenze steht, wird das als fehlerhaft markiert. Die Frage ist: gut oder nicht gut? Wahrscheinlich muss man es so machen, denn man kann schlecht automatisiert feststellen, welche Seite die richtige ist – außer man geht nach dem größeren Teil … aber das ist aufwändig und fehleranfällig, oder?

so, nu is bei mir alles weiß und alles falsepositive :laughing:
ist halt das problem in deutschland, dass es einfach nicht durchgängig gleich ist.

Ja, Berlin war bis gestern komplett frei von Weißen, heute Hunderte, vielleicht Tausende :open_mouth:

Argh, ich Depp. Die Stadtstaaten Hamburg und Berlin vergessen, die 2 Sonderfälle haben ja admin_level. 4 Ich setz mich gleich dran.

Edit: Berlin und Hamburg sind gefixt. Um die 600.000 Adressen waren betroffen.

@Harald: Ich schau mal, ob ich auch noch die PLZ-Boundaries (spatial) zur Prüfung dazunehmen kann. Das Problem besteht sicher auch in anderen Gemeinden (wobei wir wieder beim Problem wären “Navi”- oder “Briefträger”-Adresse).