Massenhaft Adressen erstellt, leider nicht ganz korrekt

Ich bin gerade dabei die Fehlermeldungen Berliner Adressen zu bereinigen (nach Housenumber Validator und Geofabrik OSM Inspector). Dabei fiel mir auf, dass ein User Massenhaft Berliner Adressen hochgeladen hat (Changesets 19391891 und 19392225). Leider gibt es dabei mehrere Probleme:

  • Jede Adresse ist zweimal an der identischen Position vorhanden
  • Die Straßennamen sind falsch geschrieben (“Handelsstr.” statt “Handelsstraße”)
  • Die Hausnummer ist Teil des Straßennamens (“addr:streed=Handelsstr. 1b” statt addr:street und addr:housenumber)
  • Es fehlen alle anderen Angaben (addr:country, addr:city, addr:postcode)
  • Die Geopositionen stimmen nur ungefähr, meistens scheinen sie auf einem der beiden Gehwege zu liegen.

Auf der Einen Seite ist das Ganze ja sehr schön, immerhin enthält das Changeset immerhin 21522 Knoten. Andererseits ist quasi alles daran falsch. Und zu guter Letzt haben wir jetzt auch noch massenhaft Adress-Dupletten in OSM, da der Mapper/die Mapperin jeden Konoten doppelt hochgeladen hat und außerdem viele der Adressen schon deutlich genauer erfasst worden sind, entweder als Hauseingang oder als Knoten innerhalb des Gebäudes.

Auf der einen Seite ist es gut, das jemand so ambitioniert ist. Auf der anderen Seite hat durch diese Aktion die Datenqualität doch massiv gelitten.

Meine Frage ist jetzt: Was macht man damit? Den Mapper anschreiben? Die Changesets löschen? Und wenn, wer macht so etwas? Ich bin ja selber nicht gerade ein erfahrener Mapper. Gibt es da erfahrenere Mitstreiter mit besserer Reputation, die einen Kontakt herstellen und das mit dem Mapper durchsprechen könnten?

Der User bzw. Firma ist bekannt für solche Massenimports aus fragwürdiger Quelle

http://forum.openstreetmap.org/viewtopic.php?id=22700

Ich sag gleich Frederik von der DWG bescheid, der sich dann darum kümmern wird

Danke! Das nächste mal werde ich zuerst mal die Suchfunktion benutzen bevor ich schreibe. Alleine der Username hätte ja schon einen Treffer ergeben.

Aber: Wer oder Was ist die DWG? (Die “Deutsche Wirbelsäulengesellschaft” wohl nicht. Dann schon eher die “Dessauer Wohnungsbaugesellschaft”.)

DD1GJ hat ja schon zurecht angemerkt, daß in diesem Fall die Quellenproblematik und die - erneut - verletzten Importrichtlinien (angefangen bei “Scripted imports and automated edits should only be carried out by those with experience and understanding …”) im Vordergrund stehen und das Zeug schon deswegen wieder rausfliegen wird. Dennoch einige Hinweise zu einigen der technischen Fehler, denn die treten auch bei “normalen” Einträgen auf.

Solche Fälle kann JOSM weitgehend automatisch bereinigen: Validator anwerfen und bei den verschiedenen “Doppelten Punkten” jeweils auf “Reparieren” klicken.

Ich betreibe einen Bot, der genau solche sowie ähnliche Fehler weitgehend bereinigt. Mit ihnen braucht man sich also in DE in der Regel nicht mehr herumzuschlagen - es sei denn, sie sind älter als zwei Tage und damit offenbar nicht vom Bot behoben worden. Bei 20k (bzw. 40k) Objekten bekommt der allerdings wegen der Größenbeschränkung auf 200 Objekte pro Änderungssatz nachhaltige Verstopfung.
Lagefehler und Duplikate korrigiert der Bot natürlich nicht, ebenso wenig fügt er zusätzliche Adresstags hinzu (ausgenommen addr:country=DE, wenn ein “D” oder “DE” aus addr:postcode herausoperiert wird).

PS. DWG = Data Working Group.

Wieder was dazugelernt. Danke. Anfangs habe ich die Daten noch versucht manuell zu löschen, da ich JOSM plötzlich Straßennamenvorschläge wie eben “Handelsstr. 1b” bekam. Ich habe dann aber schnell mitbekommen, dass da etwas größeres am Laufen ist.

Von dem habe ich schon gelesen. Super Sache! Ich bereinige momentan eben die Fehler, die der Bot nicht mehr alleine beheben kann. Eben Duplikate oder fehlende Tags nach Housenumber Validator und Geofabrik.

Wenn mir so etwas mal wieder auffält, kann ich mich dann gleich an die DWG wenden? Ich nehme an, dass es die eMail-Adresse ist, die im Wiki hinterlegt ist?

Der User hat inzwischen eine offizielle Sperre erhalten und der Löschvorgang ist eingeleitet. Bei so großen Fällen kannst Du Dich auch gleich an die DWG (wie im Wiki entdeckt) wenden. Wenn Du Dir unsicher bist, dann frage einfach wieder hier im Forum nach.

Danke für schnelle Benachrichtigung, das macht das Zurücksetzen erheblich einfacher.

Ja. Wobei es nicht schadet, vorher mal hier nachzufragen - vielleicht weiß jemand näheres, wie in diesem Fall ja auch. Außerdem sollte man im Regelfall zuerst mit dem User Kontakt aufnehmen, bevor man die DWG einschaltet oder gar selbst zur Tat schreitet. Ausnahmen sind ganz eindeutige Fälle (etwa wenn ein Rechteckausschnitt aus einer Stadt verschwindet oder ein offensichtlicher Unfall vorliegt) oder eben wenn der User bereits zuvor einschlägig aufgefallen ist.

Frederik hat übrigens inzwischen eine (temporäre) Sperre verhängt, die Löschung der Problemadressen wird folgen.

Du brauchst dich nicht immer sofort an die DWG wenden, da wir das normalerweise in kleinerem Rahmen lösen (User ansprechen, eventuell reverten und ähnliches). Bei richtig großen Sachen oder bei Wiederholungstätern (beides trifft hier zu) kann die DWG stärkere Geschütze auffahren und den uneinsichtigen User z.B. sperren. Zudem haben die noch einige Tools, die einen Revert einfacher machen.

Gruss
walter

Danke für die Tipps. In Zukunft werde ich weiterhin Augenmaß einsetzen und je nach Einzelfall entscheiden, ob ich mich an den Nutzer, das Forum oder die DWG wende.

Mal kurz ins Forum zu schreiben ist eigentlich nie verkehrt. So bekommen andere auch mit, dass es da ein Problem gibt.
Danke von einem treuen Forumsleser! :wink:

Mag sich jemand der Objekte aus dem Änderungssatz #19391891 annehmen? Wie es aussieht, hat Frederik nur #19392225 abgeräumt.

Was bedeutet “annehmen”? Muss ich jeden Knoten einzeln auswählen und löschen? Kann ich ein komplettes Changeset per Klick entfernen? Ich würde es ja machen. Aber ich weiß nicht wie.

bin dran, upload läuft schon

gruss
walter

edit: erledigt.

Danke! Berlin ist wieder etwas sauberer :wink:

In diesem Umfeld soll das heißen, daß jemand der mit dem Reverter-Plugin für JOSM vertraut ist oder mit einem Skript zum Reverten, das Tool einmal laufen läßt. Das funktioniert am Besten solange noch niemand begonnen hat, die ungewünschten Änderungen von Hand aufzuräumen.

Baßtölpel

Asche auf mein Haupt, in die Ecke stell und schäm. :frowning:

Ich muss gestehen, dass ich an den Uploads schon rumgefummelt hatte. Es hat halt etwas gedauert, bis ich mitbekommen habe, dass es sich nicht um vereinzelte Knoten handelt, sondern um einen Massenupload. Ich hoffe, dass ich niemandem zuviel Arbeit aufgehalst habe.

nö, “mein Teil” war ganz einfach. Gab zwar 5 Konflikte aber da die Nodes eh wegsollten, war das nicht so schlimm.

Gruss
walter

In diesem Fall waren die Punkte ja mit nichts anderem verbunden und Du hast nur die Daten gelöscht, die sowieso weg sollten. Das sind Konflikte, die einfach aufzulösen sind. Wenn aber größere Relationen betroffen sind, wird es schnell unmöglich, die Konflikte bei einem revert zu beherrschen. In solchen Fällen wirst Du hier manchmal die Ansage hören: “Ich kümmere mich drum, alle anderen bis dahin Finger weg”

Baßtölpel

Hallo lieber User,

vielen Dank für Die Nachricht. Ich habe vom Land Berlin “sämtliche” Hausnummern und Koordinaten für Berlin zur Freigabe für OSM und auch für Dritte Nutzung freigeben erhalten. Diese Liste würde ich gerne zeitnah in OSM einspielen. Da ich zu Anfangs jedoch nur die Strasse /Hausnummern brauche wollte ich den Eintrag beschränken.

Könnt Ihr mir bitte Helfen: welche “pflichteinträge” braucht ein Eintrag. war das sonst richtig? vielen Dank und beste Grüsse Bugsy

Bitte zuerst https://wiki.openstreetmap.org/wiki/Import/Guidelines lesen.

Generell sind Importe nicht einfach “einspielen” sondern relativ komplex und viel Arbeit.