Validator - Mismatched street names

Wäre das eventuell was für einen Maproulette Task? Dann würde man gleich den Fortschritt sehen…

Hi RicoElectrico,

thank you for the effort and the offer. With your data in the below umap link (thanks Wulf4096) there are now a few of them less in “my” region.

@Harald Hartmann - Maproulette would be a good thing - or this might be also something for @ENT8R 's Micro tasks?


Können wir die Karte regelmäßig mit aktuelen Datenl erhalten? Danke im Voraus!

(Replying in English because the thread was started in English.)

What @RicoElectrico built needs a huge database server. I’m currently not willing to run one because it’s too expensive for this hobby.
Today I took the html file generated by @RicoElectrico and used it to generate a map. Means without new source files I’m unable to update the map. Sorry.

Perhaps someone is willing to grant access to their osm database server to be used by the community to build such things?

The requirements are not that big.

In fact, you could just use Osmium or Osmosis to filter highway=* && name=* from germany.osm.pbf and import that to DB. Osmosis seems slow to filter (2h or so) and I have very old version of osmium without tags-filter, but will try it out with the newer one.

With --unlogged and --drop the osm2pgsql import takes 15 min . Analysis is another 25 min.
It is however not possible to use diffs with such setup and you have to download germany.osm.pbf each time again.

If it’s no problem that I download 3 GB every night from Geofabrik (@woodpeck?) then I can make a cron job.
I will also try to improve GeoJSON generation to match @Wulf4096 solution.

It might well be that if I make a custom import style, then parsing diffs will be quick (only updating node/way/rel tracking table). Maybe “going over pending ways” takes most of the time on normal updates without custom style.

I figured out that using osmconvert/osmfilter before osm2pgsql is much quicker with turnaround time of 1 h for the whole process including analysis.

I re-ran the analysis and now we’re at 1302 streets. In the evening I will make a cron job to do daily updates at 4 AM or so :slight_smile:

Maybe your analysis can save some more time, if you define your 2 used functions (canonical_name and array_sort_unique) as parallel save? Especially if your tablespace is on ssd.

I will test that hopefully soon.

Meanwhile, the tool is running daily at 5:00 CEST, it takes around 1h to complete al the steps.
We have gone down to 1266 cases! :slight_smile:

Here is the data as overpass query extracted from the html from today. That was some manual regexp hacking to get that id list, so not an automatic task. Would be great if we could somehow get the results on a daily automatic updated map.

out body;
out skel qt;

I rewrote my tool to fetch RicoElectrico’s html page (thanks), run Klumbumbus overpass query (thanks) and upload a geojson.
It’s now running as a daily cron job too.
Updated link see above.

Thanks to all - I eliminated a few more …

Same here - thanks!

One error class I was particulary able to find and fix in my armchair with this approach was names with whitespace at the end. Also strange accents (“Âuf dem Kampe”) and obvious spelling errors (“Friedhofs weg”, “Hinter der schule”).

Many other mismatches need on the ground verification.

Thanks also from me! Some I could fix.

I agree, some are easy to fix from home, others really need on the ground check, of which a few are maybe more than just wrong writing.

Danke an Wulf4096 et. al. fĂĽr die tolle Visualisierung

Thanks. Great.

Thanks all, we’re now down to 1070 streets that need checking. So 300 are already fixed :slight_smile:
But yesterday it was 1068, so someone broke 2 street names…

Did you see many false positives when fixing names? Is there a legitimate case where such streets indeed shall be named differently? In Poland I’d say yes (rarely though), but only because I discard given names and person titles. For Germany, I only remove letter case, diacritics, punctuation and whitespace before comparison.

ich hab mir mal die Karte von wulf angesehen. Es gibt dabei z.B. in Essen einen “bemängelten” Straßennamen. Er wird bemängelt weil er in zwei Schreibweisen erfasst ist.
Zum Ersten St.Annental - ohne Leerzeichen zwischen dem Punkt und dem groĂźen A.
Zum Zweiten St. Annental mit Leerzeichen zwischen dem Punkt und dem groĂźen A.
Also habe ich mal ein wenig gesucht welche Schreibweise denn nun richtig ist und somit getaggt werden sollte. Zuerst mal im amtlichen Stadtplan der Stadt Essen ins Suchhfeld beide Schreibweisen eingegeben.
Ohne Leerzeichen = Treffer werden angezeigt.
Mit Leezeichen = keine Treffer.
Der Vollständigkeithalber nocheinmal in das amtliche Straßenverzeichnis der Stadt geguckt. Hier gibt es die Straße im Gegensatz zum Stadtplan nur mit Leerzeichen…
Da das aber beides vermutlich keine zulässigen Quellen für OSM sind hab ich mir die Straßenschilder vor Ort angesehen. Hier wird die Straße mit Leerzeichen geschrieben. Also ist das ja der Name der getaggt werden muss.
Dummerwiese wurde aber bei einem von vier oder mehr aufgehängten Straßenschildern das St. “vergessen”. Auf diesem einen Schild steht also nur Annental anstatt St. Annental.
Da wir aber das mappen, was man vor Ort sieht wĂĽrde ich der Schreibweise auf den StraĂźenschildern den Vorrang geben.

Das sollte nur mal als Beispiel dienen wie schwer es manchmal werden kann den “richtigen” Namen zu finden.
Bei diesem Beispiel werde ich jetzt aber einheitlich auf “St. Annental mit Leerzeichen” ändern da ich das fehlende St. als “Verschreiber” des Schildermachers werte.

Hello Rico! Thanks for the map, seems good to detect issues.

A possible false positive I’ve encountered near me: (this shows up as wrong on the map)

I only live near there, but it would still be a detour, so I’m not sure if I can revisit it soonish.
Just want to say that hyphens possibly make for false positives.

Hallo blaubaer11,
als gebĂĽrtigem Essener ist mir noch ein krasserer Fall aufgefallen: thyssenkrupp Allee.
Ungewöhnlich ist die Kleinschreibung und die Getrenntschreibung des Straßennamens, z.B. im
Impressum der Firma
Stadtplan und Mietspiegel der Stadt Essen: ThyssenKrupp Allee
Kannst du mal gelegentlich nachsehen, wie es vor Ort aussieht?

Könnte etwas dauern, aber werde ich machen…

An alle FleiĂźigen hier:

Ich hoffe ja, dass ihr bei Berichtigung eines Straßennamens an sich auch nebenbei prüft, ob es zu der Straße auch noch Gebäude mit Adressen, somit addr:street=… gibt, welche zu berichtigen wären.

Am besten kann man das in JOSM mit dem Kartenstil “Coloured Streets” optisch kontrollieren. Ruhig mal ausprobieren …

Denn ansonsten müsste es ja bei ungeänderten addr:street-Objekten massenhaft neue Treffer bei OSM-Suspects geben, oder?