Orts-Städte-Ranking

Sowas gab es vor 10 Jahren mal. Da gab es im Wiki Tabellen welcher Ort wie schon erfasst war. D.h. Straßen, Adressen, Gebäude, Hausnummer etc.

Das ist natürlich völlig aus dem Ruder gelaufen bei dem was wir alles erfassen.

Was heisst denn eine gute score? Im zweifelsfalle will ich nur Straßen, oder nur Adressen, oder nur Landuse. Es gibt kein “Objektiv fertig” oder “Objektiv vollständig”.

Für Hausnummern gibts ja z.b. das hier:

https://regio-osm.de/hausnummerauswertung/

Der Vergleich mit offiziellen Datenbeständen oder nach regeln was da sein müsste.

Es gab auch noch sowas wie “Unmapped Places” aber das finde ich spontan nicht wieder. Am ende ist vollständigkeit nicht objektiv beschreibbar und regional sehr unterschiedlich.

Also nope - Es gibt versuche sowas zu machen - aber das kratzt immer nur an der Oberfläche.

Flo

Soweit ich weiß kann man in StreetComplete keine anonymen Notes erstellen, da man sich dafür ja mit einem OSM-Account anmelden muss. Zumindest in meiner Umgebung erhalte ich nur Notes von StreetComplete bei denen die User auch immer zügig antworten.

Anders sieht es bei Mapy.cz, Organic Maps und Maps.me aus bei denen der Ersteller der Nodes immer der Gründer / Hauptprogrammierer ist und hier nie eine Antwort kommt. Auch auf osm.org sollte beim Note erstellen mindestens eine valide E-Mail-Adresse abgefragt werden. Bei einem Großteil der anonymen Notes muss man etwas nachfragen, weiß aber, dass man nie eine Antwort bekommen wird.

Du hast wohl Recht, dann muss ich meine Aussage insofern relativieren, dass bei SC die notes anonym sein können. Grundsätzlich bleibe ich aber dabei, dass viele notes von Schnell-Mal-Untergwegs-Zwischendurch-Erstellern nur in Teilen konkret genug sind, um korrektes Tagging zu ermöglichen. In vielen Fällen führen sie jedoch zu einer “Verspargelung” der Karte mit notes, die dann schwierig und nur mit hohem Aufwand aufzulösen sind.

Auch die beste Idee nutzt nichts, wenn sie nicht umsetzbar ist. Der erste Schritt wäre mit Fleißarbeit noch machbar, nämlich aus den Hunderten von etablierten Tags eine Liste zusammenzustellen, welche für das Ranking relevant sind. Die Unmöglichkeit liegt darin, eine Prüfliste maschinell zu erstellen, an Hand derer man überhaupt feststellen kann, ob ein bestimmter Objekttyp nicht nur vollständig gemappt ist, sondern auch korrekt, denn fehlerhaft gemappte Objekte dürften sicher nicht als “korrekt erfasst” gewertet werden.

Wenn es für irgendeinen Objekttyp eine solche Prüfliste geben, in der sämtliche Objekte dieses Typs nicht nur mit allen relevanten Attributen (also z.B. alle Gebäude mit Gebäudetyp, Umriss, Adressdaten, darin befindlichen Behörden, Firmen, Geschäften etc.) enthalten ist, sondern auch noch mit den für einen Abgleich notwendigen Koordinaten, und wenn diese Liste dann auch noch tagesaktuell zur Verfügung stehen würde, und wenn man diese Liste für einen Abgleich mit den in OSM erfassten Daten aufbereiten würde, dann könnte man die Daten auch gleich in OSM importieren und sich die manuelle Erfassung ganz sparen … :smiley:

Und selbst wenn ich dieses Kunststück für einen Objekttyp fertigbringe (Datenimporte hat es ja schon vielfach gegeben, m.W. mit unterschiedlichem Erfolg), dann müsste dieser Prozess alltäglich wiederholt werden, denn überall wird ständig neu gebaut, abgerissen, umgewidmet, umbenannt usw. Und dann müsste man ja noch die Prüflisten für Hunderte von weiteren Objekttypen in Angriff nehmen.

Also eine Menge Arbeit … wann willst Du denn loslegen … ?!? … :wink:
*
Edit: Wort ergänzt*

Ein detaillierteres Datenset hat einfach mehr Nodes/Ways pro Fläche hat. Die Tagmenge auf ebendiesen Objekten korreliert sicher auch — jemand der sich wirklich mit einem Gebiet beschäftigt, fasst eigentlich nicht nur die Geometrie an, sondern auch Tags. Auf Tags gehe ich aber hier sonst nicht weiter ein.

Eine Karte zur Nodedichte hat auch schon mal jemand angelegt, allerdings ist sie nicht allzu hilfreich, denn Nodedichte muss man immer zur tatsächlichen Baudichte in Relation stellen. Dazu bringe ich auch ein paar Werte für eine erwartbare typische Nodedichte aus meiner Gegend ein:

  • unbearbeitetes Dorf: 29 nodes/ha

  • “komplett bearbeitet”:

  • Wald: 3-4 nodes/ha

  • Landwirtschaft: 3-8 nodes/ha

  • dörfliche Struktur, oder städtisches Baugebiet mit Geschoss- und Zeilenwohnungsbau: ca. 170-185 nodes/ha

  • Baugebiet EFH/GWB-Mix: ca. 270 nodes/ha

  • Innenstadt mit dichter Bebauung: ca. 300 nodes/ha

Das Problem ist jetzt eher, dass ein triviales Auswertungsprogramm wie die oben verlinkte Karte die tatsächliche Baudichte nicht zwangsläufig kennt, also ob 50 Nodes in einer Kachel als “gut” oder “schlecht” zu bewerten sind. Dazu bräuchte es Hilfe aus weiteren Quellen, z.B. die Ergebnisse aus einem Machinelearningprozess der Luftbilder auswertet, oder wenn möglich dem offiziellen Flächennutzungsplan.

Welcher Akademiker liest gerade mit und ist interessiert? :smiley:

Interessante Idee … über die Nodedichte ließen sich statistische Werte erzeugen, die an Hand der reellen Objekte nicht überprüfbar sind und damit auch nicht widerlegt werden können … :slight_smile:

Noch besser eine KI, die nicht nur lernt, Luftbilder auszuwerten, sondern auch selbsttätig das Internet nach allen Arten von Geodaten zu durchsuchen, diese zu interpretieren und daraus dann Karten von nie gekannter Präzision und Detaildichte zu erzeugen und wir müssen dann nur noch die täglichen Changesets abzeichnen. :sunglasses:

Ich dachte, dass es das schon gibt - und “Google Maps” heißt :wink:

Apropos “Internet durchsuchen”: Nur, was es im Internet gibt ist wahr. Amtliche Daten sind unwiederlegbar wahr. Alles andere ist zumindest zweifelhaft. Jedenfalls habe ich immer wieder den Eindruck, dass das viele Mapper glauben und fleißig das Internet durchforsten :frowning:
Vorsicht: Vorstehendes kann in Teilen Ironie enthalten.

Da mir ja die Qualität etwas am Herzen liegt wäre ich an einem Qualitätsranking interessiert.

Als Kriterien könnte man zB die Anzahl offener OSM-Notes oder die Anzahl keepright-Fehler nehmen. :wink:

Hmm … stimmt das etwa nicht …?!?..

Studien in der Richtung gibt es schon, z.B.:

Generell gibt es einige Studien zur Qualitiät und Vollständigkeit von OSM, siehe z.B. Research (Wiki) und die Acedemic Tracks der SotM, FOSSGIS und FOSS4G Konferenzen.

Tools die in Richtung Qualität und Vollständigkeit gehen:

Der ohsome quality analyst wäre vielleicht am ehesten ein möglicher Ansatz, den verlinkten FOSSGIS Vortrag dazu fand ich ganz interessant.

Danke an alle für den interessanten Input. Es gibt doch schon einiges in dem Bereich.
Vermutlich wäre es gut einen OSM-Wikiartikel zu haben der die verschiedenen Webseiten auflistet. Beschreibung, Vor- und Nachteile, usw.
Tatsächlich gibt es schon einen Wiki-Eintrag für Completeness . Aber selbst da fehlt z.B. die Erwähnung von Streetcompleteness.
Besonders Streetcompleteness Gefällt mir gut, ist aber noch ausbaufähig von den Funktionen. Die anderen Links und Webseiten hab ich noch nicht in Gänze erforscht.

Ein Ranking z.B. mit Top 10 einer Region (z.B. ein Landkreis) für bestimmte OSM Kategorien (z.B. Geschäfte oder Straßen) scheint es leider nicht zu geben. Ich denke aber das wäre nötig um einen Ansporn zu geben es zum Beispiel besser zu machen als der Nachbar-Ort oder Nachbar-Stadtteil. Vielleicht würde das auch die Gemeinde/Stadtteilverwaltungen motivieren OSM zu fördern und/oder zu bewerben.
Mit Streetcompleteness könnte man eine manuelle Top 10 eines Landkreises oder einer Stadt erstellen, natürlich nur für die verfügbaren Paramenter. Es wäre schön wenn man eigene Paramenter erstellen könnte, so wie man bei MapComplete eigene Maps erstellen kann, die dann evtl. in die Liste der Maps übernommen werden können. So eine Art Plug-in das von Contributoren erstellt werden kann und vom Entwickler von Streetcompleteness übernommen werden kann.
Im Moment könnte man die Daten für die entsprechenden Regionen händisch abfragen und in eine Tabelle packen (lässt sich bestimmt automatisieren) Somit könnte man im Prinzip heute doch schon eine Top 10 bauen. Idealerweise wäre das natürlich in einer Webseite automatisiert, aber da bräuchte es wohl ein API oder Interface wenn das nicht der Streetcomplete Entwickler machen soll.

Natürlich ist auch die Frage inwieweit ein Wettbewerb zwischen z.B. Ortschaften einer Region die Qualität von OSM herabsetzen würde. Möglicherweise erfasst man in OSM etwas schludrig weil man an Quantität statt Qualität denkt. Vielleicht aber auch nicht. Da kann man nur mutmaßen. Es sollte eine Pilotregion geben wo man das testet.


Zusammenfassung der Links:

Streetcompleteness Prozent Erfassung für :
Gebäudetyp, Stockwerke, Dachform, Straßenoberfläche, Straßenbeleuchtung, Parkplätze, Treppen, E-Auto-Ladesäulen, Bushaltestellen, Briefkästen, Veggie in Restaurants, Geldautomaten-Bankname
Karte für Fehlende Einträge
Status mit Symbolen
Hausnummern
Nodedichte - Forum-Post
Wiki Completeness - Wiki Eintrag zum Thema Vollständigkeit von OSM

Post von Ikonor:

Tools die in Richtung Qualität und Vollständigkeit gehen:

  • Kontur Analytics (Disaster Ninja) - siehe Overlays rechts

    • Artikel: Measuring Completeness of Road Network in OpenStreetMap
  • ohsome quality analyst Vollständigkeit von Straßen

    • Artikel: ohsome quality analyst (OQT): Die Qualität von OpenStreetMap Daten einschätzen :: FOSSGIS-Konferenz 2022

Studien in Richtung OSM Qualität und Vollständigkeit

  • Artikel: New feature addition to Ohsome Quality analysT: Building Completeness Indicator | Heidelberg Institute for Geoinformation Technology

  • Artikel: Increasing OpenStreetMap Data Accessibility with the Analysis-Ready Daylight Distribution of OpenStreetMap: A Demonstration of Cloud-Based Assessments of Global Building Completeness - State of the Map 2022

  • Research (Wiki) Studien zur Qualitiät und Vollständigkeit von OSM und die Acedemic Tracks der SotM, FOSSGIS und FOSS4G Konferenzen.

hier eine, auf die Schnelle erstellte Top 2 von 5 Postleitzahlen für willkürlich ausgewählte Streetcompleteness Parameter. Hiernach hat am besten abgeschnitten (Summe der grünen Felder) PLZ 70806 (6 grüne Felder), gefolgt von PLZ 70825 und 70437 (jeweils 5 grüne Felder). Das ist ein ganz einfaches Beispiel mit meinen schlechten Calc Kenntnissen :slight_smile: . Kann man sicher auch in Schön machen… und an Details feilen wie Gewichtung, etc.
Man kann auch Parameter zusammenfassen. Z.B. gibt es für Treppen 4 Parameter in Streetcompleteness - geeignet für Rollstühle, etc, Oben/Unten Angabe, Geländer, Anzahl Stufen Angabe. Daraus könnte man einen “Score” errechnen. Dabei geht es nicht um Perfektion sondern einfach eine ungefähre Hausnummer wie es um eine Region in einem bestimmten Bereich steht z.B. Treppen Erfassung (Interessant in einer bergigen Region).

PLZ 70806 (Kornwestheim) ist in der Gesamtheit der Sieger :sunglasses:
Abgeschlagen auf Platz 5 ist 70378 (Hofen/Mühlhausen) :confused:

Erfassung der Paramenter in Prozent:

Streetcompleteness kann ein völlig falsches Bild ergeben, da sich das Ergebnis immer nur auf bereits erfasste Objekte bezieht.
Extremes Beispiel:
Ort 1 : 1 von 20 Restaurants erfasst, 1x Veggie => streetcomplete 100%
Ort 2: 18 von 20 Restaurants erfasst, 9x Veggie => streetcomplete 50%

Ein schönes Beispiel für Pseudovollständigkeit. Erfahrungsgemäß ist das ein primitives Übertragen der PLZ von den vollständig erfassten PLZ-Gebieten auf die Einzeladressen. Die wenigsten dieser Angaben beruhen auf Ortskenntnis. (Jedenfalls kann ich das nur sehr selten vor Ort erkunden.)
Gehe einfach davon aus, dass die PLZ in D vollständig erfasst ist - das ist sie nämlich. (Datenfehler und laufende Änderungen gibt es natürlich trotzdem)

Ein anderes Beispiel für “Streetcompleteness” ist die Erfassung von oneway. Nachdem man sich in OSM-Urzeiten eigentlich für ein implizites oneway=no entschieden hatte, war im Grunde klar, dass nahezu alle Einbahnstraßen als solche erfasst waren. Jetzt wird an allen Nicht-Einbahnstraßen ein oneway=no drangepappt, damit man “weiß”, dass Vorgenanntes zutrifft. Der Mehrwert liegt ungefähr bei Null.

lanes=1 + oneway=no hat einen Mehrwert (oder motorway_link etc.). Dass das jetzt an alle Strassen drangepappt wird ist mir gerade neu.

Wenn man genau angibt um welche Parameter es sich handelt, dann ergibt es kein falsches Bild.
Es gibt Statistiken die kann man nicht abfragen. So wie du gesagt hast. Man kann nicht wissen ob alle Veggie Restaurants in OSM sind, aber es gibt andere, sinnvolle Abfragen. z.B. gibt es Öffnungszeiten für alle bestehenden Restaurants?

@Pyram Natürlich muss die darunter liegende Datenbasis einigermaßen stimmen und du hast ja gesagt das sie stimmt. Von daher verstehe ich nicht was du meinst.

Anstatt ständig auf die Unmöglichkeit eines Vorhabens hinzuweisen wäre es konstruktiver zu sagen was nötig ist um ein Vorhaben zu verwirklichen. Oder was man mit den gegebenen Umständen machen kann. Möglichst ohne latenten Perfektionismus und trotzdem mit hohen Qualitätsansprüchen. Das geht.

… oder das durchschnittliche Alter eines nodes oder ways, also wann zuletzt lage- oder wertemäßig angefasst. Kann man sicher schön bunte Karten draus machen … :roll_eyes:

… bspw. bei straßenbegleitenden Radwegen, da ist es vom Augenschein auf der Karte her kaum abzulesen, ob es ein Einrichtungsradweg ist und auf der anderen Seite fe_lt ein Radweg, oder ob es ein Zweirichtungsradweg ist, evtl. auch auf beiden Seiten der Straße, die Tage erst auf einen getroffen, der für ein Stückchen neu in Gegenrichtung freigegeben wurde, ein Grund mehr, ihn zu meiden …

War vielleicht etwas provokant, aber man findet schon immer mehr solcher ways: https://overpass-turbo.eu/s/1maH
Und beim von Dir genannten Beispiel mit lanes = 1 und motorway_link, ist es dummerweise so, dass das Implizite in dem Fall aufgehoben werden muss. Nicht schön im bestehenden Datenmodell.
Ich hoffe, dass wir dann bei Feldwegen nicht jetzt immer lanes=1 und oneway=no ergänzen wollen… Ach ja: ich kenne auch mindestens einen Feldweg mit Einbahnstraßenschild :stuck_out_tongue:

Es gibt Dinge, die kann man qualitativ und quantitativ abschätzen. Beispiele wurden genannt. Es gibt da auch sehr kreative Ansätze, wie es bei der Maproulette-Aktion mit den fehlenden Gebäuden in D umgesetzt wurde.
Aber ich bin gespannt, wie der konstruktive Vorschlag für etwas Unmögliches ausschaut. Aber wie heißt es so schön: Alle sagten, das geht nicht - und dann kam einer, der hat das nicht gewusst und einfach gemacht…

Das wurde doch bereits gesagt, dass es gerade bei Radwegen eher nützlich ist.

Wieso dummerweise? Bei einem motorway_link kann das nicht implizit sein, also schreibt man es dran.

"Einzel"Fälle, wo das eher Blödsinn ist, wird man immer finden, spricht aber nicht gegen oneway=no … ausser eben bei Einzelfällen oder an Feldwegen…

Der Ausschnitt zeigt überwiegend keine Radwege :roll_eyes:

Dummerweise deshalb, weil wir ein implizites Modell haben, aber man dann doch wieder Ausnahmen davon braucht (berechtigterweise, das bestreite ich ja gar nicht). Das macht die Datennutzung eben nicht einfacher.

Wenn jemand die Fahrbahnbreite schon erfasst hat (wie in vorstehenden Beispielen, wie https://www.openstreetmap.org/way/264103458/history ), dann - mit Verlaub - ist es in meinen Augen auch eher Blödsinn, wenn man dann glaubt, der Erfasser hätte das oneway übersehen und frägt per App “Add whether this road is a one-way road because it is quite slim” die Eigenschaft dann noch einmal explizit ab.

Aber das ist OT. Eigentlich geht es darum, wie vollständig irgendwas erfasst ist. Und das kann man bei dieser beispielhaften Eigenschaft bei impliziten Eigenschaften nicht wirklich feststellen.