Bing spendet OSM 125 Mio Gebäudeumrisse (USA)

https://github.com/Microsoft/USBuildingFootprints

Vielleicht gibt es ja irgendwann etwas Ähnliches für Europa.

Die Umrisse sind automatisch generiert, ähnlich Tracer2. Für die notorisch untergemappten Vereinigten Staaten ist das ja ganz nett, für Europa m. E. kaum brauchbar.

Wenn man so einem Projekt schwer schaden will, dann gibt es nichts Besseres (siehe TIGER). Auch Frankreich hat kaum lokale Mapper, weil es irgendwie sinnlos ist, seine Orskenntnis einzubringen, wenn gelegentlich einfach Katasterdaten ungeprüft in die Datenbank gekippt werden…

Cool! Die Umrisse wurden aus den Satellitenbildern generiert, d.h. die Polygone sind (maximal) so gut wie die Satellitenbilder.
Ich glaube TIGER ist/war eine andere Chose, oder? (Nicht basierend auf Satellitenbildern)

Jo, die TIGER-Daten stammen teilweise aus Freihandzeichnungen und so sehen die auch aus. Außerdem gibt es dort sehr viele Straßen, die einfach nicht existieren, oder die Daten sind teilweise veraltet (eine Insel im Pazifik, die seit den 1970er-Jahren komplett verlassen ist, hatte in TIGER noch ein vollständiges Straßennetz!)

Die Hauptverkehrsstraßen sind in TIGER schon recht gut. Schlimm wird es bei Nebenstraßen und residentals. aber ein großer Vorteil gibt es, alles Straßen haben einen Namen und andere Daten, die wir alle noch mühsam finden müssen, Spuren etc.

Ich bin da ja immer arg zynisch. Ich will eigenlich keinen computergenerierten Müll in OSM. Wenn OSM irgendwann zu 90% aus “deep learning”-Material besteht, können die Googles und Bings dieser Welt auch einfach ihr Bildmaterial in ihre “Deep Learning”-Engine kippen und mit den 90% arbeiten, die da hinten rauskommen, ganz ohne diese lästige OSM-Community und ihr Share-Alike. Und das beste, die OSM-Community hat ihnen sogar noch geholfen, ihre Maschinen zu perfektionieren, indem wir die Experimentierdaten, die sie uns vorsetzen, eifrig korrigieren…

Aber bestimmt ist das alles nicht so, und in Wahrheit stecken hehre Motive dahinter und eine Win-Win-Situation für alle.

Wobei ich mir auch vorstellen kann, dass es in einem großen Konzern wie Microsoft auch gar nicht so einfach ist, “mal eben” so einen Datensatz zu Verfügung zu stellen. Das Angebot finde ich also durchaus gar nicht schlecht!

Ich teile durchaus die Bedenken, in erster Linie aber weil es sich um einen ziemlich großen Datensatz handelt. Hier in Rostock hatten wir damals ja auch (verunschärfte) Gebäudeumrisse gespendet, die dann Stück für Stück durch die lokale Community integriert wurden. Das funktionierte mit der passenden Betreuung also ganz gut und half, dass wir dort zum Beispiel auch Gebäudehöhen und 3D integriert werden konnten. Auch konnten sich Mapper so mehr auf die Pflege weiterer Objekte und Fortführung konzentrieren, will sagen die Arbeit besser fokussieren.

Wahrscheinlich erst einmal abwarten was die Community in den USA darüber denkt…

Wenn man sich das Beispielbild unter dem Link ansieht hab ich den Eindruck die Fotos sind auch höher Aufgelöst als das was wir hier so an Bing Bildern haben. Könnte also durchaus sein, dass die Qualität gut an von Hand abgemalte heranreicht.

Trotzdem muss natürlich eine manuelle Kontrolle stattfinden.

Wenn man den Abschnitt im Link

Should we import the data in to OpenStreetMap?
Maybe. Never overwrite the hard work of other contributors or blindly import data in to OSM without first checking the local quality. 
While our metrics show that this data meets or exeeds the quality of hand drawn building footprints, 
the data does vary in quality from place to place, between rural and urban, mountains and plains, and so on. 
Inspect quality locally and discuss an import plan with the community. 
Always follow the OSM import community guidelines.

ernst nimmt, hört sich das vernünftig an.

Natürlich macht Microsoft das nicht aus Nächstenliebe, sondern um Google (Maps) wenigstens etwas Paroli bieten zu können.
Wenn sie deshalb OSM unterstützen wollen, kann das eine win-win-Situation sein.
Wir nehmen ja auch die Bing-Bilder in vielen Regionen dankbar an.

Der Datensatz von Microsoft ist halt ein Werkzeug wie ein Hammer oder Messer. Man kann damit gute Arbeit machen oder destruktiv sein. Was das Argument betrifft, wir würden die Machine Learning Modelle trainieren, sehe ich das entspannter. Dazu brauchen Sie uns die Daten nicht geben, sondern könnten ihre Ergebnisse mit den bereits millionenfach vorhanden Gebäuden in OSM vergleichen…ausser in Gebieten, die von HOT bearbeitet wurden :wink:
Ob ML/AI jetzt Fluch oder Segen ist, wird sich zeigen. Ich schätze die Wichtigkeit von Metadaten wie Hausnummer oder Straßenname, die auch der beste Algorithmus nicht aus Luftbildern erkennt, höher ein als 10%.
Auffällig ist allerdings die Häufung - Telenav, Mapbox unf Facebook mit ihren Versuchen, automatisiertes Mapping in OSM zu pushen…siehe Wochennotiz

Mhh.
Ich hab jetzt mal 50.000 gespendete “Gebäude” in Alaska stichprobenartig nach Gebäuden durchsucht … waren 2 Stück dabei, der Rest war irgendwas.
Beispiel für eins der 2 gefundenen Gebäude aus dem Datensatz:

Quote grob übern Daumen: 1 von Hundert ist ein echtes Gebäude … trotzdem falsch (siehe Screenshot)

Nachtrag: Nochmal 10000 Gebäude im District of Columbia überflogen, dort ist die Quote anders rum, allerdings haben wir trotzdem bessere Gebäudeumrisse. Der verwendete Algorithmus ist zu grob.

Hast du die Sache bei Github gemeldet? Vielleicht bringt das nichts, schaden kanns aber auch nicht.

Gute Idee. Edit: fixed

Habt ihr auch den Fehler bei runden Gebäude festgestellt?

Hat jemand auf Twitter u.a. angemerkt:
https://twitter.com/HarelDan/status/1013100594268200960

Auch gesehen:

Vergleich mit OSM (Import)/NYC Daten für New York:
https://dancooksonresearch.carto.com/u/dancookson/viz/a4134492-ec62-49d3-a460-2868e788a96e/embed_map

Gesamtkarte (Schwarzplan USA) in niedriger Auflösung:
https://kannes.github.io/usbuildings/

Für ein Basiskartenwerk, wie OpenStreetMap, ist die Qualität vermutlich nicht geeignet. In kleinen Maßstäben oder für generalisierte Printkarten sind es natürlich genial, da flächendeckend.

Das ist noch die alte 1.0-Version mit lauter Macken!