SimpleGEO POI-Datenbank unter CC0-Lizenz

Laut der OSM-Wochennotiz Nr. 55 (http://blog.openstreetmap.de/2011/08/osm-wochennotiz-nr-55) hat SimpleGEO ihre POI-Datenbank mit 21 Millionen POIs unter der CC0 Lizenz veröffentlicht (genauer für Deutschland 1.930.070 Punkte). Nein, ich habe nicht vor diese Punkte (egal mit oder ohne Kontrolle) zu importieren, da ich nicht weiß wie simpleGEO die Geo-Daten gesammelt hat. Obwohl ich dazu (außer im Forum von Israel) keine Kommentierung gelesen habe, gehe ich aber davon aus, dass man die Daten durchaus zur Vollständigkeitsprüfung verwenden darf. Auch sollte eine Vervollständigung von Adresse und Telefon-Nummer bei Vorhandensein des Objektes möglich sein.

Denn es gibt schon zu bedenken, dass im SimpleGEO Datenbestand 24.722 Punkte mit den Stichwort Bank bzw. Sparkasse existieren und in OSM-Deutschland-Datenbestand nur 19.524 (78,97%) mit dem Tag amenity=bank. Wobei gerade Abstandsbestimmungen beim Beispiel Bank kritisch ist, da Bankhäuser auch mal gerne Tür an Tür liegen (gemeinsame Datenpunkte bei den Wegen) [Ich habe in den letzten Tagen doppelte Knoten in diesem Umfeld bereinigt]. Mit einer entsprechenden Aufbereitung nach Orten könnte man mal eine oder mehrere entsprechende Wochenaktion starten.

Was ist Eure Meinung zum Thema Verwendbarkeit des Datensatzes und -wenn Interesse an den Wochenaktionen besteht- welche Daten sind einer Kontrolle wert?

Kann man sich diese POIs irgendwie anzeigen lassen oder gibt es da nur die Datenbank zum Herunterladen?

Gruß,
Mondschein

HI,

die Datei von 2 GB Grösse hab’ ich mir noch nicht runtergeladen, vermute aber, der Inhalt würd’ z. B.
den POIs von
https://simplegeo.com/products/places/#10.00/49.9697/10.9272
entsprechend, wenn man in der rechten Leiste unten auf einen der “Places” klickt.

Ciao,
Frank

Ich hab mir das runtergeladen und schreibe gerade an einem Programm, was einem die Punkte in ein anderes Format (gpx oder osm, muss ich mal sehen) umwandelt, sodass man die sich zum Beispiel in JOSM laden kann. Das Programm kann ich dann zur Verfügung stellen und könnte auch einzelne Auszüge zum Download anbieten.

Das Programm wird wahrscheinlich noch heute fertig…

Die Datei beinhaltet alle Länder, die Datei für Deutschland mit den Daten in json-Format umfaßt 207,3 MB. Bei Interesse kann ich einzelne Datei für Deutschland oder die Erzeugungsstatements für eine MySQL-Tabelle (hier auf eine PLZ begrenzt) zur Verfügung stellen.

Ich arbeite gerade an einen Auszug von Banken in den drei PLZ 53111, 53227 und 53639 und bin auf so ziemlich alle Fehlerquellen gestoßen, die eine große Datensammlung von Adressen besitzen kann. Aber auch der Abgleich der Daten ist möglich. In Kürze werde ich dDie Analyse steht auf meiner Homepage http://www.familieverweyen.de/check_bank_simplegeo.php zur Verfügung stellen.

So, das Programm ist fertig:

http://github.com/rurseekatze/simplegeo2osm

Infos zu den Parametern bekommt man, wenn man das Programm ohne Parameter aufruft.

Es können gpx und osm Dateien erzeugt werden. Bei den OSM-Dateien muss man aber höllisch aufpassen, dass man die Datei in einer anderen, nicht aktiven Datenebene lädt, um nicht alle Punkte hochzuladen. Zur Sicherheit nimmt man daher besser gpx, wobei dort wiederum die Zusatzinfos zu den Punkten fehlen.

Damit nicht jeder die Datenbank herunterladen muss, erzeuge ich auf Wunsch Ausschnitte für ausgewählte Städte.
Man kann sie sich dann hier herunterladen: http://rurseekatze.bplaced.net/simplegeo2osm/

Cool, man darf sich was wuenschen :slight_smile:
Dann wuensch ich mir Nuernberg, aber bitte als .osm und nicht als .gpx

Danke schoen.

Ciao,
Frank

Nürnberg ist fertig.

Woopsi, dass ging aber flott :wink:

Vor allem deine Antwort war flott: 2 Sekunden später!

Das Script braucht vielleicht eine Minute zum Durchlaufen, daher mache ich das auch mit Städten nach Wunsch. Ist sinnvoller als dass sich jeder die 2GB herunterladen würde nur weil er eine Stadt braucht.

BITTE bei dem Umgang mit diesen Daten immer daran denken, dass sich solche Daten in der Regel nicht zum direkten Eintragen eignen sondern viel mehr dazu, Orte zu finden, die man sich in Realität einmal anschauen könnte, weil da noch Infos fehlen könnten.

Richtig, daher ein Tipp: Nur in Gegenden verwenden, die man selbst gut kennt und in denen man die Daten vor dem Eintragen kontrollieren kann. Ich habe schon einige veraltete Einträge gefunden und auch Einträge, die einige 100km weit weg lagen, weil die Adresse fehlerhaft war!

Yep, auf dem ersten Blick ist ersichtlich, dass da mind. 50 Einträge für Nürnberg weit außerhalb der
Stadtmauer sich befinden :wink:
Desweitern müßten (fast) alle Telephoneinträge mit +49 911 beginnen, was bei nicht allen stimmt.

Aber es gibt auch sehr gute Treffer mitten ins Gebäude :wink:

Ciao,
Frank

na ja, solange die Schäden an der Bausubstanz nicht zu gross sind :wink:

Kurze Frage zur Quelle und damit der Qualität der Daten:
Weiss jemand, woher die Daten wirklich kommen? Ich hab auf deren Seite von “ca 15.000 Mitarbeitern” gelesen - das kann ja nur irgendeine Cloud sein, oder?

Gruss
Walter

Ja, dass würde mich auch interessieren.
Soweit ich bisher gesehen habe, sind weit über 90 % der "POI"s Firmen
und darunter mit einigen “Verwaltungs GmbH” relativ “langweilige Büros”.

Wer sammelt denn sowas freiwillig? :wink:

Hi Walter,

meinst Du diese Stelle?
… More than 15,000 developers use the platform …

Das sind keine Mitarbeiter, dass sind Kunden von SimpleGeo (z. B. Hersteller von location-aware Apps),
SG lässt sich den Zugriff auf ihre Daten (sprich die API-Requests) bezahlen.

Was die “business data” betrifft, denk’ ich, haben sie es von irgendjemand eingekauft …
(meine ganz persönliche Vermutung)

Ciao,
Frank

ja, die meinte ich. allerdings hab ich nach dem Wort “developers” nicht weitergelesen :frowning:

wie dem auch sei:
Die Daten sind sehr schrottig und ich fasse das ganze inzwischen als eine Marketing-Aktion dieser Firma auf:

“Verschenke Schrott und rede Gutes drüber”.

Gruss
Walter

Bis auf ein paar Restaurants, Banken, etc. sind es praktisch nur Firmen die meiner Meinung nicht wichtig genug für OSM sind.
Aber den ein oder anderen Punkt habe ich doch noch gefunden…