Undiskutierter Import von Unternehmensdaten in Deutschland

So, was mich betrifft: Ich habe überzogen.
Walter meinte ich soll das Buch zumachen. War an der Stelle auch notwendig.
Ich bin auch ganz ehrlich darin zu sagen, daß für mich in dem Thread nur um den heißen Brei herum geredet wird und auch keinerlei Diskussion darüber stattfindet wie wir zukünftig damit umgehen.
Die Idee von Frederik hatte ich auch schon und trifft es auf den Punkt. Einzelne neue Mapper die behutsam ihre ersten Schritte machen können wir auffangen. Horden – ich nenne sie mal Externe – die hier einfallen können ganz anderen Ärger verursachen.
Ich habe hier überzogene Kritik geäußert. Überzogen in so fern, daß wir keine Richtlinien für Externe haben die eine solche harsche Kritik zuläßt.

Ich habe zu jeder Zeit an eine Lösung geglaubt und war überrascht dass hier so viele den „die haben kein Interesse mehr“ und „die sind eh raus“ Standpunkt vertreten haben.

Und zu guter Letzt:
Ich war in der Zwischenzeit nicht untätig. Siehe Mailaustausch mit icom78.
Und ich bin bezüglich der Datenquelle bin ich der Meinung, daß es in Ausnahmefällen ausreicht wenn ausschließlich die DWG die Quelle kennt.

Chronologisch von oben nach unten.

Guten Abend icom78,

vielen Dank für Ihre positive Nachricht. Hier meine Ausführungen.

Die Beiträge im Forum zeigen, dass es auch prinzipbedingte Vorbehalte gegen Ihr Vorhaben gibt. Z.B. der Quellennachweis für die Daten der fehlt. Es ist jederzeit möglich von Mitbewerbern angegriffen zu werden. Mitbewerber mit Millionen in der Portokasse. Daher ist eine lückenlose Dokumentation Pflicht.

In Ihrem Fall sehe ich das recht entspannt. OSM-Intern ist eine Zuordnung der Daten zu Ihrem Unternehmen jederzeit möglich. Reichlich Schriftverkehr gibt es auch. Nur für den Fall…

Ich möchte aber trotzdem ausschließlich auf technische Aspekte eingehen.

OSM hat hohe Qualitätsansprüche. In nicht seltenen Fällen fahren Mitstreiter an Ort und Stelle um Dinge zu klären. Da stecken Millionen Stunden Aufwand und Leidenschaft dahinter!

Und daher:

Eine der zentralen Befürchtungen ist das entstehen von doppelten Einträgen und/oder eine Verschlechterung der Datenqualität durch qualitativ minderwertige POIs.

Aufgabe Nr. 1 ist deshalb: Zunächst nach bestehenden Einträgen suchen. Zu beachten ist auch, dass POIs in OSM häufig an Flächen wie z.B. Gebäude gebunden sind! Sie könnten Overpass Turbo dazu einsetzen: http://wiki.openstreetmap.org/wiki/DE:Overpass_turbo

Des weiteren haben Sie natürlich die Möglichkeit sich die OSM-DB (bzw. Teile) zu besorgen und damit den Abgleich zu machen. Natürlich gibt es noch weitere Möglichkeiten und jede Menge Tools, usw.

Danach müssen die Problem-Datensätze händisch nachgearbeitet werden. Von Ihnen oder von der OSM-Community.

Leider ist es aber nicht so einfach! Wie hoch ist die Fehlerquote der nicht erkannten und der vermeindlich erkannten Problem-Datensätze? Viel schlimmer sind jedoch die, die mit gutem Gewissen importierten Datensätze, die jedoch völlig daneben geschlagen haben!

Ihr Import-Vorhaben kann ich stand jetzt daher nicht befürworten, Vor- und Nachteil nicht abschätzen.

Ihr wichtigstes Anliegen (wenn ich das richtig sehe) ist ein anonymisierter Import. POIs sollen nicht Ihrem Unternehmen zugeordnet werden können.

Die Idee besteht ja darin das über Dummy-Benutzerkonten zu machen. Für den Fall, dass sich OSM darauf einlässt wird es eingeweihte geben die diese Konten kennen und somit Ihre kompletten Daten exportieren können. Da Ihr Import-Bot ein leicht zu erkennendes Verhaltensmuster hat (deshalb sind Ihre Importversuche auch im Handumdrehen aufgeflogen) werden auch pfiffige OSMler (da gibt es einige davon!) in der Lage sein Ihre kompletten Daten zu extrahieren.

Gegenüber OSM wird Ihre Verschleierung deshalb absolut nichts bringen!

Der Vorschlag: Sie übergeben einem federführenden und bereitwilligen OSMler Ihre kompletten zu importierenden Daten. Der Abgleich/Prüfung, händische Nacharbeit und ein anonymisierter Import findet dann auf Seite von OSM statt.

Sie mögen vielleicht Zweifel haben ob das der richtige Weg ist, da sie ja Ihre Rohdaten außer Haus geben müssten. Wie beschrieben können diese ja auch leicht extrahiert werden.

Auf Seiten OSM-Community werden die Zweifel mindestens so groß sein! Das würde bedeuten, dass nämlich OSM „Ihren Job“ macht – nämlich den Kompletten vom Abgleich bis Import. Da wird zurecht die Fragen aufkommen ob sich der Aufwand überhaupt lohnt!

Lohnt sich denn das ganze? Sie schreiben von exzellenter Datenqualität, da ja die Kunden selbst die Daten pflegen. Wie sieht es wirklich aus?

Mein konkreter Vorschlag ist: Sie übermitteln uns mustergültige Datensätze von verschiedenen Firmen/Kunden. Sehr wichtig ist auch zu wissen um wie viele Datensätze es tatsächlich geht!

Die nächste Beratungsrunde von OSM (im Forum) wird sich dann mit der Frage ob und wie auseinander setzen.

Für mich gesprochen: Ich befürworte nur dann weitere Schritte und weiteres Nachdenken, wenn ich den Eindruck habe, dass die Datenqualität stimmig ist!

Daher die Bitte mustergültige und reale Datensätze – und dabei lieber zu viel als zu wenig – an uns zu übermitteln. Details müssten dann noch geklärt werden.

Ich hoffe Sie können mit meinen Einlassungen etwas anfangen.

Freundliche Grüße aus Düsseldorf,
EinKonstanzer

PS: Es gib einen neuen Schlüssel: advertising:text Dort wäre der werbende Text besser aufgehoben als unter „description“. Siehe: http://wiki.openstreetmap.org/wiki/Proposed_features/advertising

Lieber EinKonstanzer,

herzlichen Dank für Ihre Unterstützung.

Diese Informationen helfen uns in jedem Fall bei der Lösungsfindung weiter. Ich möchte Sie wissen lassen, dass wir auch intern sehr intensiv darüber diskutiert haben. Die einhellige Meinung bei uns: Wir möchten in jedem Fall erst mit einer neuen Lösung starten, wenn wir eine Datenübermittlungsqualität erzielen [Zensiert] … [/Zensiert] mit der die OSM Community zufrieden ist. Ich hoffe, dass die OSM Community sich bis dahin noch gedulden kann, da [Zensiert] … [/Zensiert].
Bis dahin, nochmals danke für Ihre Tipps.

Mit freundlichen Grüßen / Kind Regards
icom78

Guten Tag icom78,

Sie können jederzeit wieder auf OSM zukommen. Gutes Datenmaterial ist immer willkommen!

Hier noch ein kleine OSM-Story:
Da die USA noch ein recht großer weißer Fleck war kam man auf die Idee doch einfach die freien TIGER-Daten (http://wiki.openstreetmap.org/wiki/TIGER) zu importieren.
Jemand hat nachgerechnet und kommt zum Ergebnis (https://www.openstreetmap.org/user/bdiscoe/diary/35113), dass es noch 32 Jahre dauern wird, bis der Import bereinigt ist, wenn es in dem Tempo weiter geht…

Für die Community könnte unserer Austausch ganz interesant sein.
Ich möchte diesen gerne vollständig anonymisiert ins Forum stellen.
Spricht von Ihrer Seite etwas degegen?

Grüße,
EinKonstanzer

Hallo EinKonstanzer,

dann hoffe ich, dass ich noch 32 Jahre lebe oder es schneller geht… :slight_smile:

Zu der Veröffentlichung unseres Austauschs:
Das ergibt großen Sinn. Die OSM Community sollte schließlich von jeglichem Ideenaustausch mit profitieren.

[Zensiert] … [/Zensiert]

Viele Grüße aus Berlin,
icom78

Gleiches Recht für alle. Dann müssten semi-anonyme Edits eingeführt werden (“Benutzername verstecken” in den persönlichen Einstellungen).

Es geht nicht allein um die Quelle oder die Qualität der Daten sondern auch um das typische Verhalten solcher Firmen, die dutzende von Empfänger-Netzwerken bedienen wollen und deshalb (zu) wenig Sorgfalt in die “Übersetzung” ihrer Daten in das jeweilige Netzwerk legen. Du hast wahrscheinlich - was kein Vorwurf ist - noch nicht erlebt, mit welchem Unfug zu rechnen ist, wenn deren automatisierte Schnittstellen loslegen. Ich habe das erlebt.

Ja, das war nämlich keine Antwort auf meine Frage.

Wenn wir on-the-ground leben wollen, dann darf der Value von advertising:text=* nur der Text sein, der vor Ort am POI angebracht ist (also z.B. unter dem Firmennamen auf dem Firmenschild und nicht Bestandteil des Namens ist).

Das hast du da reingeschrieben. Ich sehe keine Diskussion dazu noch das der von irgendjemandem benutzt wurde.

Bei der Regel on the Ground dürfte es dir schwer fallen viele Dinge im Eisebahnwesen zu begründen. Dazu gehören ganz klar Kursbuchstrecken Weichennummern etc. Aber auch die ÖPNV Linien stehen so nicht auf den Gleisen und der Straße. (trifft wie oft zitiert auch auf die meisten Grenzen PLZ oder administrativ zu)
Ich finde das Argument ist einfach abgedroschen und wird je nach Standpunkt ausgelegt. Anders ist es wenn sich das auf dem Grund von dem in den virtuellen Daten unterscheidet.

Wie wahr!

Gruß,
Zecke

Der Grundsatz heisst “Verifizierbarkeit” - wenn jemand was einträgt, was man ihm “einfach glauben” muss, weil es praktisch nicht überprüfbar ist, oder nur mit Zugang zu Spezialquellen (“rufen Sie doch beim Wanderverein an, der wird Ihnen bestätigen, dass der Wanderweg hier lang führt”), dann ist das grenzwertig. Bei einer ÖPNV-Linie ist die Überprüfbarkeit wenigstens noch halbwegs gegeben - ich kann mich an die Strasse setzen und aufzeichnen, was für Busse vorbeifahren, oder ich kann mich in einen Bus setzen und prüfen, wo er langfährt.

Ja, es sind Grauzonen, aber nur, weil es Grauzonen gibt, kann die Regel deswegen nicht komplett ignoriert werden. Auch im Recht gibt es immer wieder Grauzonen, aber deswegen schmeissen wir einen Paragraphen nicht gleich weg.

Ja, wir machen Ausnahmen von dieser Regel - z.B. ja auch bei PLZ-Gebieten oder Admingrenzen. Aber auch das heisst nicht, dass die Regel deswegen aufgehoben ist.

Im konkreten Fall geht es aber um eine noch weitergehende Frage, und zwar darum, inwiefern wir Werbung in OSM erfassen. Und da würde ich gern in der anderen Richtung von der “on the ground”-Regel abweichen: Selbst wenn ein Laden in seinem Schaufenster einen DIN A4-Zettel mit einer Werbebotschaft kleben hat (“Probleme mit Flecken auf Ihrem Teppich? Unser Fleck-Ex-Team kommt zu Ihnen ins Haus für nur EUR 69,- - Zufriedenheit garantiert!”), ist das in meinen Augen noch kein Grund, diese “Information” in OSM zu erfassen. Zwar wäre es mir egal, wenn ein einzelner Mapper aus übertriebenem Eifer mal sowas erfasst, aber es öffnet dem Missbrauch Tür und Tor, und ich will nicht, dass OSM zum Spielball von SEO-Dienstleistern aller Art wird.

Bye
Frederik

Wobei die Frage zu stellen ist, wollen die Dienstleister diese Informationen wirklich in OSM einbringen? Mich persönlich würde es stören, wenn ich solche Infos von einer neutralen Stelle - sei es OSM, sei es google - bekommen würde. Ebenso denke ich, wenn ich meinen eigenen Laden, wo eintrage. Je nach Umfeld. Und bei OSM hielte ich es für einen Schuss in den eigenen Fuss, irgendwelche werbende Texte an den POI zu hängen.

In der Praxis geht es um den Schlüssel description. Eine “Beschreibung” ist dabei in meinen Augen ein Text, der von einem neutralen Standpunkt aus eine wertfreie Betrachtung versucht, die den Kartenlesern zusätzliche Fakten oder Hintergrundwissen liefert.

Die typischen Einträge der SEO-Dienstleister sind jedoch nicht faktenzentriert sondern wertend, vergleichend - weil sie halt Werbung sind. Typische Texte lauten “Als Ihr starker Finanzpartner in der Region bietet Ihnen XYZ ein dichtes Netz an Filialen und SB-Einrichtungen sowie einen umfangreichen Online-Service” oder "Kennen Sie das Gefühl, wenn Sie die ersten Schneeglöckchen aus der Wiese spitzeln sehen o. Sie im Sommer im Schatten Ihres Kirschbaumes ruhen? Dann wissen Sie: Sie sind angekommen- an Ihrem Rückzugsort. Wir beraten Sie mit all unserem Wissen. Voller Kreativität,aber vor allem einem: Liebe zum Detail."oder “Nahe am Zentrum XYZ und unmittelbar von der Autobahn zu erreichen liegt die Pension am ZXY. Sie können in wenigen Gehminuten Restaurants und ein großes Einkaufszentrum erreichen. Direkt neben der Pension liegt ein Bäcker/Bistro und eine Indoor-Soccer-Arena.”

Aber auch in einem anderen, vielleicht extra dafür geschaffenen Feld hätte das in OSM kein Platz. Denn OSM würde damit seinen neutralen, die Welt aus der Sicht einer Karte beschreibenden Platz verlassen und Werbeplattform werden. So was erwartet aber niemand von OSM. So was würde Mitbewerber auf den Plan rufen und eine Lawine lostreten und den Datenbestand auf Dauer komplett entwerten können. So was hat in OSM deshalb keinen Platz.

Ja, da bin ich voll bei Swen und Frederik - dieses Werbegeschwurbel hat bei uns keinen Platz.

Die POI-Daten - welcher Geschäftstyp ist das, wo genau, welche Öffnungszeiten, Kontaktdaten - sehr wohl!

Das ist ja ganz nett. Aber im Prinzip heißt der Satz das kleine Flüsse/Bäche keine Namen tragen. Es heißt auch das ich im Zweifelsfall nicht irgendjemand fragen muss, weil wenn das jemand verifizieren möchte nicht mehr da ist. Also ich denke man kann sich damit ganz schön verrennen.
Dein einziges Argument gegen dieses Tag ist der mögliche Mißbrauch für SEO. Oder habe ich da noch etwas übersehen?

PS und ab wann ist es denn verifizierbar? Diese Werbebotschaften werden dann auf den gängisten Platformen gelistet sein.

Ja, das ist nicht immer ganz leicht mit der Verifizierbarkeit. Solang es zu keinem Streit kommt (A: “Das ist der Goldbach.” B: “Nein, Goldbächle heisst der.”), fällt es auch nicht so auf, wenn was un-verifizierbares eingetragen ist.

Naja, eine Werbebotschaft könnte ja sogar 100% verifizerbar sein, wenn der Shop sie auf einen kleinen Zettel druckt und in sein Schaufenster legt. Mit der Behauptung “nicht verifizierbar” könnte man das dann nicht ablehnen. Sagen wir so: Ich halte es für wenig nützlich, die Werbebotschaft eines Unternehmens zu erfassen. Es sind keine Geodaten, es dient nicht der Orientierung, es ist kaum maschinell verarbeitbar, es kann kaum vernünftig aktuell gehalten werden und wird sich in aller Regel oft ändern, usw.usw.usw. - Das sind alles für sich genommen keine Gründe, und normal würde man sagen, wenn ein Mapper irgendein Detail partout erfassen will, soll er doch. Aber kombiniert mit der Gefahr des SEO-Missbrauchs überwiegen bei mir die negativen Aspekte, und ich bin bereit, die Freiheit der Mapper zum Mappen von Werbebotschaften zu beschränken, um OSM nicht der SEO-Maschinerie auszuliefern.

Bye
Frederik

+1 und wenn es gelingt, aus “ich bin bereit” ein “wir sind bereit” zu machen, ein doppel-plus.

In dem Zusammenhang würde mich mal interessieren, ob das ein lokales (deutsches) Problem ist, oder ob das unsere ausländischen Kollegen ganz anders sehen. Das Thema ist so wichtig, da sollte ganz OSM einer - starken - Meinung sein.

Gruss
walter

Ja, zunächst den Unterschied zwischen “Dieser Bach heißt Goldbeek” vs. “Dieser Bach heißt Fischbach” einerseits und “Kennen Sie das Gefühl, wenn Sie die ersten Schneeglöckchen aus der Wiese spitzeln sehen (…)” andererseits. Letzeres ist nicht verifizierbar. In jedem beliebigen Adress- / Telefon- / Branchenverzeichnis/ (Gelbe Seiten) wird zwischen den verifizierbaren Kontaktdaten und den in Anzeigen zu schaltenden Werbeaussagen unterschieden. Es fällt mir ehrlich gesagt schwer zu verstehen, warum ausgerechnet OSM ein (und dann noch nicht mal entgeltpflichtige) Werbeträger werden sollte.

Bleibt der Eintrag von unstrittigen Sachinformationen (z.B. in ein POI-Node): Hier kann ich nur darauf verwiesen, was ich hier und hier schon gesagt habe: die automatisierten Einträge (und nicht anders als automatisiert werden die erfolgen) solcher Firmen sind eine fortwährende Fehlerquelle.

Es geht auch regelkonform, ohne dass wir was an den bestehenden Verfahren ändern müssten. Auf diese beiden Beispiele macht Stephan75 gestern auf dem Lüneburger Stammtisch aufmerksam:

  • Die Daten werden uns “gespendet” und von “normalen” Mappern manuell übernommen (Beispiel Rossmann)
  • Vorhandene Daten werden zentral überprüft und zunächst die fehlende Schnittmenge importiert und anschließend das vorhandene Tagging verbessert (Beispiel Aral)

Verläuft das jetzt im Sand? Hat das Unternehmen aufgegeben, ist er genervt, macht er weiter wie gehabt oder arbeitet er an nem Kompromiss? Fragen über Fragen :wink:

Meine Dienste/Quellen haben bislang keine verdächtigen Aktivitäten entdeckt. Daher ist erstmal oder dauerhaft Ruhe. (Die Dienste gehören nicht mir) Es soll aber User geben, die eifrig an SEO-Warnern arbeiten.

Halb-OT: Der Account synup gehört nicht zu der Firma aus Berlin. Er wurde von der DWG mittlerweile für 10 Jahre gesperrt.

Genau, aber meiner seiner findet auch noch nix von denen. Sonst hätte ich bestimmt schon laut gerufen mich bestimmt schon gemeldet.

Gruss
walter