Undiskutierter Import von Unternehmensdaten in Deutschland

[Moderator Hut auf]

@Göre: Falls Du es tatsächlich noch nicht wissen solltest: Es gilt im Netz als universell unerwünscht und sinnfrei, einen langen Post vollständig zu zitieren nur um dann einen Minimal-Kommentar drunterzuschreiben.

Bitte unterlasse sowas.

bye, Nop

Generell habe ich nichts an Bots oder Importen auszusetzen. Aber…
Ich gehöre hier selbst zu den Erfassern entsprechender POIs.
Das ganze ist alles andere als einfach.

  • Manchmal hängt die Info an einem POI manchmal am Gebäude.
  • Der eine schreibt KFC, der andere Kentucky Fried Chicken.
  • Für den einen ist Wirtshaus XYZ hauptsächlich eine Kneipe (in dem es auch was zu Essen gibt), für den anderen ein Restaurant.
  • Der eine schreibt “ALDI”, ein anderer “Aldi”.
  • Auf dem Schild steht „Wäscherei P. Mustermann GmbH“. Es ist nicht falsch diesen Namen in OSM zu verwenden. Man kann jedoch auch einfach „P. Mustermann“ nehmen da sich die Art des Geschäftes über shop=laundry ergibt und die korrekte Firmierung nicht unbedingt im Namen stehen muss.

Nur mal so ein paar einfache Beispiele…

Selbst wenn die Qualität des Materials 100% korrekt ist, wird es praktisch unmöglich sein Mehrfacheinträge und sonstiges auszuschließen.

Jeglicher Versuch automatisierte Importe in dem Bereich zu machen geht zu 100% daneben!

Diese blöde Geheimniskrämerei geht mir gegen den Strich. Und die Art und Weise wie das hier gelaufen ist zeigt, dass keiner in dieser ominösen Firma eine Ahnung von OSM hat. Die Probleme mit Mehrfacheinträgen, usw. durch automatisierte Imports sollten hinlänglich bekannt sein - besonders Leuten die sich mit Datenbank beschäftigen. Da frage ich mich: Mangelnde Professionalität oder Ignoranz???

Und an die ominöse Firma gesagt:
Hier bei OSM werden Einträge der Art von Personen vor Ort ermittelt und händisch gepflegt. Dies Führt zu einer sehr sehr guten Datenqualität bei OSM.
In den diversen Brachchenbüchern findet man häufig Quatsch. Doppelte und veraltete Daten, völlig örtlich deplazierte Einträge und Einträge zu Geschäften, die es schon seit Jahren nicht mehr gibt. Mal etwas importieren geht ja ganz schnell…
Sollten sie ihr Verhalten und ihre Haltung zu OSM nicht ändern, dann verzichten wir gerne auf ihre Daten!

Ich glaube einige hier verstehen wirklich nicht warum die Frima das nicht macht… das wäre nämlich 1:1 eine Liste all ihrer Kunden.

IN JEDEM ANDEREN UNTERNEHMEN WÜRDE MAN FÜR DAS VERÖFFENTLICHEN DIESER SOFORT GEFEUERT WERDEN UND HÄTTE EIN GEREICHTSVERFAHREN AM HALS!

Und deswegen wollen sie hier wohl auch nicht ihrnen Namen nennen weil es dann bei google auftaucht und leicht für die Konkurrenz zu finden wäre. Gleiches problem, wenn man irgendwo eine schöne Übersicht im Wiki mit den Accounts hat.

Wenn ihr das als Community nicht akzeptieren könnt, dann wird es vermutlich problematisch sich hier zu einigen und diese wertvollen Daten in die Datenbank zu bekommen… außer die Firma entscheidet sich dann doch uns eine komplette Excel Tabelle zu geben, was im Endeffekt der erste Schritt wäre um hier überhaupt irgendwie weiterzumachen und Import/Datenpflege genauer zu diskutieen.

Wertvoll? Dieser Werbekram, den wir händisch nachbearbeiten müssen? Wohl eher nicht. Das ist Datenmüll. Wenn’s gut gemacht ist und keine Werbung drin, dann bin ich dafür, aber so: dagegen.

Du meinst, dass die Firma eine Liste aller ihrer Kunden im Internet veröffentlichen will, ohne eine Liste aller ihrer Kunden im Internet zu veröffentlichen?

Wer ein bisschen Ahnung von Datenverarbeitung und Interesse daran hat, bekommt heraus, wer die Kunden sind und wie die Firma heißt. Oder er schreibt einfach den einen oder anderen Import-Account an und bittet um eine Kontaktmöglichkeit.
Soll ja schon mehrfach geschehen sein in diesem Fall :slight_smile:

Diese Quadratur des Kreises erinnert mich stark an die kürzlich exklusiv auf der Mailingliste veröffentlichten Umfrage. :stuck_out_tongue:

Das ohne Werbung zu machen, wurde bereits von der Firma in ihrer allerersten Antwort vorgeschlagen.

(Hervorhebung von mir)

Das dürfte also nicht (mehr) das Problem sein. Die Qualität an sich ist noch nicht ok, aber das kann man verbessern.

Gruss
walter

ps: erst lesen, dann motzen :wink:

“Wertvoll” ist eine Sache des Blickwinkels.

Wenn ein Unternehmen mehr 30 Plattformen mit Daten versorgen möchte. dann wird es schon aus Effizienzgründen nur einmal die Stammdaten des POI (oder was auch immer) erheben und dann > 30 mal die Daten in verschiedene Endformate umwandeln müssen. Da sind Fehler kaum auszuschließen. Da steht eher zu erwarten, dass POI “abgekippt” werden - mit den schon mehrfach beschriebenen Qualitätssicherungsproblemen (Umzug, korrektes Tagging, korrekte Verortung, Dubletten etc.) Um bei den zu erwartenden Preisen gegenüber dem Kunden die Dienstleistung anbieten zu können, ist, wie schon bei der Umwandlung der Daten, ein möglichst automatisiertes Verfahren beim Übertragen der Daten in die OSM-Datenbank die (betriebswirtschaftlich nachvollziehbare) Folge. Sprich: automatisiertes Verfahren ohne individuelle Kontrolle.

Ich kann aus anderen Netzwerken berichteten, dass solche Unternehmen in ihrem Massengeschäft nicht mal Qualitätsverbesserungen Dritter beachten. Da werden dann gern mal die von (ehrenamtlichen) Nutzern korrigierten Öffnungszeiten oder das verfeinerte Tagging beim nächsten maschinellen “Überprüfungslauf” gnadenlos überschrieben, gelöschte oder geschlossene POI erneut angelegt.

Wäre das “wertvoll”?

Wenn das auch hier so abläuft, wäre ich natürlich ebenfalls sauer. Bisher sehe ich die Sache aber noch positiv und bin auf die technische Diskussion ab Morgen (?) gespannt.

Solches “Überpolieren” vorhandener und somit akzeptierter Daten wird bei uns ja als Vandalismus eingestuft. Und dagegen haben wir unsere Mittelchen.

Gruss
walter

Das halte ich für eine - die einzig geeignete Möglichkeit das sauber hinzubekommen. Excel-Tabellen nach Postleitzahlen sortiert z.B.
→ Händisches Einpflegen jedes einzelnen Eintrags.

Ich schätze die Qualität ebenfalls als grottig ein. Es wird ein ziemlichler Aufwand sein das bei uns einzupflgen. Es wird notwendig sein jeden einzelen Eintrag händisch auf Gültigkeit zu prüfen.
Und genau wegen diesem Aufwand, auf den die keine Lust haben bzw. das Geschäftsmodell nicht hergibt werden solche Bullshit-Importe gemacht.
Es wird also darauf hinauslaufen, für den Fall, dass wir Excel-Tabellen erhalten, dass die Scheisse (das Einpflegen) an uns kleben bleibt.
Wer hat Lust drauf??? Freiwillige bitte gleich hier melden!

Es sind zwar alle in OSM vorhandenen Daten vorhanden, aber sicherlich nicht alle “akzeptiert”. Wenn ich mir z.B. die einfach vorhandenen Werte für highway anschaue, möchte ich lieber die Flucht ergreifen als den Mist aufzuräumen:
adit
aslb
直進、右折のみ可
ru:Красный␣Рог␣(Хойникский␣район)
FX/Jeep␣Terminal
ssurvace
Police_camera_van_stand
roundup
Nehoreka

usw – in mindestens 700 Variationen.

Letzeres ist eher Wunsch als Wirklichkeit.
Unser Datenmodell ist schlecht definiert. Die Daten werden inkonsistent erfasst (Beispiele s.o.).
Nur ein kleiner Teil unserer POIs enthält zumindest Adresse, Telefon und Webseite der Firma.
Kontrollen der bereits erfassten Daten finden nur sporadisch statt. Ein Datum der letzten Kontrolle ist in der Regel nicht vorhanden.
Viele Mapper erheben die Daten sorgfältig vor Ort, andere nutzen diverse Quellen, ohne diese anzugeben.
Gerade fielen mir drei Bahnhalte in Rendsburg auf, die mit Bahnsteig, Halteposition und Zuwegen in OSM erfasst sind, die aber bislang nur als Planung existieren.

Bei einem Anbieter, der regelmäßig Geld von den Firmen für die Einträge kassiert, ist die Datenqualität vermutlich besser, aber natürlich auch nicht immer korrekt.
Wenn der Anbieter die Daten in die OSM-Datenbank bringen will, ist zumindest ein manueller Ersteintrag nötig.
Die Datenpflege könnte dann weitgehend automatisch erfolgen, sofern die jeweiligen Einträge in OSM nicht zwischenzeitlich verändert wurden.

Nee, ich hatte das nur auf die immer hypothetischer werdenden Annahme bezogen, dass die in dieser geplanten (???) Aktion importieren Daten irgendwann “sauber” sind.

So langsam kommen mir aber da die Zweifel, ob wir sowas überhaupt zulassen sollten. Und wenn, dann kann das auf keinen Fall hier (im Forum) entschieden werden. Wir können helfen, wenn wir wollen, aber mehr nicht.

Gruss
walter

Mir fällt da noch eine alternative Vorgehensweise ein. Allerdings wieß ich nicht in wie fern das auch nachvollziehbar ist, oder ob ich gleich eine Football/Eishockeyausrüstung brauchen werde:
Aber eventuell ist es auch möglich, die Unternehmensinformation mit belastbarer Quelle per OSM Notes anonym auf der “Karte” zu kennzeichnen. Bei Zeit und Lust tragen dann die Mapper vor Ort die Infos nach Prüfung der Quelle oder Vor Ort Erkundung ein.
[Duck und weg]

Naja, ich dachte schon, man könnte vielleicht ein “Paralleluniversum” erschaffen, in das jeder rein importieren kann, was er will. Und das wird dann auf Wunsch mal unter die “richtige” Datenebene gelegt und manuell übernommen von den Usern, die sich berufen fühlen. Aber das ist vermutlich auch eher eine Football/Eishockeyausrüstungs-Idee, die administrativ viel zu aufwendig wäre (wenn auch eigentlich simpel).

Probleme mit der Tagging-Qualität könnten sicher minimiert werden, indem den Kunden brauchbare Formulare angeboten werden, deren Inhalte sich eindeutig für OSM umformulieren lassen und die keine Freiheitsgrade bieten, die man nicht haben möchte. Das sollte am Ende wenig OSM-spezifisch sein, weil jede Plattform letztlich auf Konsistenz angewiesen ist.

Für schwieriger halte ich die Geschichte mit dem zu schützenden Firmenwissen. Ich kann den Ansatz der Firma gut nachvollziehen und fände es schade, wenn qualitativ hochwertige Daten aus einem solchen Grunde verloren gehen würden.

Vielleicht sollte die Firma ein spezielles OSM-Päckchen anbieten, bei dem es darauf hinausläuft, die Kunden zu befähigen, ohne großen Aufwand selbst Hand anzulegen. Zum Beispiel, indem sie dabei unterstützt werden, einen eigenen Account anzulegen, der ja mit dem Firmensupport verknüpft werden kann (Mail-Forwarding undso wurde ja schon genannt). Dies würde zu halbwegs echten Usern führen, die ihre Daten quasi selber einpflegen (was ja eigentlich schon der Fall zu sein scheint), und die Firma übernimmt “nur” noch die Qualitätssicherung.

Es bleibt schwierig …

Ach … und wofür sollen die Kunden dann zahlen? :wink:

Für das “quasi” :wink:

Hallo icom78,

Ich bitte euch, euch bis Dienstagabend zu hier outen (solange habt ihr Zeit, darüber zu beraten), andernfalls weiß ich genau, was ich von euch zu halten habe. Nämlich kein Interesse an Kooperation und aus meiner Sicht unehrliche Leute, die ich in OSM nicht sehen möchte.

Eure Kundenliste kann man, so man den Firmennamen kennt, auch ohne OSM-Daten zusammenstellen. Allein mit der Waybackmachine und eurer aktuellen Website komme ich auf 20 verschiedenen Kunden, u.a. Fastfood-Ketten, Tankstellen-Ketten, Mobilfunk-Konzerne, Banken usw. Was soll bitteschön daran “geheim” sein, wenn ihr die eh auf eurer Website stolz präsentiert?

Viele Grüße

Michael
(meinen Nachnamen findet man leicht raus, einfach mal im Archiv einer der Mailinglisten gucken)

PS Die Mail ging auch an die Adresse im Impressum der Firma.

Also wer nicht in ca 15 Sekunden herausbekommt, welcher Laden das ist, sollte sich was schämen.
Ohne DB, einfach im Browser. Startpunkt: dieser Thread.

schelmische Grüße
walter

Hallo Icorn78,

ich möchte gerne 3 Policys, die bei uns existieren, hier in Kurzform zusammenfassen, ich denke alle 3 sollten durch Ihr Unternehmen im Falle einer Zusammenarbeit erfüllt werden, ich bin mir sicher, das diese im weiteren Verlauf des Threads noch detailliert werden (einiges wurde weiter oben ja schon erwähnt).

a) Bezahlte Mapper

Minimalkonsens bei uns ist:
Bezahlte Mapper sollten sich als solche in ihrem OSM Profil outen. Darüber hinaus ist es gut, wenn mehrere Mapper einer Firma existieren, das diese sich als solche mit Ihren Mappingzielen und Mappern präsentiert.

So sieht das bei Menz DV aus:
http://wiki.openstreetmap.org/wiki/DE:%C3%96V_Firma_Mentz_Datenverarbeitung_GmbH

Ein solche Transparenz erwarte ich auch von Ihrem Unternehmen.

b) Importrichtlinien

Importe sind nicht gerne gesehen, gerade in Deutschland, wo der Datenbestand grösstenteils händisch, oder mit manueller Synchronisation entstanden ist.
Importe müssen daher ausführlich vorher im Forum oder auf der Mailingliste diskutiert werden.

Importe sind m.A.n einmalige Aktionen, in denen ein fester Datenbestand in dem OSM Bestand integriert werden soll.

c) BOTs

BOTs sind noch eine Stufe schwieriger und benötigen daher eine besondere Prüfung. Ich denke Ihr CTO kann uns sicher darlegen, wie Ihre Bots mit allen Spezialfällen - die in OSM auftreten können - umgehen kann, um wie mit bereits vorhandenen, oder von Mappern geänderten Daten umgegangen werden soll.

Generelles:

OSM ist ein Communityprojekt zum Erzeugen eines offenen Datenbestandes. Heimlichtuereien gehören hier nicht hin. Sobald es darum geht, Daten in OSM einzuspielen, benötigen wir grösstmögliche Transparenz, was bedeutet, das sie das Know How, das Sie in dem Bereich aufbauen, nicht unter Verschluss halten können. Es muss ja mit dem offenen Know How der Community abgeglichen werden.

Jeder kann und darf mit den Daten die sie unter der ODBL zur Verfügung stellen, machen was die ODBL erlaubt.

Christoph

Bitte - wie immer - darauf achten, dass man sachlich bleibt. Dazu zählt, dass man keine Ultimaten stellt und u.a. auf Wörter wie verachtenswert verzichtet. Danke.