User Tracking auf Openstreetmap.org

Aus der Diskussion ist mir nicht klar geworden warum es dir Tracker gibt, ergo werden sie zukünftig geblockt.

Interessanter Punkt.

Mir ist der Tracker mehr oder minder zufällig aufgefallen als vor zwei Tagen für einige Millisekunden die Statusmeldung “piwik.openstreetmap.org wird gelesen” im Browser aufflackerte. Da ich normalerweise über eine schnellere Internetverbindung verfüge, kann es ja tatsächlich sein, dass der Tracker schon jahrelang im Betrieb ist, die Statusmeldung aber halt bei einer schnelleren Internetverbindung gar nicht mehr erscheint.

Für mich wäre der Vertrauensverlust dann allerdings umso größer, da ich bei Community-Projekt nicht damit rechne, mehr oder minder heimlich getrackt zu werden.

In den OSM-Datenschutzerklärungen findet sich übrigens kein Sterbenswörtchen, dass Tracker beim Betrachten der Seite eingesetzt werden :confused: :confused: :confused:

Offen ist auch weiterhin, wie mit dem jüngest geänderten URL-Format, das Koordinaten und Zoom-Level enthält, umgegangen wird. Damit entsteht potentiell eine Art “Bewegungsprofil”.

Dieser Verdacht sollte anhand von Fakten schnell entkräftet werden.

Das ist nur lokales JavaScript, damit kann genauso viel oder wenig an den Server gesendet werden wie vor dieser Umstellung (die ich nicht gut finde, aber das ist ein anderes Thema).

@free_as_a_bird
Ich empfehle dir, das Internet nicht weiter zu nutzen. Fast jede Anfrage wird in einem Server-Log gespeichert und umfasst mindestens Uhrzeit, Anfrage (komplette URL, auch GET-Parameter), regelmäßig den Referer (Seite, von der du herkommst), sehr oft den User-Agent und fast immer deine IP-Adresse. Piwik macht nicht viel anderes, nur dass er bei aktiviertem JavaScript auch Daten wie die Bildschirm-Auflösung speichern kann (hilfreich z.B. bei Entscheidungen, wie groß/klein Kartendetails gerendert werden sollen).

Wir haben aber nunmal Datenschutzgesetze, und die sollten grade bei FOSS-Projekten eingehalten werden. Also brauchen wir schon Antworten auf Fragen wie

  • Wozu wird der Piwik gebraucht? Ich dachte, OSM sei eine Geodatenbank, und die Karte auf der Startseite wäre nicht so wichtig!
  • Wie ist er konfiguriert?
  • Speichert er volle IP-Adressen?
  • Legt er Nutzerprofile an?

Grad über Datensparsamkeit muss man doch eigentlich nicht mehr reden. Diese Daten können von beliebigen “interessierten” Leuten genutzt, erhackt und/oder er-NSA-d (Regierungsseitig abgeschnorchelt) / er"Snowden"d (einfach rausgetragen) werden. Wenn man einen Datentrog aufstellt, kommen die Schweine. Also erst garnicht sammeln.

Ehm also auch wenn ich selbst Datenschutz für extrem wichtig halte, verstehe ich eure Aufregung nicht:

  1. Piwik reicht keine Daten nach extern weiter
  2. Es wird ausschließlich Piwik eingesetzt, schaut euch doch mal bitte beliebige Zeitungsseiten mit Ghostery an, da quasseln fast immer ~10 Widgets/Adverts/Tacker fröhlich und teilen mit wer du bist.
    Das man als Webmaster den Weg seiner Nutzer und ihr Wiederkehrverhalten verfolgen will, halte ich für durchaus nachvollziehbar. Wer das nicht will, kann es ja gerne blockieren oder Do-not-track aktivieren, oder?

Prinzipiell gibt es zwei Arten, die gerne nur sehr undifferenziert betrachtet werden: Statistik und Tracking. Die Statistik ist ein harmloses zusammenwerfen vom Level “wir haben 1200 Seitenaufrufe, 150 mal wurde Seite XYZ aufgerufen” usw., und ist anonymer als ein Serverlog. Ein Tracking hingegen begnügt sich hiermit nicht, man will wissen wie sich die User auf einer Webseite (oder darüber hinaus - und genau damit wirbt Piwik!) bewegen - Bewegungsprofile. Und zumindest in Europa ist Tracking stets eine Grauzone in der man sich da bewegt - völlig egal ob man die Daten rausgibt oder nur intern erhebt. Meine Erfahrung zeigt aber, dass viele glauben Tracking zu brauchen (und dann auch nehmen), obwohl sie eigentlich eine Statistik meinten. Oder der Admin findets cool und nimmt das aus persönlicher Vorliebe - weil er schlicht weiss “damit komm ich klar, das hab ich schon mal integriert”.

Ein Tracking muss zwar auch mit jenen Daten auskommen die ein Serverlog ebenso erstellt, aber sie werden anders aufbereitet. Sonst bräuchte manch einer gar keine solche Software - mit grep & wc kommt man auch recht weit…

Für mich ist der Hype um und Trend zum Tracking (statt oder zusätzlich zur klassischen Statistik) ein sehr fragwürdiger Umgang mit den Besuchern einer Webseite. Die erste Frage wäre hier für mich: Welche Info genau erhofft man denn zu erhalten? Diese Frage muss man ohnehin eigentlich erst klären, bevor man sich für Tracking überhaupt entscheidet. Ansonsten war es eben die Vorliebe des Admin…

Schaut euch mal die Zeile im HTML-Quellcode an, um die es geht:

img src="http://piwik.openstreetmap.org/piwik.php?idsite=1" style="border:0" alt=""

Ein Cookie von piwik.openstreetmap.org habe ich nicht gefunden. Die deutsche Seite openstreetmap.de verlinkt nicht auf piwik.openstreetmap.org.
Damit sind für piwik auf openstreetmap.org alle Browser-Attribute, IP-Adresse und Referer (also: die gegenwärtige URL mitsamt dem #map=zoom/lat/lon Anteil) bei Abruf der .org-Seite sichtbar; eine Aktualisierung bei Änderung der Karte kann ich nicht herauslesen (habe ich sie nur nicht gefunden?). Eine Profilbildung ohne Cookies ist schwierig, aber möglich.

Es setzt auf Cookies, um Nutzer langfristig zu tracken. Das ist eben der Unterschied zwischen Tracking und einem einfachen Server-Log. Neben Session-IDs (kann man auch über Cookies machen) wären dann noch User-IDs möglich. Hab mir aber die Funktion nicht angeschaut. Mein Ghostery hält mir die lästigen Plagegeister vom Hals. Um sich von Google moralisch abzusetzen würde ich bei OSM einfach auf solchen Tracking-Kram verzichten. Einen großen Nutzen hat OSM davon ohnehin nicht, wenn OSM nicht in Richtung Googles Geschäftsmodell gehen will. Die Verbindung von User-Tracking mit GPS-Daten kann man ziemlich fies missbrauchen, siehe Googles Android. Da sollte man einfach von vorneherein einen klaren Riegel vorschieben.

  1. Noch nicht
  2. Nicht absichtlich

“Die Anderen sind viel schlimmer” ist kein gutes Argument.

Wofür will man das wissen? Ich sehe keinen Nutzen und potenziell viel Schaden. Erklär mir den konkreten Nutzen für OSM/OSM.org/die OSMF/uns, und ich bin gerne bereit drüber nachzudenken. Aber einfach so “weil es geht”/“weil andere das auch machen”/“weil ich die Grafiken so schön finde”? Nee.

Vielleicht einfach mal bei den Admins anfragen, was damit bezweckt wird und warum nicht darauf hingewiesen wird. Andere Frage wäre, wer sind die Admins, auf der Seite selbst steht außer der Foundation keine Ansprechpartner.

Die meisten Fragen wurden schon im Thread den der OP verlinkt hatte beantwortet https://lists.openstreetmap.org/pipermail/talk/2013-January/065743.html

Die wenige Leute die Zugang haben sind die System Admins (die auch Zugang zu den Webserver Logs haben), und den Grund Piwik einzusetzen ist einfach gewisse Fragen zur Benutzung des GUIs (nicht so sehr der Karte an sich) beantworten zu können.

Bezüglich der Privacy Policy hat sich die LWG eine Überarbeitung/Prüfung als eine Arbeit für dieses Jahr (2013/2014) vorgemerkt, das auch schon seit längerem.

Ist ein Herausstellungsmerkmal dieses OpenSource-Tools.

Das mag sein, aber ich denke es hilft die Diskussion ein wenig zu erden, worüber wir hier reden.

Das will man wissen, um etwa herauszukriegen:

  • was wird häufig abgerufen
  • wie gelangen Nutzer auf diese Seite
  • wie lange verweilen sie dort
  • wohin gehen sie danach auf dieser Seite
    Das hilft dann insgesamt das Nutzerinterface und die Präsentation von Informationen zu überarbeiten. Stichwort hier etwa A/B Tests.

@Joachim Moskalewski
Das stimmt, etwas mehr Infos wären hier schön. Allerdings muss ich zugeben nur noch sporadisch in die Listen reinzuschauen, von daher will ich da keinem Admin nen Vorwurf machen, da offensichtlich darüber informiert wurde.

Ich finde eine kritische Haltung immer sinnvoll, aber geht das hier nicht zu weit? Wer den Admins unterstellt, dass die aus Spass mal die Nutzer “beobachten”, der sollte sich klar sein, dass diese auch den Zugang zu allen persönlichen Daten haben, die ihr bei OSM hinterlegt. Und nach außen wird nichts weitergeleitet, das ist in meinen Augen doch perfekt?

Die gab es vor der Adress-Umstellung auch schon :wink:

Ich habe nichts gegen den Einsatz von Piwik auf dem eigenen Server, etwa zur Optimierung der Webseite, wenn die Logs nicht an Dritte weitergegeben werden.

Wenn da nicht der Einsatz von Gravatar wäre.
An diesem Punkt hört der Spaß für mich auf, da hier der ungesalzene MD5-Hash meiner E-Mail-Adresse weitergegeben wird.
So lässt sich z.B. in einigen Fällen herausfinden, bei welchen Projekten ich ebenfalls aktiv bin, auch die Zuordnung von Beiträgen in Mailinglisten ist somit möglich.
Des weiteren erfährt Gravatar über den HTTP-Referrer meinen Benutzernamen bei OSM, wenn ich z.B. mein Postfach bei OSM abrufe.
Zusätzlich kann mich Gravatar durch die Einbindung bei OSM über OSM hinaus verfolgen.

Aus gutem Grund binden viele Gemeinden den Facebook-Knopf nicht mehr direkt ein, sondern legen diesen auf dem eigenen Server ab.

Viele Grüße,
whb

Und dafür reicht das normale Server-Log nicht? Kann Piwik nicht so konfiguriert werden, dass es einfach nur das access.log auswertet wird, ohne eigene Cookies? Im access.log kann man die Referer doch auch sehen, d.h. das Wanderungsverhalten innerhalb der eigenen Seite zu verfolgen. Was nur im access.log nicht geht, die Nutzer eindeutige Kennungen zu geben, um sie auch außerhalb der Session zu verfolgen, z.B. langfristig, weil alles hinter anonymen dynamischen IP sich verliert. Aber ich finde das geht ja auch keinen etwas an. Dafür nehme ich Ghostery und lösche Cookies sowieso beim Schließen des Firefox.

https://github.com/openstreetmap/openstreetmap-website/blob/be7cc77397ac22e4914ab6ea3416644c46bfa1b3/app/helpers/user_helper.rb

Wenn es bei dir eingeschaltet ist, einfach ausschalten.

Eine solche Unterstellung finde ich weder in meinen Sätzen, noch in meinen Gedanken. Den mir bekannten Admins, Entscheidungsträgern und Webseitenbetreibern würde ich beim Einsatz von Tracking eher schlichte Gedankenlosigkeit unterstellen.

Und ja, ein Admin, der seine Aufgabe auch tatsächlich nachkommt (nach meiner Beobachtung werden Firmen erst aktiv wenn der Kunde anruft und sagt “Server steht” - die Kohle für die tagtägliche Administration nimmt man dennoch gerne), sieht und erfährt zwangsläufig mehr als den verblendeten Gesetzgebern & Datenschützern lieb ist. Doch: Das ist für mich kein Problem.

Und ja, wird nichts nach außen gegeben, bleiben alle Requests einer Seite auf den eigenen Maschinen, ist alles okay. Ich selbst fordere meine Schäflein (so sie denn Tracking wollen) auf selbst so etwas in einer Datenschutzerklärung zu erwähnen. Denn nach meinem Kenntnisstand muss man dies innerhalb Europas tun. Eben weil Tracking Bewegungsprofile versucht zu bilden, und nicht nur eine Statistik erstellt. Völlig egal ob das auf der eigenen Seite bleibt oder nicht - es ist ein Profil. Ob Piwik wirklich ein Profil bildet (oder nur versucht mit dem Wort “Tracking” Anwender zu ködern) - keine Ahnung.

Und letztlich sind nach meiner Erfahrung alle solche Tools für die Tonne - noch habe ich keines gsehen, das heutzutage wirklich User von Bots unterscheiden kann. Piwik wird es z.B. eher nicht schaffen jene Besucher zu identifizieren, die zuerst eine robots.txt abrufen, um noch in der gleichen Sekunde mit einem Firefox nach dem Impressum zu crawlen. Die Firmen lieben ihre Zahlen - doch aussagen tun sie genau nichts. Nur der Admin, der noch Serverlogs liest, hat eine Ahnung von dem was los ist. Den fragt man aber nicht, man braucht ja belastbare Zahlen…

Erledigt.
Geht über “Bild löschen”.
Das ist wenig intuitiv, da ich nie ein Bild hochgeladen habe.

Warum ist Gravatar nicht Opt-in?
Denn realistisch gesehen lässt sich eine Information, sobald diese einmal öffentlich war, nie mehr zurückholen.
Ich kann den Hash nachträglich nicht mehr (z.B. von den Google-Such-Servern) löschen und die von mir genannten Verknüpfungen sind schon erfolgt.

Viele Grüße,
whb

Piwik verfolgt standardmäßig nur Benutzer mit eingeschaltetem JavaScript.
Da Bots üblicherweise keine JavaScript ausführen, sollten diese weitgehend nicht verfolgt werden.

Wird die Verfolgung auch bei ausgeschaltetem JavaScript aktiviert und gewährt man Piwik Zugriff auf die Server Logs, dann sollte auch die Erkennung von Suchmaschinen-Bots möglich sein:

http://piwik.org/faq/new-to-piwik/#faq_63

Viele Grüße,
whb