Facebook kauft Mapillary

Die unter einer freien Lizenz veröffentlichten Bilder sind aber verpixelt. Problematisch sind die unverpixelten Rohdaten, welche jetzt an Facebook gehen.
Hat schonmal jemand die frei erhältlichen Gesichtserkennungsalgorithmen getestet, wie gut diese so sind?
Dann wäre das automatische Verpixeln vor dem Hochladen eine Lösung.
Wenn ich mich richtig erinnere, musste Google sogar zustimmen, auch die Streetview-Rohdaten in Deutschland zu verpixeln, nicht nur die veröffentlichten Bilder.

Laut Mapillary werden die unverpixelten Originale nur eine begrenzte Zeit gespeichert (Hervorhebung von mir):

Download the original of any image that you have contributed (due to privacy regulations, we keep the unblurred original for a limited time; after that, only a blurred version will be retained but the size, resolution, and metadata will still be the same as the original).

Ich glaube die Frist liegt momentan bei rd. 6 Monaten (kann’s aufgrund meiner sporadischen Beiträge grad nicht nachprüfen), danach kann man nur die verpixelten Bildern herunterladen. Interessant wäre wo die entsprechenden privacy regulations dokumentiert sind.

Jan Erik Solem hat 2018 zu Haftungsfragen bzgl DSGVO versprochen:
When you as an individual upload a photo to Mapillary, Mapillary is responsible for making sure that the processing of that photo is lawful under the GDPR. You (or any user) is not liable under the GDPR for any photo when it has been uploaded to Mapillary. […] We also make sure that only a handful of people at Mapillary has access to any non-blurred images and never publish non-blurred images.

Ergänzung DSGVO

Der ein oder andere hat ja schon das Thema aufgebracht, sowas selber zu machen. Da die alternative zu Mapillary, OpenStreetCam, unter dem Dach von Grab auch eher schlecht als recht funktioniert.

Die Kosten für einen selbstbetriebenen Dienst wären schon hoch, aber nicht exorbitant. Bei Hetzner (https://www.hetzner.de/dedicated-rootserver/matrix-sx) gibts es Server mit 40TB für ca. 1000€ im Jahr. Ohne RAID und Backup passen da ca. 25 Mio. Bilder drauf (bei 1,5MiB pro Bild). Das wäre schon mal ein Anfang. Um Kosten zu sparen, könnte man auch mit kleineren Servern starten und dann bei Bedarf migrieren.

Ein wichtiger Bestandteil wäre das Verpixeln von Gesichtern/Nummernschilder etc. schon beim Benutzer/Client. Software wie OpenCV oder spezieller https://github.com/ageitgey/face_recognition soll das Leisten können. Ich weiß nur nicht wie gut…

FB hat zuerst einmal die Firma gekauft, nicht die Bilder (ja und das ist ein Unterschied).

Ließe sich Platz sparen, wenn man die Bilder nicht einzeln speichert, sondern als Video kodiert?

Will man aber haben :wink:

Hi

Ja, die eigentlochen Kisten mit Storage sind eher günstig, ABER mapillary ist mehr als nur einfach Bilder auf HDs ablegen.
Angefangen von einem ordentlichem RAID und Backup mit nutzbarem Restore, hin zu ausreichend Redundanz, Anbindung, Ausfallsicherheit und vor allem Kapazität. Man will ja ned nur eine Hobbygruppe ihre Bilder speichern lassen, sondern viele Gruppen weltweit drauf arbeiten lassen.
Hinzu die Ressourcen um die Daten zu verarbeiten (Bild-Verarbeitung und semenatische Auswertung kosten erheblich Rechenzeit). Und wieder mal mehr Speicherplatz.

Man sollte auch die Personalkosten ned vergessen, in dieser Größe gehts ned unter 1-5 Vollzeit Admins. Und wer entwickelt die Software weiter, passt diese an?

Vieles geht privat oder in kostenlosen Privateinsätzen, aber das ist alles Flickwerk und ned so allumgreifend wie Mapillary, OSC, Google, Apple,…

Ich sehe da halt nur mapillary als verfügbare Lösung für die nächsten Jahre. Bisher war das eine brauchbare Lösung, wenn auch mit eh schon immer fragwürdigen Datensammlungen, die dem System aber angeheftet sind, zwangsweise.

Mal schauen, wie weit Facebook mit den Bildern besser zu OSM beiträgt als bisher.

Thema verpixelte Bilder: niemand hinderte Mapillary daran, unverpixelte Bilder weiterzugeben (jedenfalls ned die Lizenz). Solange man da ned selber kontrollieren kann, ist das alles Spekulation, und es ist anzunehmen, das externe die RAW Bilder bekommen könnten. Somit kein Unterschied zu jetzt.
Falls die Bilder dann doch verpixelt abgelegt sind, nur besser.
(abgesehen davon, das die eignetliche Zwecke Mapillarys möglichst Bilder ohne Gesichter sind^^ und viele Dashcam Bilder sind ja ohne).

Und nein, Bilder von Videos speichern ist keine Lösung, da mehr Informationen verloren gehen und Feature Extraction ned so toll ist. Daten Reduktion ist immer Verlust von Informationen.

Amiga4000

Der Unterschied liegt in der Vertrauenswürdigkeit einer Organisation bzw. in der Wahrscheinlichkeit von Mißbrauch. Mapillary hat die Mehrheit vertraut und es sind keine Fälle von Mißbrauch bekannt. FB ist nicht vertrauenswürdig und hat das bereits mehrfach in Skandalen bewiesen.

Ich würde sagen das ist Spekulation mit einem großen Unterschied.

Mapillary hat sich aufkaufen lassen. Damit ist jegliches Vertrauen, das in Mapillary gesteckt wurde, falsch gewesen.

Bei Dingen wie Datenschutz und IT-Security sollte man keinen Organisationen (Unternehmen, Staaten, etc.) vertrauen. Heute mögen die noch ganz lieb sein, morgen übernimmt wer anders die Führung.

Deshalb muss man seine Bilder verpixeln, bevor man sie hochlädt.

Ahaha. Ich bin vor ein paar Wochen mit dem KFZ mein Dorf abgefahren, bei kurzer Durchsicht sind auf bestimmt 30% der Bilder Gesicher und Kennzeichen zu erkennen.

+1

Werden Bilder irgendwo anzeigen, ist auch der Name des Urhebers anzugeben.

Heutzutage hat man schneller ne Klage wegen Datenschutz am Hals wie sonstwas. Diesem Risiko - selbst wenn man letztendlich nicht verurteilt wird - will man sich nicht aussetzen. Geld und auf jeden Fall Nerven bleiben dabei immer auf der Strecke.

Aber jeder wie er will, ich geh derweilen mal mit OpenCV experimentieren. Bisher allerdings nicht sonderlich erfolgreich, anscheinend sind die Gesicher zu klein auf den Images :frowning:

Mir ist keine freie Software bekannt, die das macht. Gibt es welche?

Das war doch der Sinn des ganzen (Börsengang mal ausgeschlossen), ich seh jetzt nicht ganz was die Empörung soll wenn das Erwartete eintrifft.

dooley erwähnte gerade OpenCV. Das ist auch das, was ich bei einer kurzen Recherche gefunden habe. Wenn das nicht zuverlässig genug funktioniert, sieht’s vielleicht wirklich schlecht aus.

Das Verpixeln selbst ist einfach. Aber man muss auch wissen, wo man verpixelt. Und das ist eine Aufgabe, die die “FOSS-Community” durchaus stemmen könnte, hier zuverlässige Software zu bauen. Künstliche Intelligenz ist doch die Sau, die gerade durch’s Dorf getrieben wird.
Alternativ ließe sich mit überschaubarem Aufwand eine dumme Anwendung bauen, die einem Einzelbilder anzeigt und wo man mit wenigen Klicks was Verpixeln kann.

Bei den wenigen Bildern die ich hochlade, mache ich das noch komplett manuell mit Gimp.

Bevor Mapillary den verbesserten Algorithmis für die Gesichts und Kennzeichenerkennung eingeführt hat, habe ich damit mal ein wenig experimentiert. Die Ergebnisse waren nicht besonders ermutigend. Aber vielleicht sieht das heute anders aus.

Wenn ich ein paar Stunden unterwegs bin, nehme ich mehrere Tausend Bilder auf (Interval 2s → 1800 Bilder/h). Mit Handarbeit kommt man da nicht weit. Als Mapillary noch den alten Erkennungsalgorithmus hatte, bin ich nach dem Hochladen alle Bilder durchgegangen, um zu kontrollieren, ob beim Verpixeln nicht etwas übersehen wurde. Das war schon enorm aufwändig.

Würde mich auch sehr interessieren. Einer kurzen Recherche nach scheint es zumindest nichts brauchbares zu geben das man automatisiert auf viele Bilder loslassen kann. Es gibt ein paar Bibliotheken und auch Anleitungen für OpenCV, aber nichts wirklich “fertiges” das man dem typischen Mapillary-Nutzer in die Hand drücken könnte.

Im Mapillary-Forum wurde inzwischen in diesem Beitrag auf die Software anonymizer von understand.ai hingewiesen. Erste Versuche sind vielversprechend. Leider kann ich derzeit nicht in größerem Umfang testen, da mein Rechner zu schmalbrüstig dafür ist.

Hallo,

Mapillary ist auf GitHub vorher facebookifiziert worden. Ein Facebook-Bot hat auf GitHub einen 4½ Jahre alten, noch offenen Pull-Request von mir kommentiert und mich gebeten, das Contributor License Agreement von Facebook zu unterschreiben. Da es im Master-Zweig umfangreiche Änderungen gab und sich bislang keiner wirklich für den Patch interessiert hat, habe ich die Unterschrift verweigert (wäre Ressourcenverschwendung).

Viele Grüße

Michael

EDIT: Link ergänzt

Hallo,

Jan Erik Solem hat im Mapillary-Blog bekanntgegeben, dass man die Verpixelungstechnik verbessert habe. Man werde die unverpixelten Originale künftig nicht mehr sechs Monate lang aufbewahren. Die Entpixelungsfunktion im Editor entfällt damit auch.

Ich habe nicht geprüft, ob sich die AGB inhaltlich geändert haben.

Viele Grüße

Michael

Inwiefern ist es keine Alternative? Ist das heute immer noch so?

Im Moment ist OSC als KartaView wieder auferstanden. Einige Testuploads von mir zeigen zumindest, dass es grunsätzlich funktioniert. Gibt es hier Bedenken?

https://reports.exodus-privacy.eu.org/en/reports/com.telenav.streetview/latest/

Das wäre die Auswertung für Android App, richtig? Die angemeckerten Berechtigungen sind ja okay für den Anwendungsfall. Das Problem sind wohl eher die Tracker.

Und wenn man das CLI Tool nutzt und die Bilder nur in JOSM anzeigen lässt, ist das auch so mit Trackern voll? Hat schon mal jemand dies untersucht?