Editor usage stats

Dazu:

Aufgetragen ist der Anteil der Anfänger, die innerhalb der ersten 30 Tage nach ihrem ersten Änderungssatz an 0, 1, 2, … 30 Tagen erneut editieren. Man sieht: 71 % kommen (innerhalb der ersten 30 Tage) gar nicht wieder, 13 % nur an einem weiteren Tag, 5 % an zwei Tagen, 3 % an drei Tagen. Ein Anteil 10^-4 (0,01 % - im betrachteten Zeitraum ganze fünf neue User) werden zu süchtigen Mappern (Bearbeitungen an 30/30 Tagen).

Die Mediawiki-API bietet ein action=upload für Bilder. Mehr weiß ich aber nicht, Bilder automatisch hochladen habe ich auch noch nicht gemacht.

Danke übrigens für deine Arbeit und die schönen Statistiken!

Schade, ich hatte auf ein mehr oder weniger fertiges Kommando für solche einfachen Fälle gehofft… naja, dann quäle ich mich halt irgendwann durch die Doku und löse das mit curl.

Und noch etwas zu den Anfänger-Bearbeitungen: Eine Variante des zweiten Plots von oben, jetzt mit allen 2011er Erstbearbeitern und nicht nur dem ersten, sondern auch weiteren 30-Tage-Intervallen. D.h. es werden jeweils für jeden Anfänger die Intervalle Tag 1 bis Tag 30, Tag 31 bis Tag 60, … nach seiner ersten Bearbeitung betrachtet und gezählt, an wie vielen Tagen in jedem dieser Intervalle ein Anfänger Bearbeitungen vorgenommen hat - dieser Wert landet auf der x-Achse. Auf der y-Achse werden die User gezählt, die in dieser Kategorie landen (normiert auf alle Anfänger). Wenig überraschend sinken die Kurven immer weiter ab, aber es deutet sich Konvergenz an - d.h. man kann anhand der untersten Kurve schon grob abschätzen, welcher Anteil dauerhaft erhalten bleibt und wie regelmäßig diese Mapper aktiv sind.

Zu diesen Daten auch eine kumulative Darstellung, die vermutlich etwas leichter zu verstehen (und nicht so zappelig) ist:

Beispiel: innerhalb der ersten 30 Tage nach erster Bearbeitung editieren etwa 94% der Anfänger nicht häufiger als an fünf Tagen, bzw. 6 % editieren an mehr als fünf Tagen. Von Tag 151 bis Tag 180 editieren 95 % der ursprünglichen Anfänger gar nicht; 4 % an einem bis ca. 6 Tagen, und nur das verbleibende eine Prozent nimmt an mindestens 7 Tagen Bearbeitungen vor. Angesichts der großen Statistik (65 000 Erstmapper 2011) sind die Zahlen auch halbwegs belastbar und zugleich noch hinreichend aktuell.

Mittelfristig werden auch die Analysen zu diesem Themenbereich auf einer eigenen Seite im Wiki landen, obiges nur als Vorgeschmack.

Ich habe gerade mal die Seite auf den Stand Gesamtjahr 2012 gebracht (Tabellen und Plots).

http://wiki.openstreetmap.org/wiki/Editor_usage_stats

Danke für die Arbeit, die Du Dir damit machst.

Warum fehlen eigentlich bei der Tabelle “Distinct Users” im Gegensatz zu den beiden Nachbarn die Prozentangaben?

Generell finde ich es schade, daß die Plots praktisch alle logarithmisch sind und viele normalisiert. Als Ingenieur muß ich einen Moment grübeln wie sie zu interpretieren sind - aber für den Laien sind sie komplett unverständlich bzw. er wird völlig falsche Schlüsse daraus ziehen.

Könnte man nicht allgemeinverständliche lineare Skalen wählen? (Falls man dann die “kleinen” Editoren nicht mehr sieht würde ein zweites Diagramm des niedrigen %-Bereichs helfen).

bye, Nop

Falsche Zeitform, die Arbeit daran liegt hinter mir :wink: mittlerweile ist es nur noch ein gelegentliches make -B changesets-latest.osm.bz2 && make (plus Einpflegen in die Wikiseite)

Ist im Text erläutert - in dieser Tabelle ist die Definition des “Marktanteils” problematisch. Ein Änderungssatz oder ein bearbeitetes Objekt läßt sich eindeutig einem Editor zuordnen, aber was ist mit einem Mapper, der mehrere Editoren benutzt? Entweder muß ich ihn aufteilen (verfälscht das Gewicht) oder nur bei seinem Haupteditor zählen (verfälscht ebenfalls das Gewicht, und macht Probleme bei 50/50-Situationen) oder ich zähle ihn doppelt (ruiniert die Normierung). Ich habe mich für die letzte Variante entschieden. Die so erhaltene Zahl der Mapper, die einen bestimmten Editor im betreffenden Zeitraum benutzt haben, kann ich entweder durch die Gesamtzahl aller Mapper teilen, dann ist die Summe der Marktanteile größer als Eins; oder durch die Summe der Tabellenzeilen. Egal wie, die Bedeutung beider Quotienten ist fragwürdig. Deshalb habe ich sie bewußt nicht angegeben, um Fehlinterpretationen zuvorzukommen. Sonst müßte ich jedes Mal, wenn jemand z.B. sagt, Potlatch 2 werde von 83 % aller Mapper benutzt, erklären, daß in der Tat diese 83 % aller Mapper nur mindestens einmal einen Änderungssatz mit P2 erstellt haben, auch wenn sie womöglich viel mehr mit einem anderen Editor (lies: JOSM) gemacht haben. In jedem Fall muß man sich bewußt sein, daß gerade die Zahlen nach “distinct users” mit Vorsicht zu genießen sind.

Ich habe mir gerade mal den Spaß gemacht, die Skala umzustellen. Die kleinen Editoren sieht man dann in der Tat nicht mehr. Merkaartor liegt noch knapp oberhalb des bunten Bündels von Nulllinien, aber selbst P1 verschwindet mittlerweile darin (und im uid-Diagramm sogar Merkaartor). Selbst die kleinen Editoren (wobei ich die Auswahl für die Graphen schon auf Mehr-oder-weniger-Mainstream-Programme beschränkt habe) decken noch mehrere Größenordnungen ab, da stünde man bei dem zweiten Diagramm ganz schnell vor dem gleichen Problem - und der Übersicht wäre durch mehr Diagramme auch nicht geholfen.

Der Dank ist ist natürlich Zeitlos. :slight_smile:

Klar, die Problematik ist mir klar. Aber wenn eine Zahl mit Vorsicht zu genießen ist und das auch ausführlich erklärt wird, ist das ja kein Grund sie komplett wegzulassen.

Ich denke diese Aussage ließe sich signifikant schärfen, wenn man den Eindeutigen User nur jeweils bei dem Editor zählt, mit dem er in dem Jahr am meisten Changesets produziert hat? (Das Diagramm “multiplicity” klingt so als ob es eine Zählung in der Art schon gäbe) Dann würde man den Haupteditor zählen und Ausnahmen, Urlaubsedits, Tests usw. ignorieren. 50/50 Situationen dürften in der Praxis kaum vorkommen - falls doch könnte man ja ab 40% Anteil an Edits beide Editoren zählen - das wäre dann auch berechtigt.

Ich hab mir selber aus Neugierde jetzt auch mal ein lineares Diagramm aus Deinen Zahlen gebastelt. (P1 verschwindet nicht im Gewühl sondern taucht in den unkorrigierten Userzahlen noch mit 11% auf - auch wenn ich mir vorstellen kann, daß das evtl. nur undeletes waren.) Wenn man sich an der Politik orientiert und nur Editoren einzeln zählt, die zu irgendeinem Zeitpunkt die 5% Hürde geschafft haben, kommt man eigentlich zu einer recht übersichtlichen Darstellung. Ich denke ich werde sie mal zusätzlich ins Wiki packen, weil sie einen Textabsatz dort eigenltich recht schön illustriert.

bye, Nop

Tja, aber ist das wirklich der Haupteditor? Oder der mit den meisten Bearbeitungen (Objekten)? Oder sollte man beide zu einer Funktion verwursten? Angesichts der Willkür, die auf diese Weise eingeführt würde, habe ich davon abgesehen.

Die “editor multiplicity” beschreibt übrigens die mittlere Anzahl Editoren, die ein User benutzt hat. Darüber wie aussagekräftig diese Größe ist, bin ich mir selbst noch nicht im Klaren. Durch immer mehr Einmal-und-nie-wieder-Mapper sinkt diese Zahl natürlich unabhängig von Trends innerhalb der tatsächlichen OSM-Community (etwa daß einige ab und an P1 als Zweiteditor benutzt haben, was jetzt weitgehend entfällt). Vielleicht würde eine Beschränkung auf Mapper mit mindestens N Änderungssätzen diesem Diagramm insgesamt gut tun.

Das stimmt, aber wenn sich der Trend fortsetzt, verschwindet P1 dank der nicht mehr vorhandenen Website-Einbindung in dieser Rangliste bald hinter Merkaartor, Vespucci, OsmAnd und Pushpin. Die Zahlen von gerade mal vier Tagen sind natürlich noch ein wenig dünn für eine belastbare Vorhersage, aber bei Changesets und Edits ging es bereits seit der Abschaltung steil bergab. Bei den Nutzern dagegen bleibt abzuwarten, wie es in einigen Wochen (mit mehr Statistik) aussieht.

Unschön ist, daß auch ein anerkannter Tilescraper wie OpenMaps offenbar nicht totzukriegen ist.

Ganz was anderes - ich bin selber ein wenig neugierig geworden. Wo nimmt man denn die Rohdaten über die Changesets am Besten her?

bye, Nop

“Latest weekly changesets” von http://planet.openstreetmap.org/

So, ich habe jetzt mal eine alternative Auswertung gefahren um die Mehrdeutigkeit bei mehreren Editoren beim selben User etwas aufzulösen. Die Vorgehensweise ist wie folgt:

  • es werden nur JOSM und Potlatch verglichen, alle anderen Editoren sind unter “Other” zusammengefaßt.
  • die Statistik erfolgt Monatsweise anstatt in Jahresscheiben, um die zeitliche Überschneidung bei ausnahmsweiser Nutzung von mehreren Editoren zu verringern und sich veränderndes Nutzerverhalten innerhalb eines Jahres besser weiderzugeben
  • die Auswertung unterscheidet zwischen “Exklusiver Nutzung” von einem Editor oder “Haupsächlicher Nutzung” gemeinsam mit anderen Editoren
  • eine Hauptsächliche Nutzung wird angenommen, wenn 40% oder mehr der Changesets in einem Monat mit einem Editor erzeugt wurden. Es ist also möglich daß bei nahezu Gleichverteilung beide Editoren gezählt werden
  • eine Nutzung von weniger als 40% wird als Ausnahme gewertet und nicht gezählt

Damit ergibt sich folgendes, wenig überraschende Bild: Es gibt bei OSM zwei große Lager. Die einen benutzen nur JOSM (ca. 25%), die anderen benutzten nur Potlatch (ca. 55%).

Erstaundlich finde ich daß sich trotz aller hitzigen Diskussionen in den letzten Jahren eigentlich nichts wirklich bewegt hat. Die Anteile von P1 sind auf P2 übergegangen aber die Schwankungen zwischen den beiden Lagern sind gering. Der Anteil von Nutzern die im selben Monat unterschiedliche Editoren nutzt ist recht niedrig. Andere Editoren spielen nur eine unwesentliche Rolle.

Testweise habe ich dieselbe Auswertung auch nochmal mit 30% als Mindestanteil für die Zählung als Hauptsächliche Nutzung durchlaufen lassen, die Änderungen sind aber unwesentlich.

bye, Nop

Auch eine interessante Statistik, danke dafür! Die Optik gefällt mir persönlich gut.

Und ebenfalls einen zeitlosen Dank an Oli-Wan. :wink:

Ich möchte noch einmal auf die Wiki-Seite Editor usage stats aufmerksam machen, da passieren im Moment einige bemerkenswerte Umwälzungen.
Seit einigen Monaten wird Potlatch 1 nicht mehr direkt auf der OSM-Website angeboten und ist in der Folge in allen drei Tabellen bereits 2012 deutlich abgerutscht, was sich in den ersten Monaten 2013 noch einmal verstärkt hat. Der neue Stern am Himmel der OSM-Editoren heißt iD. Bisher nur als Betaversion verfügbar, wird er offenbar bereits eifrig genutzt. Bei der Zahl der Nutzer liegt iD bereits auf Platz drei; Potlatch 1 hat er in allen drei Tabellen überholt. Der langsame Abstieg von Merkaartor, häufig als einer der wichtigsten Editoren angesehen, setzt sich ebenfalls fort. Zugleich gewinnen mobile Editoren - Pushpin, Go Map!!, Vespucci usw. - immer mehr an Bedeutung, vor allem bei der Zahl der Nutzer. Naturgemäß fallen deren Änderungssätze in der Regel eher klein aus, sodaß ihr Anteil an den Bearbeitungen quantitativ vernachlässigbar ist. Per Zufall bin ich kürzlich auf einen Editor namens MapStalt Mini aus dem Hause Mikroweich gestoßen. Der fehlte bisher in den Tabelle, weil er seine Änderungssätze mit create_by statt created_by signiert. Ulkigerweise ist mir damit der mobile Editor mit den meisten Nutzern durchgerutscht.

Der Thread hier ist schon etwas älter aber nichtsdestotrotzer passend. Ich habe auf Anfrage mal einen aktuelles Update meiner linearen Auswertung der Editor Marktanteile auf Basis der regelmäßig genutzten Editoren auf den aktuellen Stand April 2009 bis Oktober 2018 gemacht.

Wenig erstaunlich war die Nutzung dominiert von dem jeweiligen Standardeditor auf der Hauptseite Potlatch1 → Potlatch2 → iD. Wobei es scheinbar immer noch eine kleines gallisches Dorf gibt, das an Potlatch2 festhält. Die Nische von JOSM als Expertentool wurde über die Jahre langsam aber kontinuierlich kleiner. Erstaunt war ich über den gewaltigen wenn auch schon wieder abnehmenden Einfluß von Maps.me und den Newcomer StreetComplete.

Danke. Ich finde das sehr interessant. Erst war ich etwas verwundert, dass JOSM nur einen “Marktanteil” von ~ 10 % hat. Aber die darüber liegenden Tabellen sind auch noch einmal sehr aufschlussreich. JOSM wird für 2/3 aller edits verwendet. Das passt natürlich zu dieser Analyse.

Die Zu- oder Abnahme des Anteils von Editoren, die einen kleinen Marktanteil haben, kann man in der von dir verwendeten Darstellung nur schwer beurteilen, da die für kleine Editoren relativ großen, aber in absoluten Zahlen kleinen Änderungen nicht so sehr auffallen. (10 Prozentpunkte bei iD fallen stärker auf als bei StreetComplete)

IMHO ist Nops Auswertung genau viel oder wenig aussagekräftig wie die anderen. Z.B. überbewertet es massiv “Editoren” die häufig von “one-shot” Beitragenden genutzt werden (und da es um relative Grössen geht, wird der Eindruck erweckt, z.B. das JOSM massiv weniger verwendet wird, was natürlich nicht stimmt).

Wenn überhaupt etwas belastbar aussagt dann sind es die Anzahl “edits” (nicht changesets), sprich effektive Änderungen an den Daten.

Simon

Ganz im Gegenteil. Dadurch daß monatlich gezählt wird, geht ein one-shot nur einmal in dem jeweiligen Monat mit ein und wird in den übrigen nicht gezählt - während die anderen Statistiken alles auf Jahre kumulieren. One-shots blähen diese Auswertung also 12 mal weniger auf als die anderen.

Das stimmt so nicht ganz.

Auf monatliche Basis ist das Verhältnis bestehende vs neue Mapper ca 60% - 40%, auf Jahresbasis 25% - 75%, sprich den Faktor 12 gibt es nicht (und die Gründe dafür sind auch klar).

Aber das war gar nicht der Punkt, egal wie man es macht, eine Marktanteildefinition die ungefiltert auf der Anzahl User beruht wird dieses Problem immer haben, egal was für ein Zeitraum betrachtet wird.

Irgendwie tauch OSM2go gar nicht auf, obwohl das Skript im Wiki so aussehen sollte, als würde es darauf matchen. schnüff