Editor usage stats

Sehr schön gemacht. Das sollte in der Wochennotiz auftauchen!
Georg

Sehr schön geworden.

Einzige Verbesserung, die ich vorschlagen möchte, wäre die großen Zahlen durch Trennung bei den Tausender-Stellen etwas besser lesbar zu machen. Also statt 257615240 so etwas wie 257.615.240

Edbert (EvanE)

Danke für die wohlwollenden Rückmeldungen!

Gute Idee. Ich habe jetzt erst einmal Leerzeichen zur Trennung verwendet - und dabei ganz unauffällig einen Fehler in den Zahlen korrigiert :sunglasses: (ging aber nur um Promille). Punkte verwirren die Englisch-, Kommata die Deutschsprachigen :roll_eyes:

Ach ja, die Null-Einträge in den Tabellen sind verschwunden. Der Fehler ist identifiziert; bei der nächsten Bearbeitung der Tabellen kommen auch die Nullen wieder.

In der Tat eine interessante Idee, die jedoch weit über meine Ambitionen und Möglichkeiten hinausgeht. Für die Statistiken schlachte ich nur changesets-yymmdd.osm.bz2 aus (woraus sich schon erstaunlich viel Information gewinnen läßt). Einmalig (bzw. in größeren Abständen) ein Planetfile durch ein Skript zu schnullern, wäre auch noch denkbar - aber eine komplexe Analyse der Genese von Fehlern ist leider mit meinen Mitteln nicht drin.

Bei bestimmten sehr häufigen Fehlern sind die Auslöser ja bekannt, etwa aus einem Knoten bestehende Wege (Potlatch), nicht angebundene Wege (häufiger Potlatch-Anfängerfehler), leergeräumte Relationen (JOSM-Konfliktlösung) usw. Es wäre sicher interessant, dies mal auf breitere Füße zu stellen und systematisch zu untersuchen, woher bestimmte Fehler kommen, um dann ganz gezielt Gegenmaßnahmen ergreifen zu können - aber ich denke, daß da eine völlig andere Herangehensweise nötig wäre als bei meiner kleinen statistischen Auswertung. Schließlich müßte die Analyse speziell an jeden einzelnen Fehlertyp angepaßt werden. Nur ein Beispiel: Lücke in einem Multipolygon-Ring. Der Fehler kann daher kommen, daß die Relation bearbeitet wurde (z.B. Weg entfernt, oder unsinniger neuer Weg hinzugefügt), oder aus der Bearbeitung eines der Wege, wovon die Relation gar nichts mitbekommen hat. Man bräuchte also einen Algorithmus, der 1. den Fehler im Ist-Zustand erkennt und 2. unter allen Bearbeitungen a) der Relation und b) der Elemente diejenige findet, bei der der Fehler entstanden ist. Eine ganz schön komplexe Aufgabe, und das für jeden Fehlertyp, den man untersuchen will.

Danke, Oli-Wan, dass du dir diese Mühe machst!

Sensibilisieren möchte ich aber doch einmal für ein Thema, das, wie ich finde, auch bei den meisten Editoren etwas kurz kommt, nämlich das der Barrierefreiheit. So verwendet die überarbeitete Seite z.B. in Schaubildern unterschiedliche Farben, um die Nutzung der verschiedenen Editoren graphisch darzustellen. Für jemanden, der an einer ausgeprägten Farbschwäche leidet, sind diese unterschiedlichen Farben nur schwer bis gar nicht auseinander zu halten. Viel besser sind da unterschiedliche Stricharten bzw., wenn schon Farben, dann solche, die deutlichst auseinander liegen. Auch eine Kombination aus diesen beiden Möglichkeiten wäre besser.

Du hattest nach Ideen gefragt und eine bekommen - Ideen sind ja auch zum Träumen da .

Gruss
walter

p.s. einer hat mal jemanden gefragt, ob er den Begriff “Idee” definieren könne.
Als demjenigen das nach längerem Nachdenken gelungen war, meinte sein Kumpel nur:
“dann rück bitte mal ne Idee weiter”

-doppelt-

Oh ja, das hatte ich überhaupt nicht auf der Rechnung. Ich wollte die Plots ohnehin demnächst noch überarbeiten (die derzeitige Farbauswahl ist einfach gnuplot-Standard), ich versuche mal Deinen Hinweis dabei im Hinterkopf zu behalten. Was ist mit dem letzten Plot zu JOSM-Versionen? Blaue Linie, rosa Kreise mit rotem Rand, schwarze Fehlerbalken - reichen die Formen zur klaren Unterscheidung oder sollten da auch andere Farben her?

Dass du rosa und rot verwendest, ist mir gar nicht aufgefallen! Wenn ich mal davon ausgehe, dass ich nicht zu den ganz heftig Farbenblinden gehöre, dürfte an dieser Stelle eine andere Lösung angebracht sein. Ehrlich gesagt finde ich diese ganze Grafik zu den JOSM-Versionen nicht so ganz gelungen. Mir fällt jetzt auf die Schnelle aber auch nicht ein, wie man’s besser machen könnte. Sind halt viele Daten auf engstem Raum zusammengepackt. Vielleicht liegt in der Aufteilung auf mehrere Plots die Lösung?!

Genau genommen sind es Rot und teilweise transparentes Rot in der Fläche… Ursprünglich war es mal einfach flächiges Rot, dann habe ich die Transparenzoption entdeckt :stuck_out_tongue:

Zusammengestellt sind (1) die aktuelle JOSM-Version (das ist im Moment die blaue Linie), (2) die in Gebrauch befindlichen Versionen (als Verteilung von Kreisen bzw. Punkten), (3) deren Mittelwert und Standardabweichung (Fehlerbalken).
Ich möchte auch alle diese Daten in dem Plot behalten, damit die Zusammenhänge erkennbar bleiben: Nehme ich (1) heraus, sieht man zwar, welche Versionen genutzt werden, aber nicht, wie weit diese hinter der aktuellen hinterherhängen. Ohne (2) sieht man nur, daß “im Mittel” die genutzte Version nahe an der aktuellen Version liegt, aber wie weit die Streuung hinunterreicht, erkennt man nicht. (Auch die Fehlerbalken kann nicht jeder richtig einordnen.) Ohne (3) habe ich zwar die Streuung der Versionen, aber (auch wegen der begrenzten Skalierbarkeit der Punkte) kann man den Mittelwert nur schwer abschätzen.
Ich kann natürlich einen Plot aus (1) und (3) und einen aus (2) und (3) erstellen. Damit wäre die Information auf übersichtlichere Plots verteilt, aber alle Zusammenhänge noch erkennbar. Andererseits ist es gerade ein Nutzen solcher Plots, unterschiedliche Daten zusammenführen zu können. Und wenn noch mehrere andere Plots dazukommen, wirkt die Seite schnell abstoßend überfrachtet.

Also wie können die drei Datensätze sinnvoller dargestellt werden? Für (1) bietet sich eigentlich nur eine Linie an, da es sich um quasikontinuierliche Daten bzw. eine skalare Funktion der Zeit handelt. Da sind Farbe und (bedingt) Linienstärke variabel. Für die Streuverteilung (2) könnte ich wieder ausgefüllte Kreise verwenden, oder andere Formen wie z.B. Quadrate oder Dreiecke, die vielleicht etwas günstiger skaliert werden. Mit welcher Farbkombination würden die sich von (1) deutlich abheben? Für (3) könnte man statt der Fehlerbalken auch breite farbige Balken in den Hintergrund stellen und den Mittelwert eigens kennzeichnen.
Ein Problem ist allerdings auch immer, daß die Objekte übereinander gezeichnet werden und sich dann teilweise verdecken (wie beim Kartenrendern…). Daher kam auch die Idee mit der Transparenz.

Ansonsten bliebe noch eine Möglichkeit, die Daten doch nur quartalsweise aufzulösen und somit zu reduzieren. Das wäre aber aus meiner Sicht ein Informationsverlust.

Ein Möglichkeit wäre die Grafik etwas größer zu machen. Zur Zeit ist das 640x480. Bei z.B. 800x600 als Vorschau und nochmal deutlich größer als Ausgangsbild könnte man einiges besser erkennen.

Im Grunde hast du mit den drei Varianten Linie (für aktuelle Version), Kreise/Punkte (für die einzelnen Versionen) und senkrechter Balken (für den Schwerpunkt der Versionen) die Information schon sehr übersichtlich gestaltet. Wegen der Farben kann man ja noch einiges ausprobieren.

Was die Übersichtlichkeit deutlich erhöhen würde, wäre eine Grafik nur für die letzten zwölf Monate, da dann die Informationsmenge geringer ist.
Der komplette Überblick kann dann zusätzlich oder nur auf Anfrage per Link zugänglich sein. Im letzteren Fall gleich als großes Bild.

Edbert (EvanE)

Ich würde ähnlich wie Edbert eine Aufteilung des JOSM-Plots in Zeitscheiben favorisieren. Dann dürfte Alles größer und damit hoffentlich auch übersichtlicher werden, ohne dass du Informationen herausnehmen musst.

Ich habe den Vorschlag “letzte zwölf Monate” einmal ausprobiert: http://wiki.openstreetmap.org/wiki/File:Josm_versions_recent.png.
Die Größe habe ich noch nicht geändert, aber allein die geringere Datenmenge schafft schon einiges an Übersicht. Außerdem habe ich die Mittelwerte deutlicher mit kleinen Rechtecken markiert und die Farbe der Punkte geändert. Hauptkriterium für die Auswahl der Farbe war, daß die Punkte einerseits deutlich genug erkennbar sein sollten, anderseits nicht (wie bei kräftigem Rot) die Fehlerbalken überstrahlen. Wie das für Leute mit Farbschwäche aussieht, weiß ich natürlich nicht, aber allein die geänderten Formen sollten eine bessere Differenzierung erlauben als vorher.
Eine Möglichkeit wäre, auf der Wikiseite nur den 12-Monate-Plot anzuzeigen und die volle Zeitreihe (dann auch deutlich größer) nur zu verlinken, um die Seite nicht zu sehr vollzukleistern.

Gefällt mir sehr gut.
Nur die kleinen Beiträge von sehr alten Versionen sind noch sehr unauffällig. Die könnten eine wesentlich kräftigere Farbe (vielleicht nur der Rand) vertragen.

Ich wäre für die Variante 12-Monate auf der Wiki-Seite und ‘komplette’ Übersicht per Link und größer.

PS: Setze mal eine Leerzeile oder einen Zeilenumbruch vor die Grafik. Dann wird der Text nicht vor die Grafik geschoben.

Edbert (EvanE)

Ich überlege mir mal, wie ich das mit variablen Farben hinbekomme. Die großen Blobs in der Nähe der Mittelwerte und Fehlerbalken möchte ich nicht zu kräftig haben - siehe oben.

Der Fehler war, daß ich die Datei per File: statt Media: verlinkt habe. Eigentlich wollte ich sie hier gar nicht angezeigt haben. Ist jetzt geändert.

JOSM sagte heute mal wieder zu mir: Sie sollten aktualisieren! :smiley:

Also wenn dieser Farbfilter halbwegs realistisch arbeitet, sollten die Farbwahl an sich auch okay sein. Für die kleinen Punkte überlege ich mir aber noch etwas.

Und daß der Plot zu Editor-Marktanteilen nicht das Gelbe (Grüne?) vom Ei war, verstehe ich jetzt auch.
Erste Verbesserung: Marker an jeder Linie. Linienstärken/Strichelung und vorteilhaftere Farben kommen später.

Also das ist jetzt Alles jedenfalls schon mal viel besser! :stuck_out_tongue:

Die Tabellen ließen sich besser erfassen, wenn die Einträge nach dem aktuellsten Wert (2012) fallend sortiert wären.

Du kannst die Tabelle durch Klick auf das Symbol hinter dem Namen nach deinen Wünschen sortieren.
Unabhängig davon wäre eine Default-Sortierung nach “, hohe Werte zuerst” zu überlegen. Ich stelle mir das auch meist so ein.

Edbert (EvanE)

Wenn ich wüßte, wie ich in einer Wiki-Tabelle eine Default-Sortierung erzwinge, bräuchte ich gar nicht zu überlegen - dann wäre das längst eingestellt.
Ansonsten müßte ich eine Sortierung direkt im Skript vornehmen. Kein Ding der Unmöglichkeit, aber lästig und gerade wegen “wikitable sortable” im Moment für mich keine Priorität. Früher oder später wird aber auch das noch kommen.

Das geht vermutlich nicht:
https://en.wikipedia.org/wiki/Help:Sorting#Initial_sort_order_of_rows

Gruß,
Mondschein