Graue Kacheln in OpenStreetMap.com

In den Statistiken des Renderservers odin, der u.a. für Deutschland zuständig ist, ist mir die “Dirty queue” bei “Renderd queue length” aufgefallen, die sich letzte Woche erholt hat, aber seit gestern wieder erneut stark angestiegen ist:

https://munin.openstreetmap.org/openstreetmap.org/odin.openstreetmap.org/renderd_queue.html

Hab aber keine Ahnung, warum.

Es handelt sich um eine Geometrieberechnung in der Datenbank, die halt sehr häufig für jedes Polygon mit Namen ausgeführt werden muß. Da ist ein Index völlig nutzlos. Indexe helfen nur beim schnellen Auffinden von Daten, wenn diese Funktion genutzt wird, hat die DB die Daten bereits geholt.

Das einzige was hier helfen würde ist der Upgrade der Datenbank auf die aktuelle Version, in der diese Funktion optimiert wurde und ohne Leistungsverlust funktioniert.

Diesen Kartenstil auf Server mit einer alten Datenbank zu werfen ist schlichtweg ein Fehler. Ich würde wetten, daß auf dem Entwicklungsserver die allerneuste DB-Version installiert ist und man einfach übersehen hat, daß die Produktivserver ganz anders aussehen. Und es ist in den Tickets nachzulesen, daß man sich durchaus bewußt war, wie langsam die neue Methode ist und es trotzdem durchgezogen hat.

Fehler können immer mal vorkommen. Das einzige was ich nicht verstehe ist daß ein massiver und unnötiger Leistungsverlust seit zwei Wochen niemand von den Verantwortlichen interessiert. :frowning:
In dem betreffenden Ticket werden alle Problemmeldungen immer wieder abgewiegelt. Derzeit werden die grauen Kacheln auf Cacheprobleme geschoben obwohl die “attempted render” und “dropped tiles” in den Serverstatistiken eindeutig zeigen, daß die Render Server exakt seit dem Update ein Problem haben.

Wenn es mein Murks auf meinem eigenen Server wäre, würde mich sowas echt ärgern und wäre spätestens am nächsten Wochenende behoben.

Es gibt korrespondierende Zacken bei Apache und Firewall Durchsatz. Sieht so aus als ob einfach mehr Tiles von außen abgefragt werden - und wie gesagt: Durch den neuen Stil ist der Server jetzt dauerhaft etwas langsamer in der Abarbeitung geworden, eine Last die vorher nur “ziemlich hoch” war könnte jetzt zuviel sein.

ST_PointOnSurface ist kein Nice-to-Have, sondern eine Notwendigkeit für Vektortiles. Sonst gibt es das hier:

Die Debatte in https://github.com/gravitystorm/openstreetmap-carto/issues/1644 ist etwas zerfasert, aber soweit ich das verstehe ist ST_PointOnSurface nicht zwangsläufig besser, aber definitiv mehrfach langsamer.

Pferdekutschen haben auch ihren Charme, trotzdem fahr ich lieber Auto :wink:

Heute, Donnerstag 20.02. 4:30 Uhr lief alles glatt wie in früheren Zeiten. Nichtdestotrotz könnte darüber nachgedacht werden, wie sich solche Vorkommnisse z. B. durch parallele Testläufe auf nichtproduktiven Servern vermeiden lassen. Ich werde versuchen, auf der nächsten Fossgis Konferenz, die kommenden Monat stattfindet, Ansprechpartner zu finden.

Ist von den am Thread Beteiligten noch jemand dort?

Das würde ich so global nicht sagen. Vermutlich haben wir nur Glück und hängen an einem großen Server. Neurendern für hohe Zoomlevel sollten immer noch länger dauern als früher, aber das ist schwer zu messen.

Laut Statistik verlieren immer noch 4 Server Tiles. Hier die Grafiken für rhaegal. Man sieht daß nur die Kacheln mit der höchsten Priorität durchkommen (grün) und vermutlich auch da nicht alle, die anderen werden gedroppt.

In dieser Jahresstatistik wird die Zeit für das Rendern notiert. Es ist deutlich zu erkennen, daß das Rendern seit ca. September deutlich langsamer geworden ist. Ich weiß nicht was das für eine Änderung war, aber es gab bereits ein früheres Carto-Update das die ersten Umstellungen auf Datenbank-Punktberechnungen enthielt, das muß für einen der Zacken verantwortlich sein.

Im Februar wurde es nochmal deutlich langsamer, vor allem in den hohen Zoomleveln. Die Grafik ist von einem der kleineren Server, aber das Muster findet sich bei allen wieder, sie brauchen alle deutlich mehr Zeit zum Rendern. Die langsameren Server scheinen durch die “Verbesserungen” am Stil inzwischen ziemlich am Anschlag zu sein.

Ich hatte heute früh eine “geschlossenen” Arztpraxis geändert und wieder eröffnet. Gerendert (name=*) wird nichts. Zur Kontrolle kann man https://www.openstreetmap.org/node/4442294657#map=20/50.99456/13.64553&layers=HN
nutzen, dort ist schnell geändert.

Nur so als Tipp …

Habe seit einer Minute das Bild:

Da kommt auch nix mehr, das Laden ist beendet.

Einzelne graue Kacheln wären ja okay. Aber der derzeitige Zustand ist wirklich eine Blamage des gesamten OSM-Projekts! Ich erwarte einklich, dass der Vorzustand unverzüglich wieder hergestellt wird und die auslösende Änderung der Abfragestruktur, wie sinnvoll sie auch sein mag, erst nach ausführlichen Tests im Live-System scharfgeschaltet wird.

–ks

Ein Bekannter meinte zum Problem der grauen Kacheln: „Das ist wahrscheinlich der Brexit … Irgendwann kommt dann eben nur noch grau.“ :wink:

Ich beobachte Ähnliches und würde mich dem anschließen.

Falls es andere Möglichkeiten geben sollte, das Problem zu beheben, ohne zur alten Version zurückzukehren, fände ich das allerdings mindestens genausogut. :wink: Wie war das nochmal – mit einer neueren postgresql/postgis-Version, in der diese Funktion optimiert wurde, würde das Rendern wieder besser funktionieren? Das klingt doch super. Was ist denn dann das Problem, das verhindert, dass die Software aktualisiert wird? Drohen Datenverluste?

Es muss die komplette OSM-Datenbank neu eingespielt werden. Das geht nicht mal eben so in 10 Minuten.

Das ist klar, und ich habe auch allen Respekt vor den klugen Menschen, die das machen! Ich wollte niemanden beschuldigen, kritisieren oder herabsetzen! Aber da derzeit z.B. die „Standard“-Karte auf osm.org sowieso nicht mehr brauchbar ist (siehe kreuzschnabels Beispielbild), wäre es doch vielleicht der Erwägung wert, andere Arbeiten vorübergehend einzustellen, vor die Website einen Platzhalter „Baustelle“ zu schalten (das sähe mMn sogar besser als diese grauen Kacheln) und sich der Neueinspielung der Datenbank zuzuwenden.

Weiß nicht woran es liegt, aber ich habe das Problem seit gestern abend nur noch vereinzelt. Wobei einzeln wörtlich zu nehmen ist.

Hmm, komisch, bei der RBB Abendshow gestern lief die OSM Karte sehr flott… :sunglasses:

https://www.rbb-online.de/abendshow/ (ab Minute 32:00)

Kann es auch sein, dass der Traffic massiv zugenommen hat, weil viele auf die Schnelle zu osm.org gewechselt sind, auf Grund von

https://phabricator.wikimedia.org/T245145#5880898

"The Wikimedia Maps service was recently hit with a large amount of traffic coming from non-Wikimedia websites that caused a service disruption. The Wikimedia Foundation system administrators decided to block all traffic to Wikimedia Maps from non-Wikimedia websites in order to ensure that it remained available for Wikimedia projects. The WMF has not yet decided how long this restriction will last or if it will become permanent. T244278 should have more information as it becomes available.

I would suggest that you choose a different tileserver."

Ich habe mal ein neues Issue erstellt:
https://github.com/openstreetmap/operations/issues/366

Jetzt läuft’s bei mir wieder wie gewohnt. Karte verschieben, ¼ Sekunde grau, dann alles da.

–ks

Ich beobachte bei den grauen Kacheln ein etwas anderes Problem. Die grauen Kacheln sind dabei nur der sichtbare Teil. Ein anderer Teil sind offensichtlich das Renden der Grafiken. Gerade wenn jemand an einer Stelle was gemappt hatte, sind alte Grafiken und neu gerenderte Grafiken direkt nebeneinander. Das sieht mMn. auch nicht toll aus.

Ich habe alle im Firefox (-> Seiteninformationen/Medien) angezeigten Grafiken einzeln mit /dirty neu rendern lassen. Dabei fällt auf, daß einige Grafiken beim Neu-Rendern mehrere Minuten brauchen. Andere sind sofort, innerhalb von 1 bis 2 Sekunden neu gerendert.

Das liegt daran, dass /dirty nichts macht (seit Ewigkeiten).

Wenn /dirty nichts bewirkt, wieso habe ich dann alle Kachel im Browser auf einmal im aktellen Stand, so wie es sein soll?

Ich habe die Seite nicht mit F5 neugeladen.

Weil du gar nicht mit dem Renderingserver kommunizierst sondern mit dem Tilecache vorne dran (d.h. es funktioniert hin-und-wieder für eine spezifische Kachel, je nach Einstellung), da die Kacheln aber so oder so on-demand neugerenderet werden falls sie nicht aktuell sind, siehst du dann irgendwann natürlich den aktuellen Stand egal on du /dirty verwendet hast oder nicht.