Tile-Caches für Deutschland

Meine Idee für ein weiteres Vorgehen wäre:

  1. herausfinden, was eigentlich das aktuelle Problem ist. Könnte ja gut sein, dass die deutlich angestiegene Überlastung mancher Caches z.B. einfach am Ausfall des Kalessin Servers liegt und dessen Reaktivierung erst mal schon Abhilfe schafft.
  2. die bestehenden Sponsoren fragen, ob sie nicht ihren Server upgraden wollen/können
  3. neue Sponsoren finden, z.B. per Spendenaufruf offiziell über den Fossgis (Blog/Tweet/Mail)

Ein Problem scheint auch die sehr unterschiedliche Kapazität der Server zu sein, da jeder im DNS Round-Robin die gleiche Last abkriegt, mit der die schwächeren dann Probleme haben:

https://github.com/openstreetmap/operations/issues/299#issuecomment-490058157

Das heißt, eine konkretere Vorgabe zur benötigten Hardware wäre schon hilfreich, um einheitliche Kapazitäten zu bekommen.

Vielleicht kann der Fossgis selbst einen oder mehrere Server anmieten und das Geld über (abzugfähige) Spenden wieder reinholen?

DNS Round-Robin funktioniert nicht unbedingt, wie man’s erwartet. Ich hatte mal unter Linux das Phänomen, dass der Resolver Adressen bevorzugt, die einen möglichst großen Präfix mit meiner eigenen teilen. K.a. ob das noch so ist.
Ansonsten könnte man stärkeren Servern mehrere IP-Adressen geben und so tricksen. Oder schauen, dass man das DNS-RR gewichten kann. Load Balancing ist eine Wissenschaft für sich selbst.

Das wäre auch noch meine Frage, ob man nicht auch den Konqi wieder under halber Last reaktivieren kann, indem man z.B. die anderen Server doppelt ins Round-Robin nimmt, hab selbst aber keine Ahnung davon.

@Michael: Sehe ich auch so. Und danke für das Nachfragen!

Connections through firewall, Spitzenwert:

                 1. Juli,     6. Juli

konqi: 34 k, xxx
keizer: 40 k, 75 k
katie: 30 k, 50 k
kalessin: nix, nix
gackelchen: 34 k, 36 k

  1. keizer und katie haben wohl den Ausfall von konqi kompensiert…?

  2. Die Hardware von keizer und katie ist soweit OK, liegt im unteren Bereich der „Spezifikation“.

  3. gackelchen und konqi passen von der Leistung her auch ins Bild

  4. kalessin läuft zwar, tut aber nix. Bis dahin war der Output vergleichbar mit katie, also auch OK.

Zusammengefaßt: Seit Mitte Juni bis heute ist die hälfte der Kapazität flöten gegangen.

Fragen:
Was ist mit kalessin? Wird das wieder?
Und konqi? Ist der einfach abgeraucht? Gibts da von EUserv vielleicht Ersatz?

Ich denke nicht, dass wir mit halb… weiter kommen.

Zu 2. katie und keizer stehen bei Hetzner. Die sollten wir wahrscheinlich nicht nochmals fragen… :wink:
Zu 3. Volle Zustimmung!

PS: Eine Aktueller EX/AX – Rechner von Hetzner (40 Euro im Monat) wäre wahrscheinlich schneller als alles was wir bisher haben (mehr RAM, mehr CPU und SSDs).

Kalessin ist nun dank FireFishy wieder im Betrieb. Damit dürfte die Lage wieder besser werden.

Wer trotzdem der überlasteten OSM Infrastruktur einen Gefallen tun will bzw. deren Schwankungen weniger ausgesetzt sein will: ich kann für interessante nicht-kommerzielle OSM-Community Projekte (z.B. brouter-web) oder rein private Hobby-Webseiten auch einen Tilezugang anbieten, bei dem die allerdings nicht ggf. minütlich aktualisiert werden wie bei osm.org. Letzteres ist aber auch nur für die Mapper-Tätigkeit wichtig, um Bearbeitungen am OSM Datenbestand zu überprüfen.
Schreibt mir dazu einfach eine Mail an osmap (at) osmap.info mit Infos zum Projekt/Webseite/App und ob Eure Zugriffe/Benutzer eher aus dem D-A-CH Raum oder weltweit kommen (für beides ist ein System bereit).

Ich dachte das wäre Absicht, aber der ist wohl nach einem Reboot nicht wieder aufgetaucht und der Provider hat noch nicht geantwortet [1]:

Kann es aktuell sein, das die Tile-Server momentan der massen schlecht liefern, so das man auch nach mind. 2 h über STRG F5 keine Aktualität der Grundkarte erreicht? Früher war das innerhalb 2 Min. möglich!
P.S. Kann das jemand bestätigen?
P.P.S: Immer noch keinen Kontakt zum Hauptserver nach 4h und damit keine Aktualität. Was ist passiert?

Kann ich bestätigen. Auch Änderungen, die ich vor 4 Tagen gemacht habe, sind bisher nicht in Carto enthalten. Zudem lieferte mir der Server seit ca. 20 Minuten nur noch folgendes:

Also grundsätzlich wäre ich bereit 40 EUR/Monat in den Ring zu schmeißen um einen Server zu sponsorn. An wen muss ich mich denn für die Spende wenden und wer übernimmt dann die Servereinrichtung/Wartung?

Gestern Abend gab es eine Pause bei der Aktualisierung der Rendering-Datenbank, keine Ahnung warum:

Live-Statistik Data import lag - Odin

Vielleicht war das die Ursache, das aktuelle Cache-Problem äußert sich eher in langsam ladenden oder grauen Tiles. Seit Kalessin wieder aktiv ist, scheint es gefühlt etwas besser zu sein aber noch nicht gut, Konqi ist immer noch nicht wieder da.

Was heißt “Kontakt zum Hauptserver”? Separates Problem?

Laut [1] kontaktiert man dazu zur Abstimmung die Operations Working Group per E-Mail an operations@osmfoundation.org:

So wie ich das verstehe, stellt bisher der Sponsor den Server (nicht das Geld), teilt also die Zugangsdaten mit und die Einrichtung erfolgt dann durch die Sysadmins (die haben Scripte dazu).

Ich will natürlich niemanden abhalten, aber meine persönliche Meinung wäre, dass Mapper nicht auch noch für die Server aufkommen sollten, sondern Firmen und andere Nutzer von OSM, die sonst nichts beitragen.

Ich bin wie gesagt bereit, die Betriebskosten von ca. 500 EUR/Jahr gegen Spendenquittung zu übernehmen, aber ich habe überhaupt keine Lust irgendwelche Verträge mit Serveranbietern zu schließen und dann die Zugangsdaten zu dem Servern an Dritte weiterzureichen - der Server soll auf mich laufen/registriert sein, ohne das ich kontrolliere was darauf läuft?! Never trust an admin :wink: Ich will weder kaufmännische noch technische Verantwortung für einen Server übernehmen.

Da müsste dann der FOSSGISS vielleicht mal in Deutschland Werbung bei einschlägigen Firmen/Institutionen machen. Warum gibt’s eigentlich keine Server an den Unis, die Geographie, GIS u.ä. als Studienfächer anbieten?

Der Tile-Server hat ein massives Problem seit Samstag.
https://munin.openstreetmap.org/openstreetmap.org/odin.openstreetmap.org/index.html
Die Werte im Bereich Festplatten/IO sind alle eingebrochen
Drastisch ist der Temperatur-Anstieg der beiden NVME-Festplatten, vermutlich die Platten auf denen die Tiles liegen.
Ich tippe darauf, daß Lüfter ausgefallen sind.

Wer will, wer mag darf die OWG kontaktieren…

Auf welchen Graph genau beziehst Du Dich (Link)?

Die werden wohl auch erst seit kurzem überhaupt richtig genutzt?
https://munin.openstreetmap.org/openstreetmap.org/odin.openstreetmap.org/diskstats_utilization/nvme0n1.html

Also für mich sieht auf dem Tile-Server Odin alles normal aus.

Sowohl Rendering-Aktivität renderd processed, als auch Aktualität der Tiles in mod tile fresh (freshness of served tiles).

Kann jemand ein Beispiel verlinken, wo Tiles nicht aktuell sind?

Wenn ich auf OSMF Server Info nach “server for www.openstreetmap.org” schaue, sehe ich dort Lastspitzen gestern, z.B. bei load (spike-06) und load (thorn-01).

Daher vermute ich temporäre Überlastung, sollte das öfters vorkommen, bitte neuen Faden aufmachen.

Ja, hier z.B.: https://www.openstreetmap.org/#map=17/53.32404/7.31138 Dort sind Änderungen, die ich vor 5 Tagen gemacht habe, nicht sichtbar. An anderen Stellen scheint es aber zu funktionieren, meine Änderungen in der Nordeifel von gestern Abend hingegen werden bereits angezeigt.

Nicht aktuelle Tiles gibt’s nicht nur in Deutschland, sondern auch an meinem aktuellen Standort Schweden.

/hca

fan speeds, HDD temperature
https://munin.openstreetmap.org/openstreetmap.org/odin.openstreetmap.org/index.html#sensors
Außerdem die S.M.A.R.T. Werte

Was mich betrifft, ich beobachte das seit genau Samstag Morgen da mir meine Änderung von Freitag Abend nicht (wie üblich) nach einer Stunde vollständig angezeigt wurden.

Alles weitere sind Folgeprobleme. Jeder drück F5 im Browser und versuch krampfhaft zu aktualisieren. So steigt die Last am Server der in dem Fall nichts weiteres als alte Tiles ausliefern kann. … und dessen Festplatten wohl kurz vor dem Abrauchen sind.

Ich habe leider kein github-Konto um da Operations zu informieren. Kann das jemand machen? Oder IRC?

Ein an die Tile URL angehängtes “/status” (siehe siehe Wiki) sagte zuletzt erstellt am 08. Juli (Änderungen vom 10. Juli):

https://tile.openstreetmap.org/17/68197/42500.png/status (inzwischen aktuell)

Ich habe mal ein Neurendern per “/dirty” für die entsprechenden Metatiles erzwungen, jetzt sind die Änderungen da. Das ist normal nicht nötig, meistens hilft schon ein Strg+F5 (neu Laden mit Aktualisierung der Caches). Weiß nicht, was da jetzt das Problem war.