ODbL Zustimmung /ODbL Agreement rate

sollte funktionieren? hmmm… ich würde es anders nennen: es funktioniert definitiv… nettes script. danke.

Danke Moloc!!!

WFT(sorry) OMG, was hast du für einen Rechner(RAM, CPU, Festplatte)? Gut mein AMD x6 1090T @ 3,2 Ghz mit 16GB ist nun ein wenig überdimensioniert. Das Laden dauert dank DSL 6000 ein paar Sekündchen. Das Markieren und das Kopieren geht “sofort”. Das Einfügen von den paar Datensätzen in Open Office dauert keine 2 Sekunden. :wink:

@efred

Sehr Gut! Das war je einfach. :smiley:

Diese Abkürzungen sind mir unbekannt: WFT, OMG
Bitte -v

Rechner: 4 GB, Dual Core2 mit 2.4 GHz, 250 GB Festplatte, OpenOffice 3.2.1, Firefox 3.6.12

Damit wir nicht aneinander vorbeireden:
Es geht um die komplette Auswertung Deutschland http://odbl.info.nu/germany.html mit 30 000+ Tabellenzeilen.

Ach ja, in TextWrangler sind die 30 000+ Zeilen innerhalb Sekunden eingefügt.
Laden und darstellen in Firefox dauert mit DSL 3000 rund 15 Sekunden.

Edbert (EvanE)

Stand 07.12 2010 für D ** Gesamt 33365 ** davon ** 8013 Zustimmer ** und ** 25352 (noch) Nicht-Zustimmer **

Stand 09.12 2010 für D ** Gesamt 33485 ** davon ** 8209 Zustimmer ** und ** 25276 (noch) Nicht-Zustimmer **

** Gesamt 33485 ( + 120) **
** Zustimmer 8209 (+ 196) **
** (noch) Nicht-Zustimmer 25276 (- 76) **

Schön, wenn es so weitergeht, dauert’s nur noch 665 Tage, bis alle zugestimmt haben :stuck_out_tongue:

Wo wäre das Problem ? :wink:

Am 666 Tag taucht der Antichrist auf

kann nicht sein… der hat ja vor kurzem schon der ODBL zugestimmt :wink:

Funktioniert. Manchmal kommt man auf die einfachsten Sachen nicht.

Ich hab gehört, wenn man ihm eine Schriftrolle mit der Odbl entgegenhält und drei Mal laut und deutlich die CTs aufsagt, kann man ihn verbannen :stuck_out_tongue:

Genau um die geht es… Und es dauert in OO 3.2.0 ca. 2 Sekunden, aus Opera 10.63 heraus…

WTF
OMG
Ich kenne auch nicht alle auswendig, aber die ^^ sind eigentlich sehr geläufig, dachte ich.

Bin immer noch erstaunt das es bei dir mehr als 10 Minuten dauern soll?

Nahmd,

Ich hab das HTML mal zu CSV eindampfen und danach komprimieren lassen.
Die Dateien werden dadurch überschaubar, germany.csv.gz hat <600k:

http://www.netzwolf.info/kartografie/osm/odblstat/germany.csv.gz
http://www.netzwolf.info/kartografie/osm/odblstat/austria.csv.gz
http://www.netzwolf.info/kartografie/osm/odblstat/switzerland.csv.gz

Wenn der Browser keine komprimierten Dateien mag, einfach das “.gz” weglassen.

Das Zeug kann man per Browser bequem durchsuchen und/oder in Sekunden in oocalc laden.

Have fun.

Wolf

Hallo Thomas,

wenn jemand über Ländergrenzen hinweg, aber speziell (auch) im Grenzbereich mappt, werden dann nicht ev. Nodes mehrfach gewertet, weil sich die die Nodes der einzelnen Länder nicht exakt auf den Bereich innerhalb ihrer Grenzen festlegen lassen? Oder anders gefragt, wird z.B. durch grenznahe deutsche Nodes z. B. das Ergebnis der Schweiz verfälscht?
Das passiert natürlich nur, wenn die Länder einzeln “ausgewertet” werden.

Wenn das passiert, hat ein Programmierer aber gewaltig Mist gebaut.

Was sein kann, daß zwei verschiedene Programmierer anders die Ländergrenzen abarbeiten. Der eine z.B. nimmt 100%ig genau die Relation, der andere vereinfacht einfach ein Vieleck. Das heißt beim einen ist ein Node im Ergebnis Schweiz, obwohl es nur auf einer kleinen Landzunge ist, welche von Deutschland aus in die Schweiz hinein führt.

Ich vermute mal, dass die Auswertung (wie jede andere) auf den jeweiligen Länderextracten basieren. Es gibt also kleine Überschneidungen. Sicherlich könnte man zusätzlich Prüfen, ob der Node in der boundary-Relation des Landes ist. Nur was macht man dann mit den Nodes der Relation? Die gehören ja zu beiden Ländern. Diese sind also in jedem Fall doppelt gezählt. Stellt scih jetzt die Frage, ob diese Steigerung der Genauigkeit den Mehraufwand rechtfertigen würde… Meiner Meinung nach nicht. Wenn jemand es genauer haben möchte, muss er halt einen eigenen Check programmieren.

Henning hat recht. Ich lasse die Stats über die Geofrabrik Länderfiles laufen. Es geht ja auch nicht darum, ob jetzt 1000 Nodes mehr oder weniger zur neuen Lizenz gehören. Die Stats sind ja eh nur eine sehr grobe Vereinfachung, weil niemand die letztendliche Bewertungskriterien kennt. Da macht es dann auch nicht, dass da ein paar mehr Nodes drin sind.

Wäre es auch möglich eine Auswertung für die Niederlande und Spanien zu machen?

Danke für das Skript. Habe mit Perl noch nie was gemacht, ist aber sicher ganz einfach dort Zeilennummer und Datum einzufügen. Kannste Hanno bitte nochmal anstubsen? Hat er überhaupt schon reagiert oder geantwortet?

Wieviel RAM oder sonstwas braucht man, um diese Listen zu erstellen (mit Osmosis)? Wie lange dauert es etwa?

Ich sehe auch kein Problem darin ob an einer Grenze jetzt ein paar Punkte wegfallen oder dazu kommen. Das mittelt sich wahrscheinlich sogar in etwa aus.

Andere Frage:
Hast du mal darüber nachgedacht eventuell nur die Mapper aufzulisten, die

  • entweder mindestens 100 Punkte
  • oder mindestens 10 Wege
  • oder mindestens 1 Relation
    erfasst haben?

Das würde die Länge deiner Liste in etwa halbieren.
Die restlichen Mapper kannst du ja in eine zweite Datei auslagern.

Die Werte sind willkürlich gewählt, so dass in etwa eine Halbierung heraus kommt.
Die kannst du natürlich verändern, je nach dem ob du eine kürzere Liste willst oder eher eine längere.

Edbert (EvanE)

NL und ES kann ich mal laufen lassen. Hanno hat sich leider noch nicht gemeldet. Ich will aber auch nicht drängeln, da mir meine Position selber ziemlich egal ist.
Wenn jemand das Skript anpassen möchte, nur zu. Ich kann es nicht und möchte mich deswegen auch nicht mit Perl beschäftigen.

Ich lasse das mit 3GB RAM auf einem Dual Core Rechner laufen. Osmosis liesst die Datei und gibt sie als *.osm an stdout, wo sie von dem Perl Skript gelesen wird.
DE dauert dabei ein paar Stunden.
Die von Edbert vorgeschlagenen Edits kann ich zumindest für DE machen, in dem ich einfach die html Datei ändere. Das krieg sogar ich hin…(hoffentlich)