ich würde eh empfehlen, sowas nicht in OO, LO oder xls zu importieren. 7 MB HTML sind zu viele Daten und das dauert zu lange das zu verarbeiten.
Um “nur” die Position einer Person zu sehen, empfehle ich, die Datei runterzuladen (Rechtsklick auf den Link und “Ziel Speichern unter” auswählen) und diese html-datei dann mit einem vernünftigen Texteditor zu öffnen (unter Ubuntu z.b. gedit, und in Windows empfehle ich den Notepad++ zu installieren und diesen zu verwenden). Dann sieht man auch gleich die Zeilennummer…
Edit: sorry… ich habe diese Datei mit einer anderen Datei verwechselt… Diese html-datei muss natürlich in FF oder IE (oder Opera, Chrome, oder was auch immer) zuerst geöffnet werden. Alles markieren und dann im jeweiligen Wunsch-Texteditor eingefügt werden… wie gesagt, ich empfehle gedit und Notepad++, dann sieht man gleich die Zeilennummer.
WFT(sorry) OMG, was hast du für einen Rechner(RAM, CPU, Festplatte)? Gut mein AMD x6 1090T @ 3,2 Ghz mit 16GB ist nun ein wenig überdimensioniert. Das Laden dauert dank DSL 6000 ein paar Sekündchen. Das Markieren und das Kopieren geht “sofort”. Das Einfügen von den paar Datensätzen in Open Office dauert keine 2 Sekunden.
wenn jemand über Ländergrenzen hinweg, aber speziell (auch) im Grenzbereich mappt, werden dann nicht ev. Nodes mehrfach gewertet, weil sich die die Nodes der einzelnen Länder nicht exakt auf den Bereich innerhalb ihrer Grenzen festlegen lassen? Oder anders gefragt, wird z.B. durch grenznahe deutsche Nodes z. B. das Ergebnis der Schweiz verfälscht?
Das passiert natürlich nur, wenn die Länder einzeln “ausgewertet” werden.
Wenn das passiert, hat ein Programmierer aber gewaltig Mist gebaut.
Was sein kann, daß zwei verschiedene Programmierer anders die Ländergrenzen abarbeiten. Der eine z.B. nimmt 100%ig genau die Relation, der andere vereinfacht einfach ein Vieleck. Das heißt beim einen ist ein Node im Ergebnis Schweiz, obwohl es nur auf einer kleinen Landzunge ist, welche von Deutschland aus in die Schweiz hinein führt.
Ich vermute mal, dass die Auswertung (wie jede andere) auf den jeweiligen Länderextracten basieren. Es gibt also kleine Überschneidungen. Sicherlich könnte man zusätzlich Prüfen, ob der Node in der boundary-Relation des Landes ist. Nur was macht man dann mit den Nodes der Relation? Die gehören ja zu beiden Ländern. Diese sind also in jedem Fall doppelt gezählt. Stellt scih jetzt die Frage, ob diese Steigerung der Genauigkeit den Mehraufwand rechtfertigen würde… Meiner Meinung nach nicht. Wenn jemand es genauer haben möchte, muss er halt einen eigenen Check programmieren.
Henning hat recht. Ich lasse die Stats über die Geofrabrik Länderfiles laufen. Es geht ja auch nicht darum, ob jetzt 1000 Nodes mehr oder weniger zur neuen Lizenz gehören. Die Stats sind ja eh nur eine sehr grobe Vereinfachung, weil niemand die letztendliche Bewertungskriterien kennt. Da macht es dann auch nicht, dass da ein paar mehr Nodes drin sind.
Wäre es auch möglich eine Auswertung für die Niederlande und Spanien zu machen?
Danke für das Skript. Habe mit Perl noch nie was gemacht, ist aber sicher ganz einfach dort Zeilennummer und Datum einzufügen. Kannste Hanno bitte nochmal anstubsen? Hat er überhaupt schon reagiert oder geantwortet?
Wieviel RAM oder sonstwas braucht man, um diese Listen zu erstellen (mit Osmosis)? Wie lange dauert es etwa?