Boteinsatz für Wikipedia-Tag möglich?

Über die Wikipedia sind diese Woche eine Handvoll Benutzer neu zu OSM gekommen. Unser Ziel ist es, die Objekte zu den deutschen Landkreisen, Ämter und Gemeinden flöchendeckend mit dem zugehörigen Wikipedia-Artikel zu verknüpfen, damit diese dann im einblendbaren OSM-Gadget von Wikipedia als rot umrandete und hinterlegte Fläche erscheinen und nciht mehr wie bisher als Punkt in der Karte.

Bei 11250 Gemeinden viel Arbeit. Kann man das mit einem Bot beschleunigen? Ich habe gesehen, dass alle Polygone das Attribut “de:amtlicher_gemeindeschluessel” verwenden. Eine Arbeitsliste “Gemeindeschlüssel <-> Wikipedia-Artikel” liegt vor.

Viele Grüße

Belem

Technisch ist das möglich, allerdings sollte hier die entsprechende Richtlinie beachtet werden, sonst könnte das Ärger mit der DWG geben:
http://wiki.openstreetmap.org/wiki/Import/Guidelines

Gruß,
Mondschein

Aktuell sind alle Importe und Bots untersagt.

Zur Erklärung: Seit einigen Tagen findet eine umfangeiche Bot-Bearbeitung im Zusammenhang mit dem laufenden Lizenzwechsel-Prozess statt. Während dieser Zeit sollen keine anderen Bots laufen, damit sie dem Lizenz-Bot nicht in die Quere kommen und die Server nicht überlastet werden. Man müsste mit dieser Aktion also noch ein bisschen warten, bis der Lizenz-Bot fertig ist.

An sich halte ich den Einsatz eines Bots für die Ergänzung dieser Wikipedia-Tags aber für eine gute Idee! Die Aufgabe sollte sich verhältnismäßig leicht automatisieren lassen und wäre von Hand sehr mühselig. Eine saubere Durchführung vorausgesetzt (wie in den bereits verlinkten Guidelines beschrieben, also u.a. mit angemessener Dokumentation und Ankündigung auch auf der Mailingliste) würde ich die Aktion begrüßen.

Rechtlich müsste man noch klären, woher diese Liste mit der Zuordnung von Gemeindeschlüssel und Wikipedia-Artikel stammt?

Also wenn das nicht automatisiert gehen sollte, haben sich Arbeitslisten auf Bundesland-Ebene bei uns schon sehr bewährt. Wir sind ja in Deutschland doch ein paar Leute, da geht das schnell von der Hand :slight_smile:

…und da es noch niemand gemacht hat… Herzlich willkommen im Forum Belem :slight_smile:
Georg

Noch ein paar Fragen nachgeschoben … mit den internen Abläufen der OSM bin ich nicht vertraut

  1. Lohnt sich denn das warten auf das Ende der Lizenzumstellung? In der Wikipedia hat sich ein Team zusammengefunden, das die Daten derzeit manuell nachträgt. Das geht voran, mühsam bleibt es dennoch. Den aktuellen Stand dokumentieren wir unter http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Kommunen_und_Landkreise_in_Deutschland/OSM
  2. Kann ein erfahrener OSM-ler bei der Erstellung eines guideline-konformen Botauftrags behilflich sein? Eine Arbeitsliste gibt es unter freier Lizenz bei einem Wikipedia-Benutzer unter http://de.wikipedia.org/wiki/Benutzer:Alexrk2/Gemeindeliste

Wenn das alles klappt, können wir auch das Taggen für Gebietseinheiten in anderen Staaten angehen. Die Begeisterung für die Karten in unserem OSM-Gadget ist in der Wikipedia zu spüren.

Danke und viele Grüße

Belem

Ich find die Liste super, werd heute abend mal mit MV weiter machen :slight_smile:
Mit http://ags.misterboo.de kommt ihr auch fix an die passenden Relationen ran.

Ich würde davon abraten, die Änderungen vor dem Ende des Lizenzbotlaufs durchzuführen:
http://lists.openstreetmap.org/pipermail/announce/2012-July/000066.html

Was meinst du mit “Botauftrag”?

Also das Wichtigste ist die Diskussion mit der lokalen Community, also uns. :slight_smile:
Das sollte aber eher kein Problem sein. :wink:
Dann solltet ihr sagen, wie das genau technisch umgesetzt wird, um kaputte Daten zu vermeiden.
D.h. ihr braucht erst einmal einen Bot. :slight_smile:
Außerdem sollte für die Änderungen ein eigener Account verwendet werden.

Am besten du schreibst auch noch auf talk-de und imports (dort ist auch Frederik Ramm unterwegs).
Wenn du nicht nur hier, sondern auch dort genau beschreibst, um was es geht und wie das umgesetzt werden soll, dann wirst du sicher die passenden Antworten erhalten.

Gruß,
Mondschein

Ob es sich lohnt müsst ihr entscheiden. Wenn es der Gruppe zu viel ist wartet ihr, wenn nicht macht ihr so weiter. Mir wäre es ehrlich gesagt zu blöd 10000 Objekte einzeln einzutragen :wink:

Die Zeit kann man sinnvoller nutzen. Bspw. zum Remapping :wink:

und hier mein Senf:
ihr wollt von ca 10000 Gemeinden die tags erweitern. prima.

  • klären, welche Tags verwendet werden sollen
  • wo sollen die dran? ich schätze mal an die Administrativen Grenzen
  • dann braucht ihr “nur” über den Gemeindeschlüssel (der ist ja anscheinend die Verbindung zwischen euren Daten und den Osm-Daten) die Relation zu finden, zu ändern und hochzuladen. Das ist der Bot.

Probleme, die ich erwarte:

  • der Lizenz-Bot hat Grenzen oder den tag “de:amtlicher_gemeindeschluessel” gelöscht
  • Die beiden Datenbestände sind nicht deckungsgleich. Gemeinden fehlen bei OSM oder sind bei euch nicht drin
  • nicht alle Gemeinden bei OSM haben einen Gemeindeschlüssel. (“wir” haben 10077 Grenzen mit GS drin)
  • Gemeinden sind nur als Site drin (Node) ohne Grenzen.
  • Pflege der Daten nach dem Import (Umstrukturierungen der Schlüssel, Eingemeindungen, …)

Probleme, die ich nicht erwarte

  • automatische Einträge fehlender Gemeinden (wie denn auch?)
  • Zerstörung fremder Tags

Vorteile für OSM: Liste eventuell fehlender oder unvollständiger Gemeinden → Quality Control

Gerade weil 2 Sachen nicht vorkommen (Eintragen neuer Objekte und Änderung von Tags) sehe ich die ganze Chausse als unproblematisch an. Dennoch müsst ihr die bereits erwähnten Spielregeln einhalten.

Gruss
walter

Hi Belem,

wie hab ich das zu verstehen? Wer trägt wo was ein? Ihr im Wiki oder ihr in OSM?
Ich kann es mir nicht vorstellen, dass ihr da was in Osm eintragt (das Tagging ist ja noch nicht klar) aber lieber hake ich mal nach.

Gruss
walter

p.s. unser wikipedial-link wikipedia=* , der ja zu dem Gemeinde-Artikel in eurem Wiki führt, ist nur bei 1663 Gemeinden drin. Das könnte der Bot doch auch machen?
Da müsste man aber drauf achten, dass alte Werte nicht automatisch überschrieben werden.

momang: Ist das etwa der Tag, um den es die ganze Zeit geht? Wenn ja, muss ich “meinen Senf” nochmal umformulieren. sorry, zu spät gemerkt. aber besser ich als ihr :wink:

http://www.openstreetmap.org/user/NordNordWest
sie sind doch schon am editieren (gibt bestimmt noch mehr Nutzer, die man anhand der Liste ausfindig machen könnte, aber ich bin zu faul^^)

:wink: ja genau. Er soll aber an die Grenzrelationen, damit er genauso schön wie bei der Google Suche die Grenze zeigt

Nach den zum 1. Juli 2012 in Kraft getretenen Gebietsveränderungen gibt es in Deutschland noch 11250 Gemeinden. Alle diese Änderungen dokumentieren wir unter http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Kommunen_und_Landkreise_in_Deutschland/Aktuelle_Gemeindegebietsver%C3%A4nderungen und arbeiten die auch recht zeitnah, meist direkt zum Stichtag ein.

Ich sehe da durchaus Aspekte, wo sich beide Projekte bestens ergänzen. Offenbar fehlen Euch gut 1000 Gemeindeschlüssel, die man ergänzen kann. Flächen und Einwohnerzahlen haben wir auch - in einem Dreivierteljahr, wenn unsere Plattform Wikidata online geht, sogar als offene Schnittstelle.

An der Pflege der Daten bei Eingemeindungen oder Umbenennungen haben wir selbst größtes Interesse. Die OSM-Karten sind bei uns ja direkt im Kopf der Artikel eingebunden. Da zeigt also sehr vieles in die gleiche Richtung.

Schon diese diese Woche sind uns ein paar Eingemeindungen aufgefallen, die bei Euch nicht eingearbeitet waren: Annaburg, Landkreis Wittenberg, Sachsen-Anhalt ist schon korrigiert, in Quedlinburg, Landkreis Harz, Sachsen-Anhalt fehlen noch die Anfang 2011 eingemeindeten Gebiete um Gernrode/Bad Suderode/Rieder. Wenn was auffällt, melden wir das gerne weiter.

Mal konkret:
Wann ist denn damit zu rechnen, dass der Lizenz-Bot durchgelaufen ist? Ist das mehr eine Frage von ein paar Tagen oder von ein paar Wochen?
Und wie gehen wir das dann genau an?
Wie oben schon ausgeführt, geht es jetzt darum, bei den deutschen Landkreisen, Gemeindeverbänden, Gemeinden den Tag wikipedia=de:Name des Artikels zu ergänzen. Als Verknüpfung würde uns der Amtliche Gemeindeschlüssel dienen. Die Daten liegen in einer CSV-Datei vor. Die Nachkontrolle und an einigen Stellen wohl notwenige Ergänzung würden wir übernehmen, dokumentieren und Euch dann zukommen lassen.

Wenn der erste Lauf dieser Art klappt, können wir auch weitere Daten (Fläche, Einwohnerzahlen, Websites, Bürgermeister … was immer Euch interessiert) aufbereiten. Ebenso können wir das für andere Staaten nachziehen. In der Schweiz gibt es nur noch wenige Gemeinden, die keinen Wikipedia-Tag haben, in Österreich noch sehr viele.

Beste Grüße

Belem

tja, klasse projektplanung.

erst mal anfangen und dann nachfragen. :frowning:

Hab vorhin nicht geschnallt, dass es genau um wikipedia=* geht; dachte, die wollten was extra machen. na ja, dann ist es eben kein neuer tag. macht die sache noch einfacher.
Gruss
walter

Und Nachtrag @wambacher:
Ja, wir haben bereits damit begonnen, den Tag wikipedia=de:Name des Wikipedia-Artikels bei Euch einzutragen. Dieser Tag ist die Verknüfung zwischen Euren Objekten und unseren Artikeln. Und wir setzen den Tag nur an die Gemeinderelationen, denn wir wollen, dass die Gemeinde in unserem OSM-Gadget als rot umrandete und hinterlegte Fläche erscheint.

Wie das konkret bei uns aussieht, kann man sich zum Beispiel unter http://de.wikipedia.org/wiki/Loitz ansehen. Dort rechts oben neben den Koordinaten auf “Karte” klicken. Funktioniert derzeit nur störungsfrei unter Firefox.

Belem

Sorry dafür. Wir sind alle erst diese Woche zu OSM gestoßen. Der Weg, den wir zu Anfang gegangen sind, ist der, den unser Schnittstellenmann Kolossos unter http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Georeferenzierung/Anwendungen/OpenStreetMap/WIWOSM für die Mithilfe beschrieben hat.

Die Idee, der Befüllung durch einen Bot, kam mir erst als jemand den Lizenz-Bot erwähnte.

Gruß

Belem

Prima so. Da sollte man aber nochmals gesondert drüber sprechen. Hier geht es erstmal um den Bot und das Drum- und Dran.

Meine Schätzung liegt bei 1-2 Wochen.

wie der Tag genau aussehen soll, müsste ihr erst klären. Drin haben wir 1663 x wikipedia=* und 44 x wikipedia:de=* . was da gut oder böse ist, braucht ihr mich nicht fragen. Kolossos ist glaub ich einer der Euren, fragt den mal. Und das Forum natürlich…

Nix mit “Nachkontrolle” - Vorkontrolle ist angesagt. Vor dem Bot die Daten sauber machen und nicht nachher liegen lassen :wink: Das geht prima in der Zeit, wo der Bot noch nicht laufen darf.

Eben das “interessiert” uns nicht so doll. (ist zumindest meine Meinung als “mappus nativus”) Flächen berechnen wir einfach aus der Geometrie - ist ja schliesslich eine Geo-DB, website könnten wir wohl nehmen aber der Rest ist doch prima im Wiki aufgehoben. Ihr wollt vom Wiki auf OSM zugreifen, klar. Aber wir können/wollen/werden natürlich auch von OSM auf Wiki zugreifen. Warum das dann doppelt halten?

Jo, dass macht wohl Sinn. Aber vergesst nicht, die jeweilige Community einzubinden.

Gruss
walter

p.s. 1 sorry für die kleine Verwirrung vorhin

p.s.2 das ist hier meine absolute Privatmeinung; ich spreche hier nicht im Auftrag von OSM. Du wirst aber sicher noch was von den Kollegen hören. Aber allzu große Abweichungen erwarte ich eigentlich nicht, oder?

Nachtrag: Kolossos ist also bereits im Boot. Prima!

Mit Nachkontrolle meinte ich eigentlich solche Fälle wie die oben geschilderten Annaburg, Quedlinburg, wo Gebietsänderungen noch nicht in die OSM-Karten eingearbeiten sind/waren und die Fälle, wo uns der bei Euch fehelnde Gemeindeschlüssel die manuelle Nacharbeit nicht erspart.

Unsere CSV-Liste ist schon überprüft.

Beste Grüße

Belem