wikipedia=* a sprawa polska

Hej,

Wydawa?o mi si?, ?e wys?a?em tego posta ju? dwa dni temu, ale najwyra?niej nie klikn??em jak trzeba i musz? problem omówi? jeszcze raz…

Chodzi o tag wikipedia=* i artyku?y w ró?nych j?zykach. Dyskusja na ten temat jaki? czas temu rozwin??a si? w w?tku „podzia? administracyjny”. Da?em si? wtedy przekona?, ?e wystarczy jeden tag z namiarem na jedn? wersj? j?zykow? artyku?u i wikipedia:pl=* nie jest do niczego potrzebne, bo Wikipedia dla ka?dego artyku?u ma informacje o innych wersjach j?zykowych.

W praktyce jednak nie jest tak ró?owo. balrog-kun doda? taki wikipedia=* do wi?kszo?ci polskich miejscowo?ci, ja postanowi?em te informacje wykorzysta? w swojej mapie (http://orms…jajcus.net/). Je?li wybierze si? warstw? „miejscowo?ci” i kliknie w które? z kó?eczek poka?e si? informacja o miejscowo?ci, z linkiem do Wikipedii… angielskiej.

Mój projekt to mapa lokalna i u?ytkowników b?d? raczej interesowa? polskie artyku?y na temat obiektów. Teraz musz? si? r?cznie przeklika? przez angielsk? Wikipedi?, a z do?wiadczenia wiem, ?e wi?kszo?? nie b?dzie nawet wiedzie?, ?e ma tam linka do wersji polskiej.

Optymalnie by?oby, gdyby moja mapa dawa?a linki od razu do wersji polskiej. Ale jak to zrobi? wykorzystuj?c istniej?ce tagi w OSM i nie próbuj?c kopiowa? bazy interlinków z Wikipedii?

Mysle ze mozna skopiowac… tylko nie do OSM :slight_smile: Raczej przy generowaniu strony albo generowaniu kafelkow mapy, odrazu generowac linki w tym jezyku w ktorym chce sie je pokazac, albo wyciagajac z wikipedii, albo z jakiejs kopii. Pod http://www.openstreetmap.pl/wp-en-pl.txt i http://www.openstreetmap.pl/wp-en-pl.json umiescilem liste tytulow odpowiadajacych sobie stron angielskich i polskich o miejscach. Pierwszy plik ma poprostu dwa tytuly w kazdej linijce oddzielone # a drugi to cos jak json ale nie wiem czy to jest json. Majac to w jakims slowniku w programie, jeden lookup na obiekt w OSM powinien byc do przyjecia…

Tez zastanawialem sie jak zrobic mapke w OpenLayers z linkami do wikipedii po najechaniu na obiekt myszka i doszedlem do wniosku ze najfajniej byloby zeby lista obiektow byla przyporzadkowana do kazdego kafelka i generowana razem z nim odpowienio do powiekszenia, wtedy, mam nadzieje, przegladarka cache’owala by te linki (w jakis plikach txt albo json…) tak samo jak obrazki, i przy przesuwaniu po mapie, sciagala tylko te ktorych jeszcze nie ma… nie jestem pewien czy to sie da latwo zrobic.

Moj pomysl byl jeszcze taki zeby drogi i obszary z tagiem wikipedia podswietlaly sie w calasci, a gdzies w rogu pokazywal sie link do wikipedii albo poczatek artykulu

A jak wygenerowa?e? te pliki wp-en-pl? IMHO najlepiej by by?o, jakby da?o si? stworzy? URL do Wikipedii, który przenosi?by na odpowiedni? wersj? j?zykow? (je?li istnieje), ale nie uda?o mi si? na Wikipedii takiego czego? znale??.

Wygenerowalem recznie (w sensie skryptem ktory parsuje wszystkie te strony, ktore sciagnalem ze dwa miesiace temu i ktorych sciaganie nie znajac tytulow byloby trude do zautomatyzowania, ale za to moznaby latwo mirrorowac cala baze wikipedii cos jak mirrorowanie planet.osm).

Na kanale wikipedia tez nie znaja czegos takiego ale moznaby postawic wlasnymi srodkami, w sumie fajny pomysl.

Czesc,

Postawilem dzis cos takiego, bycmoze juz gdzies istnieje ale nie znalazlem – na samej WP nie istnieje.

Wiec skladnia jest taka:

http://wp.openstreetmap.pl/pl:Wąchock - przekierowuje na strone w jezyku o najwiekszym priorytecie na liscie jezykow ustawionych w twojej przegladarce www, odpowiadajaca stronie “Wąchock” w polskiej wp.
http://wp.openstreetmap.pl/Wąchock - to samo, bo jesli nie ma przedrostka jezyka to zakladam “en:” a angielska strona o Wąchocku ma ten sam tytuł co polska.
http://ar.wp.openstreetmap.pl/pl:Wąchock - przekierowuje na arabska strone odpowiadajaca polskiej stronie “Wąchock”, jesli istnieje, bez wzgledu na ustawienia przegladarki.

itd. - jezyk zrodlowy i docelowy moze byc dowolny ale tylko te ktore maja 2-literowe kody sa obslugiwane

Zastapienie “wp” przez “uncached-wp” albo “uncached.wp” powoduje ze lista tlumaczen jest pobierana z WP nawet jesli moj komputer juz ja zcache’owal, i cache zostaje zaktualizowany. Czy dany wynik pochodzi z cache’u czy jest swiezy mozna poznac po naglowku http “Age:”

http://wp-image.openstreetmap.pl/es:Madrid - pierwszy obrazek na hiszpanskiej stronie o Madrycie, mozna uzyc np. w (Uwaga: czesto pierwszy obrazek to nie to co bysmy chcieli)
Alternatywna forma to image.wp.openstreetmap.pl. Poddomeny mozna sobie laczyc np uncached.image.wp.openstreetmap.pl albo de.uncached.wp.openstreetmap.pl.

Okazuje sie ze udalo sie zrobic to samo po stronie przegladarki, w javascripcie, tylko wymagalo uzycia tricku zwanego JSON-P ktorego do dzisiaj nie znalem. W zwiazku z tym pozmienialem adresy nastepujaco:

wczorajsze wp.openstreetmap.pl zmienilo nazwe na cached-wp.openstreetmap.pl
teraz wp.openstreetmap.pl serwuje statyczny html ktory zawiera wyzej wspomniany javascript i robi to samo przekierowanie w przegladarce. Oczywiscie zapytania nie sa cache’owane.

Ten sam html mozna pobrac przez www.openstreetmap.pl/wp.html, np:
http://openstreetmap.pl/wp.html?en:Wąchock

i wtedy przynajmniej sam script bedzie cache’owany w przegladarce, mozna go sobie tez sciagnac i umiescic na wlasnej stronie jesli chce sie zeby szybciej sie ladowal

No to biorę Złotą Łopatkę i wykopuję temat.

Potrzebny jest ktoś, kto się zna na wikidata i będzie w stanie spowodować, żeby poniższe strony dostały element wikidata.
Oraz/lub wyjaśnił, co jest z nimi nie tak, że go nie dostają z automatu.
Lista stron:
pl:Stawiki
pl:Pałac w Walewicach
pl:Rezerwat przyrody Jezioro Drzezno
pl:Park Harcerski (Sosnowiec)
pl:Torfowisko Sosnowiec-Bory
pl:Werbka

Jest tego dużo, dużo więcej. :slight_smile:
Nawet nie wszystkie stolice województw mają.

https://www.wikidata.org/wiki/Wikidata:News/pl - Wikidata aktualności

Wikidata (w jakiej części?) tworzone sa ręcznie. Z tego co widzę to niektóre powstają automatycznie - ale nie wszystkie. (Wikidata:Bots - Wikidata https://www.wikidata.org/w/index.php?title=Special:NewPages&offset=&limit=500 )

Np. Rezerwat przyrody Jezioro Drzezno nie ma jeszcze wpisu w Wikidata.

Niektóre rezerwaty nie mają nawet strony na wiki, a co dopiero wikidata https://pl.wikipedia.org/wiki/Rezerwaty_przyrody_w_Polsce. Jak by co to przed chwilą dodałem ~10 rezerwatów, które musiały powstać w ostatnim czasie, tudzież z tego czy innego powodu brakowało ich w OSM. Także panowie kolejne pole do działania :wink:

Hmm, na spotkaniu dowiedziałem się, że bot złapie i doda, a jak nie doda to ma powód. I rzeczywiście na przykładowym artykule okazało się, że jest dubel i wpis w wikidata istnieje i wskazuje na drugi egzemplarz artykułu.

W przypadku rezerwatu Drzezno tak chyba nie jest, bo trochę przekopałem zarówno Wikipedię, jak i wikidata, i zupełnie pusto (jak na moje laickie oko).

Dlatego pytam, czemu bot jeszcze tego artykułu nie złapał i nie dodał, bo może coś spartoliłem, pisząc artykuł. I wtedy chciałbym wiedziec, co.

Trochę edytowałem na Wikipedii.
W artykule “Rezerwat przyrody Jezioro Drzezno” zrobiłem “sprzątanie kodu” i usunąłem znacznik chyba jest nie potrzebny.
Zauważyłem też, że w artykule “Pałac w Walewicach” brak jest dodanej kategorii.

Może to są przyczyny, że nie ma tego na Wididata.

Dasz przykład Wikidata który bot wygenerował automatycznie? Na początek zobaczyłbym stronę bota, typowy ma opis lub link do opisu jak on działa.

Dodałem dwie kategorie, czeka na przejrzenie.

Obstawiam, że https://www.wikidata.org/wiki/Q11798515 , ale nie umiem sprawdzić, czy to na pewno bot.

EDIT: w historii stoi, że utworzone przez https://www.wikidata.org/wiki/User:Sk!dbot
I jeszcze potem inne boty po tym grzebały, oprócz ludzi.

https://www.wikidata.org/wiki/Special:Contributions/Sk!dbot umarł, nie widze szczegółów jak takii bot działa na https://www.wikidata.org/wiki/Wikidata:Requests_for_permissions/Bot/Sk!dbot

Autor bota (https://www.wikidata.org/w/index.php?limit=50&title=Special%3AContributions&contribs=user&target=Sk%21d&namespace=&tagfilter=&start=&end=) jest aktywny - możesz spróbować go zapytać czy byłby zainteresowany powrotem bota lub czy wie kto takie rzeczy teraz robi (i podziękować że wygenerował te artykuły które istnieją).

Sprawdzałem trochę rezerwatów, wszystkie były utworzone przez Sk!dbot kilka lat temu. Czy masz jakiś przykład coś co stwozył współcześnie działający bot?


Możliwe że kategorie wystarczą - kategorie wyglądają na coś co może być użyte przez bota do generacji wikidata.

Edytując obecnie na Mazurach zauważyłem istnienie w wielu miejscach tagów wikipedia:en=* które walidator JOSM zgłasza jako błędne gdyż brakuje im wikipedia=en:* czy wikipedia=pl:. Oczywiście nie mówiąc już, że brak jest im wikidata=

Sukcesywnie od kiedy to zauważyłem to je na Mazurach dodaje, ale są też i inne województwa :wink: Uprasza się o uzupełnianie tych braków

Powinno wystarczyć wikipedia=pl:* i wikidata=*, OSMOSE takie rzeczy wyłapuje.

no właśnie o tym pisze. Jest wiele miejsc gdzie brakuje i jednego i drugiego a mamy jedynie wikipedia:en=*

Do wyłapania w overpass w kreatorze wyszukując:
“wikipedia:en”=* AND wikipedia!=*

Dodałem ok 800 obiektom wspomniane brakujące tagi (główny wikipedia i wikidata) i sprawdziłem, że w skali kraju nadal brakuje ich nadal w 4458 miejscach. Do tego dochodzą również np. te które posiadają wikipedia:de a również brak im tagów podstawowych.
Co prawda pora roku nie sprzyja by zajmować się rzeczami, które można robić w środku zimy, ale jak u kogoś mocno leje to akurat miał by wyzwanie :wink: