wikipedia - validator

z https://forum.openstreetmap.org/viewtopic.php?pid=656873#p656873

Jako pierwszy etap uruchomiłem to co mam. Z tego co widzę to w Krakowie narzeka przede wszystkim na braki w WIkipedii (linki do atykułów bez koordynatów, czasem powodem są błędne linki na wiki - swego czasu poprawiałem wikipedia=* na operator:wikipedia=* i podobne - bieżącym przykładem jest http://www.openstreetmap.org/node/3667610297 ).

Jako pierwszy krok - czy zgłaszanie “missing coordinates at wiki:” jest dla ciebie interesujące?

Dane dla Krakowa są w tym momencie na https://wiki.openstreetmap.org/w/index.php?title=User:Mateusz_Konieczny/validator&action=edit (tak, linkuję do trybu edycji - zawiere wikisyntax i normalne wyświetlanie strony głupieje)

“stąd chcę, zeby w tagach były gotowe linki do sprawdzenia” - powinno to być proste do zrobienia, może uda mi się przed wyjazdem na wakacje to wyprodukować.

Co do znajdywania linków innych niż plwiki - widzę że jest przykład, wykryte zostało http://www.openstreetmap.org/node/31900341

Ale chodzi o to, że jest polska strona? Popoprawiałem już.

Tak czy owak - wstępnie działa.

Brakujące koordynaty na Wikipedii zostawiłbym na później, to jest robota po stronie Wikipedii i może dałoby się to zrobotyzować, w sensie automagicznego dodawania do artykułów.

Linki do sekcji powinien wykrywać bot do niezgodności z wikidata I nie jestem zupełnie pewien, co z tym przypadkiem robić…

A jakbyś robił to w formie dodawania tagów, to dałbyś radę odpalić od razu dla całej Polski?

Bot nie rozpozna przypadków gdzie wikipedia=* jest wadliwym tagiem (była plaga linkowania tagiem wikipedia z klasztorów do nazw zakonów, widziałem przypadki typu wikipedia=pl:Brzoza na zwykłym drzewie).

Choć jako pierwszy krok można to podzielić na próbę określenia czy tag wikipedii jest błędny czy też problemem jest brak koordynatów w haśle. Widziałem gdzieś opis bota który by wstawiał wikidata i sam znajdował odpowiednie obiekty - może dałoby się ten kod wykorzystać.

Ten kod który mam nie da rady (pobiera plik .osm i ładuje go w całości do pamięci), ale jak jest chętny do użycia wyników to mogę poprawić wydajność.

W sumie to zadna różnica, czy załaduje się do pamięci całą Polskę i obrobi, czy będzie się obrabiac po kolei województwa (powiaty, gminy, albo jakies okreslonego rozmiaru kafelki) - w całości czy po kawałku Polska będzie zrobiona.