Miejscowości: numery SIMC, zgodność z TERYTem i PRNG

Witam,

kilka tygodni temu zajmowałem się trochę porządkami w miejscowościach, zwłaszcza pod kątem tagów teryt:simc. Poprawiłem praktycznie wszystkie zduplikowane SIMC, a także błędy widoczne jako duża odległość w stosunku do współrzędnych w PRNG. Skorygowałem też pojedyncze nazwy miejscowości.

Ostatnio prace stanęły ze względu na brak czasu, ale przymierzam się do importu brakujących simców (ta kwestia przewinęła się też ostatnio w innym wątku). Byłby to raczej konserwatywny import - zauważyłem, ile błędów wprowadziły dotychczasowe importy w tej kwestii, głównie dla miejscowości o nieunikalnych nazwach. Na szczęście teraz jest znacznie łatwiej - dysponujemy współrzędnymi z PRNG, więc kojarzenie miejscowości z identyfikatorem nie wymaga heurystyk, jakie były np. w teryt2osm (z którego źródeł zresztą korzystałem m.in. do czytania TERYTa).

Przy okazji dotychczasowych prac zrodziły się pytania, którymi chciałbym się podzielić.

  1. Niektóre miejscowości mają teryt:simc spoza zakresu, z niewłaściwą cyfrą kontrolną. Co to za numery? http://osm.mapki.com/history/node.php?id=31528803, http://osm.mapki.com/history/node.php?id=1140984307

  2. Wsie i przysiółki są od czasu do czasu urzędowo zmieniane. Co należy wtedy zrobić z “nieaktualnymi” węzłami miejscowości? (np. https://www.openstreetmap.org/node/31889130, zmienione w: http://www.dziennikustaw.gov.pl/DU/2013/1629/1). Chciałbym co najmniej usunąć zniesiony SIMC. Przy okazji: angielska Wikipedia dość wolno reaguje na zmiany (np. http://en.wikipedia.org/wiki/Wiązowna_Kościelna). Zapewne warto linkować do polskiej Wikipedii. Czy jest w ogóle potrzebne wikipedia:en=*? Wiki OSM raczej odradza, skoro Wikipedia ma linki między wersjami językowymi.

  3. Jak wiadomo, TERYT i PRNG nie są wolne od błędów. Przykładowo tutaj http://www.openstreetmap.org/node/371948392 nazwa miejscowości nie zgadzała się z adresami. Jak oznaczać takie błędy? Note=* w punkcie miejscowości? Na jakiejś globalnej liście? Czy TERYT można uznać za w wiarygodny w kwestii istnienia miejscowości podstawowych (abstrahując od dokładnej lokalizacji i alt_name vs name)?

  4. Czasami zdarza się, że ktoś zmieni nazwę miejscowości w OSM z urzędowej na inną: np. http://osm.mapki.com/history/node.php?id=3009774122 lub http://osm.mapki.com/history/node.php?id=3009680065. O ile w tym drugim przypadku zmiana wygląda wiarygodnie (podane źródło, komentarz do zestawu), o tyle w pierwszym niekoniecznie. Co robić z takimi nazwami? Czasami problemy sprawia też alt_name: http://osm.mapki.com/history/node.php?id=2254008307

  5. Zdarza się, że w tej samej gminie, w odległości kilku kilometrów istnieją miejscowości różnego typu o tej samej nazwie, zwykle wieś i osada. Dobrze byłoby ustalić jednolity sposób oznaczania tego faktu w nazwie. Podoba mi się “(osada)”, jak np. tutaj https://www.openstreetmap.org/node/3274530298, ponieważ nazwy urzędowe nigdy nie mają nawiasów (a np. “-Osada” i “-Kolonia” bywają elementami nazw urzędowych).

Zapewne niektórzy z Was mają pomysły i uwagi związane z tematem.

A jaka musiała być odległość by to był błąd? PRNG potrafi mieć spore błędy w lokalizacji miejscowości, w tym miejscowości zamienione miejscami.

FIXME=

W TERYT są też miejscowości nieistniejące fizycznie - https://pl.wikipedia.org/wiki/Beniowa

Zmiana z urzędowej na inną bez jakiegokolwiek uzasadnienia - należy wycofać.
Można sprawdzić w PRNG i na topo z geoportalu czy tam się ta nowa nazwa nie pojawia, bo to może być alt_name, old_name a nawet loc_name.

Przypadek błędnych współrzędnych z PRNG. Niepotrzebnie edytowano tam węzły, trzeba je było tylko zamienić miejscami.

Znów zmiana bez komentarza (z Włoszczów na Nowy Dwór), ale:

  1. Nowy Dwór to nazwa oboczna, powinna była zostać od razu zaimportowana do alt_name (a nie była)
  2. Jest to nazwa używana w tej miejscowości. Co prawda tablica miejscowości informuje o Jędrzychowie, ale tablica na słupku koło przystanku ma Jędzychów-Nowy Dwór.
  3. Nie ma problemu z adresami (wszystkie mają Jędrzychów).
    Zostawiłbym tak jak poprawiłeś.

name:prefix=osada
(http://wiki.openstreetmap.org/wiki/WikiProject_Poland/Podzia%C5%82_administracyjny#Wsie_.28pozosta.C5.82e_miejscowo.C5.9Bci.29)

Nie widzę przeciwwskazań, żeby było w nazwie (osada), np. name=Ławki (osada). Myślę, że wśród lokalnej społeczności takie określanie miejscowości występuje.

A gdyby były punkty adresowe z tą osadą to też?

Dzięki za odpowiedzi.

Skrypt ustawiłem na raportowanie powyżej 5 km. Na razie i tak wszystkie zmiany wprowadzałem ręcznie.
Praktycznie zawsze istniał już węzeł z tą samą nazwą w dobrej lokalizacji, ale bez simc lub z simc jeszcze innego punktu o tej nazwie (takie ścieżki bywały całkiem długie dla wyjątkowo powszechnych nazw).
Często natomiast trzeba było usuwać nadmiarowe punkty (głównie z importu devrise) lub degradować do hamlet.

A wiesz coś o wyjątkach w drugą stronę? Czy w ogóle ma sens mówić o wsi, jeśli nie istnieje urzędowo?

Jak dla mnie ten dopisek (osada) ma na celu głównie rozróżnienie adresów we wsi i w osadzie. Przywołane Ławki mają adresy, jest adres Ławki 1 i adres Ławki (osada) 1.
Prefiksu w tym miejscu (https://taginfo.openstreetmap.org/keys/addr%3Aplace_prefix#overview) nikt raczej nie zacznie obsługiwać.

Nie sądzę by place=village nieobecne w TERYT utrzymało się w polskiej osm. Bo na jakiej podstawie? Mogłoby to być najwyżej jako nazwa potoczna miejsca.

Ciekawy przypadek. Jak sobie listonosz tam radzi?
Potraktowałbym to jako wyjątek. Warto by dodać note= z wyjaśnieniem oraz name:prefix. Mniejsza szansa, że ktoś usunie.

W tej samej gminie jest też Ryn miasto i kolonia. Należałoby nazwę kolonii zapisać analogicznie, bo teraz jest Ryn-Kolonia.
Jest jeszcze Kronowo wieś i osada, ale po tej drugiej śladu nie ma w osm. Może ofiara deduplikacji?

Nie przyznaję się; obejrzałem swoje zmiany w okolicy w za pomocą http://zverik.osm.rambler.ru/whodidit/.

Mogę się w weekend zająć się tymi dwoma przypadkami. Mam też nadzieję, że import simców pozwoli stworzyć listę brakujących miejscowości (podstawowych).

Nie znam konkretnego przypadku gdzie bylaby taka potrzeba ale pamietajmy, ze nie musimy mirrorowac TERYTu w OSM. Wezly place= nie musza sie pokrywac z urzedowym podzialem kraju na gminy, wsie, przysiolki, osady, itp. Do urzedowej klasyfikacji sa obiekty otagowane admin_*=.

Duza czesc wezlow z Geoname (import devrise) ma jakies uzasadnienie i warto je zachowac do momentu kiedy lokalsi beda mogli potwierdzic ich nieistnienie, przynajmniej z tagiem place=locality.

Będąc w temacie TERYT-u – czy biorąc pod uwagę pełną nazwę ulicy, ważniejsze od TERYT-u są dane Urzędu Gminy? http://www.openstreetmap.org/note/419216

W tym przypadku wyższy priorytet ma ustalenie społeczności OSM, że dodajemy imię do nazwiska.

Nazwę z UG bez imienia zawsze można umieścić w official_name. Wcześniej lepiej jednak sprawdzić uchwały, bo skoro w TERYT jest z imieniem to może i oficjalnie też tak jest.