Miejscowości

Ponieważ dostałem komentarze że coś nie bardzo to działa w GoogleDocs, więc wrzuciłem na stronę: http://turystyka.site90.net/

Odgrzeje stary temat, oznaczyłem dziś tagiem fixme z odpowiednim komentarzem miejscowości, w których “hardkodowane” w is_in:province województwo nie zgadza się z rzeczywistym położeniem. Część to miejscowości leżące na granicy województw, które z powodu niedokładności wrysowania granicy/miejscowości znalazły się w województwie sąsiednim, ale jest też dużo wsi przesuniętych o kilkadziesiąt-kilkaset kilometrów. Wygląda na to że źródłem problemu są stare, automatyczne importy (tak przynajmniej wynika z komentarzy w changeset’ach).

Zanim jednak zaczniemy przesuwać miejscowości, należy zauważyć, że błędy mogą wynikać też z czegoś innego (może również z powodów importów).

Np.
http://www.openstreetmap.org/browse/node/31695639 - taka miejscowość występuje w tym miejscu - sprawdzone na mapie drukowanej powiatu łowickiego i w bazie Teryt
http://www.openstreetmap.org/browse/node/31705298 - może nie jest na właściwym miejscu ale tu występują dwie inne miejscowości o nazwach zaczynających się od Sokołów

To są tylko albo aż dwie z trzech sprawdzonych przeze mnie miejscowości.

@marimil
Tak wygląda że większość z tych miejscowości ma nazwy kilkukrotnie występujące w Polsce. I tagi (wikipedia, population, is_in itd.) zostały przyporządkowane do niewłaściwego miejsca o tej samej nazwie. Niestety teraz trzeba każdy taki przypadek indywidualnie sprawdzić.

http://www.openstreetmap.org/browse/node/31592735
A to dlaczego ma wstawione fix’a?

Województwo się zgadza, wikipedia link poprawny (co prawda angielski, aż dziwne).

Nie mam pojęcia czemu overpass to wyłapał (może nie nadążają z aktualizacjami?? kilka dni temu był poprawiany przebieg relacji z granicą, wtedy miejscowość leżała po niewłaściwej stronie). W każdym razie jeśli jest OK to poprostu usuń fixme.

Faktycznie, może problemem jest ta “bliskość” korekcji.

Dodałem komentarz do tych wsi, przysiółków i osad których nazwy nie pasują do bazy TERYT - wyszło tego sporo, bo ponad 4 tys. miejscowości. Większość niezgodności to typowe błędy w pisowni (najczęściej brak polskich znaków lub niepotrzebnie wstawione, literówki) lub inny szyk wyrazów w nazwie itp., podane jako “name” stare nazwy zwyczajowe, dzielnice miast oznaczone jako wsie.

Taki przykładzik z mojej okolicy: http://www.openstreetmap.org/browse/node/2011488307 - jakoś nie udało mi sie tego znaleźć w TERYT, a śmiem przypuszczać, że taka jednostka istnieje. Przyjąłeś założenie, że jeśli danej miejscowości nie ma w TERYT to jest błędna? Jeśli tak, to nie dziwię się, że wyszło 4k :slight_smile:

Nie tyle błędna co wymagająca sprawdzenia :wink: W tej liczbie nie ma też coś ponad tysiąca łatwych do znalezienia różnic w pisowni typu “Kolonia X” zamiast “X Kolonia”, “Nowy Y”<-> “Y Nowy” itp.
Porównań z TERYT używam od jakiegoś czasu i tak jak piszesz są możliwe sytuacje że chociaż obie bazy się nie zgadzają to miejscowość jest poprawna. No i sam TERYT też pewnie bezbłędny nie jest, ale póki co nie znalazłem lepszego odniesienia którego można by użyć.

http://www.openstreetmap.org/browse/node/1694982079

To również nie jest błędne… Czasami szkoda głupiej roboty, warto najpierw zapytać, skąd na danym obszarze pochodzą nazwy. Akurat mojej okolicy nazwy wprowadzone pochodzą z wywiadu przeprowadzonego wśród starszych mieszkańców. A… TERYT w gminie Istebna ma mnóstwo błędów merytorycznych, przeinaczonych nazw miejscowości, które próbowano tłumaczyć z gwary górali śląskich na język polski…

Mysle, ze nie jest to glupia robota bo te przeinaczone nazwy tez powinny byc mozliwe do wyszukania przez wyszukiwarke wiec warto je pododawac w jakims tagu typu alt_name lub teryt:name.

Zgadzam sie, ze nazwy uzywane przez mieszkancow sa jedynym autorytatywnym zrodlem tych nazw i zawsze powinny miec pierwszenstwo. Ale TERYT moze sie przydac do wyszukania niektorych bledow, tylko nalezaloby skrypt porownujacy zrobic tak zeby ignorowal m.in. szyk wyrazow. W moich skryptach tam gdzie porownouje np. nazwy ulic po prostu sortuje wyrazy alfabetycznie wewnatrz kazdej nazwy zanim bedzie porownywana.

Trochę poprawiałem i jednak tych prawidłowych nazw nie znajdujących odzwierciedlenia w TERYT nie jest aż tak bardzo dużo (przynajmniej w okolicach które znam w rzeczywistości), okazuje się że jednak większość błędów to literówki albo brak polskich znaków. Ale trafiłem na inną ciekawostkę - są miejscowości w OSM których nie ma w TERYT ani w jakimkolwiek innym polskim źródle (właczając wikipedię), są tylko na zagranicznych stronach i to raczej takich generowanych automatycznie (np. jako lokalizacje dla prognozy pogody). Może wiecie o co w tym chodzi?

W moim mieście są nadane oficjalnie nazwy osiedli, w uchwale wskazane są dokładnie ich granice itd. - pod jakim place je tagować? Suburb to trochę na wyrost.

place=neighbourhood byłoby chyba dobre.

Pozdrawiam,
Grzesiek

Renderuje się to w Mapniku?

Nie (jeszcze): https://trac.openstreetmap.org/ticket/4191

…ale renderują się od niedawna na stylu osmapa.pl :smiley:

Jeśli utworzysz odpowiednie relacje (nie punkty), to się wyrenderuje, ale czy to jest najważniejsze?

W 2007 byly importowane z GNS albo GeoNames (ktore z kolei importuje z GNS), te bazy posiadaja sporo takich nazw. Domyslam sie ze pochodza z roznych starych map o roznej dokladnosci, ktore amerykanie digitalizowali. Jesli sie spojrzy na GNS to wiekszosc tych nazw byla wprowadzona do ich bazy w latach 80 i 90, zanim w Polsce byl jakas elektroniczna baza czegokolwiek.

@Piotr99
Dlaczego powstawiałeś do miejscowości is_in:province=<nazwa województwa> zamiast is_in:state=<nazwa województwa>? Z tego co wiem, województwa w PL to place=state (przykład), a nie place=province.

Swoją drogą tag is_in jest przestarzały i jego stosowanie było zasadne tylko tam, gdzie nie ma granic, a w PL kompletne granice województw posiadamy już od dawna, więc można by się tej informacji dotyczącej województw pozbyć z wiosek…

Aktualnie rekomenduje się używanie schematu addr:, i to tylko tam, gdzie nie ma granic. W przypadku Polski sprowadza się to do tagowania obiektów wyłącznie na wsiach, bo one nie posiadają oficjalnych granic administracyjnych, w przeciwieństwie do miast, gmin, powiatów etc., dlatego trzeba to uściślać właśnie za pomocą tagów addr: na każdym obiekcie.