Podział administracyjny

Mam pomys? na algorytm przypisuj?cy powiaty miejscowo?ciom o niejednoznacznych nazwach. Algorytm ten u?ywa?by tylko danych z bazy TERYT, co moim zdaniem jest najbezpieczniejszym rozwi?zaniem (jedno, bezpieczne ?ród?o, przypisanie w TERYT na pewno nie jest b??dne, a granice w UMP, czy dane w geonames mog? zawiera? jakie? b??dy lub by? nieaktualne). Dopiero jak to si? nie sprawdzi (a my?l?, ?e to za?atwi znakomit? wi?kszo?? przypadków), b?d? kombinowa? z innymi pomys?ami, dla tego co zostanie.

www.geonames.org wygl?da ciekawie… ciekawe te?, sk?d maj? tak dok?adn? list? miejscowo?ci (sprawdzi?em, s? tam najmniejsze pipidówy nawet) wraz ze wspó?rz?dnymi geograficznymi. Czy?by jakie? oficjalne ?ród?o kompatybilne z licencj? CC-BY? My?l?, ?e geonames.org b?dzie mo?na wykorzysta? do zaimportowania brakuj?cych miejscowo?ci (tych, co s? w TERYT, a brak ich w OSM).

wojek, a przynajmniej jego algorytm, mo?e si? przyda, gdy ju? w OSM b?dziemy mieli wprowadzone granice. Troch? bez sensu u?ywa? do klasyfikacji danych z innego projektu, gdy analogiczne i tak powinny kiedy? do OSM trafi?.

Co z przypadkami gdy w OSM miejscowo?? ma nieco inn? nazw? ni? w TERYT? Nie przegl?da?em jeszcze logów pod tym k?tem… Jak to wy?apa?? Jak rozwi?zywa? (automatycznie, czy r?cznie, to pewnie zale?y od ilo?ci przypadków)? My?l?, ?e baz? TERYT nale?y uzna? za ?ród?o prawid?owych, oficjalnych polskich nazw.

Przy okazji, pytanko: jak my?licie, w is_in i is_in:country u?ywa? “Poland”, czy “Polska”? Jak w przypadku województw? Bo nie s?dz?, ?eby komukolwiek chcia?o si? t?umaczy? nazwy powiatów i gmin…

Wydaje mi si?, ?e warto?? is_in powinna odpowiada? name w odpowiednim place. Wtedy nazw? w innym j?zyku mo?na i z tego place wyci?gn?? (name:en, name:pl).

Co do Geonames, to ?ród?o to jest odrzucone przez OpenStreetMap, jako nie zbyt wolny: http://wiki.openstreetmap.org/wiki/Geonames
Tak mi si? w?a?nie wydawa?o, ?e to zbyt pi?kne, ?eby mog?o by? prawdziwe.

No tylko tak na dobr? spraw? to danych od nich nie importujemy (g?ówne ?ród?o to nadal GUS TERYT), tylko pytamy si? o ich interpretacj?. Ale mo?e lepiej nie ryzykowa?.

Tak ogólnie to w Polsce nawet rejestr granic jest “tajny”, owszem CODGiK mo?e go udost?pni?, ale licencja uniemo?liwia reprodukcj? i rozpowszechnianie - great.
Nawet na bia?orusi da?o si? udost?pni? dane urz?dowe i zaimportowa? - a u nas oczywi?cie si? nie da. :rage:

Popatrz na to inaczej. Jakby nagle wszystkie te dane zosta?y uwolnione i udost?pnione przez administracj? pa?stwow? w postaci gotowej do importu do OpenStreetMap. Czy nie by?oby szkoda tego wszystkiego co do teraz zosta?o zrobione? Czy nie sko?czy?a by si? wielka zabawa w uzupe?nianie mapy? :wink:

To pewnie mozna by bylo sprawdzic, ale domyslam sie ze to jest jakies zrodlo pochodne z TERYTu (byc moze calkiem nie bezposrednio).

Chce wylacznie dodac tagi wikipedia= z tytulami do isteniejacych obiektow, wiec mysle ze tutaj nie tworzymy derived work z wikipedii.

Moj prosty pomysl jest – tam gdzie WP nie ma wspolrzednych – zalozyc ze miejscowosci nalezace do konkretnego powiatu, gminy, wojewodztwa, leza blisko siebie, wiec jesli w okolicy danej miejscowosci w OSM sa miejscowosci A, B i C, a w WP w “okolicy” (czyli tej samej jednostce administracyjnej) sa D, E, F, to jesli jest korelacja miedzy ABC i DEF to pewnie to jest wlasciwa gmina/powiat/wojewodztwo.

Wydaje mi sie ze geonames.org wzielo wszystkie miejscowosci z GNS i zaczelo je poprawiac (ktos twierdzil ze korzystajac z google’a, nie wiem czy warto sie tym przejmowac). GNS to baza amerykanskiego ministerstwa czegos tam, w public domain, stare (importowalem miejscowosci dla Brazylii, dane byly z 1993), gdzie wspolrzedne sa zaokraglone do 0.15 deg, ale dosc szczegolowe – sa niektore bardzo male osady, oficjalnie nie istniejace jako miejscowosci. Duza ilosc literowek. Kazdy punkt ma tam wpisany rok importu wiec mozna jakos dojsc do tego skad oni wzieli te dane.

Przy imporcie z UMP dodaje jedna nazwe jako loc_name= a druga name=, zaleznie ktora lepiej wyglada :stuck_out_tongue: albo old_name=
Np. tu http://www.openstreetmap.org/?lat=51.405&lon=23.2067&zoom=13&layers=B000FTF jest wies ktora w UMP i w wikipedii nazywa sie Micha?ów a w geonames.org, GNS i w OSM byla pod nazwa Michelsdorf. (zmienilem to na loc_name= i name:de=)

Dzieki temu duzo miejscowosci w geonames, GNS i w OSM lezy po srodku rzeki albo jeziora :slight_smile:

A ja mam takie pytanie: Czy wszystkie miejscowo?ci na prawach miasta oznaczamy jako city/town, czy raczej zale?nie od liczby mieszka?ców dopuszcza si? u?ycie village?

Jak najbardziej town/city. Trzymajmy si? oficjalnej klasyfikacji, bo b?dzie ba?agan. Jak kto? szuka miasta, to niech znajdzie pod city/town.

Je?li do czego? bra? pod uwag? liczb? mieszka?ców (BTW to te? pewnie mo?na by bra? z oficjalnych danych GUSu), to do rozró?nienia mi?dzy town/city… Chocia? i tu mo?e lepiej (a na pewno pro?ciej) by?o by jako “city” oznacza? np. tylko miasta na prawach powiatu.

Jacek, pytanko jedno - przy imporcie/uzgadnianiu dodasz do w?z?ów miast jakiego? taga z kodem teryt? Je?li tak to jakiego :wink:

Jasne, ?e dodam. Na wiki (http://wiki.openstreetmap.org/wiki/WikiProject_Poland/Podzia?_administracyjny) ju? nawet opisa?em jakie: teryt:terc dla kodów województw/powiatów/gmin i teryt:simc dla kodów miast. B?dzie te? teryt:date (pole “stan na” z TERYT), teryt:rm (kod rodzaju miejscowo?ci, bo nie da si? wszystkiego wprost na place=* przenie??), teryt:sympod (kod miejscowo?ci do której dane miejsce (np. dzielnica) nale?y). Mog? one si? przyda? do dalszego przetwarzania.
A samo „kod teryt” to ma?o precyzyjne okre?lenie.

Wyniki dzisiejszego przebiegu: http://www.jajcus.net/teryt2osm/
Wi?kszo?? niejednoznacznych nazw za?atwiona. Wszystkiego za?atwi? tak nie da rady, bo bywaj? przypadki nawet trzech miejscowo?ci o tej samej nazwie w jednym powiecie.
Uwaga: reports/**/match.osm, to nie ostateczne dopasowania, od tego nale?y “odj??” zawarto?? odpowiednich really_bad_match.osm
Zmiany jakie b?d? importowane do osm s? w output/ (pliki osmChange).
Mo?e jutro wieczorem spróbuj? zaimportowa? zmiany w województwie ?l?skim.

Same skrypty dost?pne s? tutaj: http://code.google.com/p/teryt2osm/ Instrukcja obs?ugi powinna si? niebawem (mo?e jutro) pojawi? na Wiki.

Hmm, jeśli chodzi o wielkopolskie/śremski/dolsk to powinno być jedno Małachowo o id 0582261, ciekawe skąd te inne wynalazło…

http://wiki.openstreetmap.org/wiki/WikiProject_Poland/teryt2osm — ju? chyba mniej-wi?cej nadaje si? do u?ycia. Jutro spróbuj? zrobi? pierwszy import (województwo ?l?skie). Jak si? nic nie posypie, to zrobi? dla ca?ej Polski.
No chyba, ?e s? jakie? sprzeciwy.

Dane dla województwa ?l?skiego zaimportowane.

Great :slight_smile: Wielkopolskę uprzejmie poproszę :wink:

W?a?nie próbowa?em, ale serwer chyba nie lubi Wielkopolski (albo mój uploader jest jeszcze do poprawki):

[jajcus@lolek teryt2osm]$ ./upload.py output/wielkopolskie.osc
OSM login: jajcus@jajcus.net
OSM password: xxxxxx
 Zmiany z pliku: 'output/wielkopolskie.osc'
      Komentarz: TERYT import, województwo wielkopolskie, prepared by teryt2osm combine.py v. 31
Jeste? pewien, ?e chcesz wys?a? te zmiany? tak

Tworz? changeset… zrobione. Id: 948929
Wysy?am zmiany… 500: Internal Server Error
Zamykam… zrobione.

:frowning:

Dobra, po podzieleniu najwi?kszych plików ze zmianami uda?o si? wszystko zaimportowa? (Wielkopolska na ko?cu, bo sobie j? popsu?em po drodze i musia?em od nowa generowa?). Niestety, pó?niej zauwa?y?em b??d i b?dzie trzeba jeszcze przynajmniej raz import zapu?ci?: w wielu przypadkach tag ‘is_in’ nie zosta? uzupe?niony jak nale?y.
Jak kto? znajdzie w uzupe?nionych danych jaki? inny b??d, to krzycze?.

Czy wynikiem tego bledu jest tez brak gmin w is_in, czy moze brak danych? W wikipedii sa te dane i moge dodac na ich podstawie gminy do is_in albo dodac tag is_in:gmina czy tez is_in:municipality.

Inna sprawa, w wikipedii kody teryt maja po dziesiec cyfr, z ktorych to cyfr siedem pokrywa sie z cyframi tagu teryt:simc= w Twoim imporcie. W wikipedii kod 0123456789 odpowiada teraz tagowi teryt:simc=1256789, ciekawe skad sie biora cyfry 0, 3 i 4.

Przy okazji, widze ze w teryt2osm masz zaimplementowane bardzo fajne narzedzia ktore moga sie przydac do najroznych rzeczy jesli ktos bedzie chcial wyciagac albo wkladac dane do osm.

Nawet nie pami?tam, czy doda?em is_minicipality w ko?cu… Nie, nie doda?em. Mo?na to uzupe?ni?, ale oczywi?cie mo?na to sobie darowa? dla miejscowo?ci b?d?cych gmin?. Niestety, b?dzie to wymaga?o kolejnego importu zmieniaj?cego prawie wszystkie miejscowo?ci.

W pierwszym imporcie by? b??d i w miejscu teryt:simc by? wpisywany kod teryt:terc (albo na odwrót, nie pami?tam). Teraz jest poprawnie, s? to dwa ró?ne kody (gminy i miejscowo?ci).

Kod TERC generalnie sk?ada si? z 7 cyfr (tylko w takiej postaci jest dost?pny w rejestrze TERYT). Wikipedia wspomina o kodzie TERC10, który ma dodatkowe trzy cyfry: kod regionu i podregionu. Cyfry te mo?na wyznaczy? na podstawie pozosta?ych cyfr TERC. W Wikipedii s? te? dwa spisy powiatów: wed?ug kodu TERC i wed?ug kodu TERC10. Jako, ?e nigdzie w sieci poza Wikipedi? nie znalaz?em nic wi?cej na temat kodu TERC10, to uzna?em siedmiocyfrowy kod za standard. Mój skrypt teryt2osm przyjmuje obie formy, ale zapisuje zawsze 7 cyfr.

Zgadza si?. Prosz? si? cz?stowa? :wink:
Jak zdob?d? z GUS dane o ilo?ci mieszka?ców miejscowo?ci w sensownym formacie, to pewnie do?o?? tam kolejny skrypt dodaj?cy tak “population”, wi?c skrypty mog? przesta? by? ograniczone do danych TERYT.

Dodaj, dodaj - im wi?cej danych w mapie tym wi?cej pó?niej z takiej mapy si? da wycisn??..