Mam pomys? na algorytm przypisuj?cy powiaty miejscowo?ciom o niejednoznacznych nazwach. Algorytm ten u?ywa?by tylko danych z bazy TERYT, co moim zdaniem jest najbezpieczniejszym rozwi?zaniem (jedno, bezpieczne ?ród?o, przypisanie w TERYT na pewno nie jest b??dne, a granice w UMP, czy dane w geonames mog? zawiera? jakie? b??dy lub by? nieaktualne). Dopiero jak to si? nie sprawdzi (a my?l?, ?e to za?atwi znakomit? wi?kszo?? przypadków), b?d? kombinowa? z innymi pomys?ami, dla tego co zostanie.
www.geonames.org wygl?da ciekawie… ciekawe te?, sk?d maj? tak dok?adn? list? miejscowo?ci (sprawdzi?em, s? tam najmniejsze pipidówy nawet) wraz ze wspó?rz?dnymi geograficznymi. Czy?by jakie? oficjalne ?ród?o kompatybilne z licencj? CC-BY? My?l?, ?e geonames.org b?dzie mo?na wykorzysta? do zaimportowania brakuj?cych miejscowo?ci (tych, co s? w TERYT, a brak ich w OSM).
wojek, a przynajmniej jego algorytm, mo?e si? przyda, gdy ju? w OSM b?dziemy mieli wprowadzone granice. Troch? bez sensu u?ywa? do klasyfikacji danych z innego projektu, gdy analogiczne i tak powinny kiedy? do OSM trafi?.
Co z przypadkami gdy w OSM miejscowo?? ma nieco inn? nazw? ni? w TERYT? Nie przegl?da?em jeszcze logów pod tym k?tem… Jak to wy?apa?? Jak rozwi?zywa? (automatycznie, czy r?cznie, to pewnie zale?y od ilo?ci przypadków)? My?l?, ?e baz? TERYT nale?y uzna? za ?ród?o prawid?owych, oficjalnych polskich nazw.
Przy okazji, pytanko: jak my?licie, w is_in i is_in:country u?ywa? “Poland”, czy “Polska”? Jak w przypadku województw? Bo nie s?dz?, ?eby komukolwiek chcia?o si? t?umaczy? nazwy powiatów i gmin…
Wydaje mi si?, ?e warto?? is_in powinna odpowiada? name w odpowiednim place. Wtedy nazw? w innym j?zyku mo?na i z tego place wyci?gn?? (name:en, name:pl).