Jak stwierdzono ;), poprzesuwalem nasze miejscowosci uzywajac wspolrzednych z UMP, dodalem te ktorych jeszcze nie mielismy i popoprawialem wiele nazw gdzie brakowalo polskich znaczkow oraz troche literowek. Nie planuje wiecej takich duzych zmian wiec mozna spokojnie edytowac miejscowosci i poprawiac kolejne bledy jako ze napewno duzo ich zostalo (obydwa nasze masowe zrodla: NGS i UMP, sa pelne bledow). Tam gdzie nie zauwazylem literowek to pewnie teraz mamy duplikaty.
Jesli ktos bedzie konwertowal dane z UMP i importowal to moze pominac miejscowosci bo one w UMP sie raczej nie zmieniaja. Znaczy to ze mamy wieksze pokrycie niz zarowno NGS i UMP i wydaje mi sie ze wieksze niz wikipedia pl – czyli jesli czegos nie ma w OSM to nie istnieje :). W wikipedii z tego co widze jest strona dla kazdej miejscowosci z TERYTu, wzbogacona o rozne informacje dodane przez uzytkownikow.
Wyszukalem i porozwijalem tez wszystkie znane mi skroty czesto wystepujace w nazwach: kolonia, kolo, wielkopolskie, mazowieckie, slaskie, pierwsze, drugie, trzecie, wielkie, duze, male, gorne, dolne, polnocne, poludniowe, przednie, tylne, stare, dawne, nowe. Wydaje mi sie ze warto umieszczac je w name= zawsze jako pelne slowo, w przeciwnym wypadku trudno je rozwinac automatycznie, np. wlk. moze byc rozwiniete jako wielkie, wielka, wielki. Z drugiej strony niektore slowa skracaja sie na kilka sposobow: pierwsze, drugie, trzecie w ump wystepuja czasem jako slowo, czasem cyfra a czasem cyfra rzymska. Dolne to czalem dol, dln, d. Wiec jak ktos ma zamiar robic cos takiego jak indeks dla wyszukiwarki to przed zindeksowaniem nalezaloby wszystkie formy kazdego slowa zamienic na jedna, np. te najkrotsza.
Tytuly stron w wikipedii tez z tego co widze maja zawsze rozwiniete wszystkie czlony nazwy. Czesto maja jednak inna kolejnosc niz w OSM i/lub UMP.