Nie, nie ma tego raczej du?o … wst?pne, niedoskona?e przeszukanie plików wskaza?o 25 potencjalnych kandydatów. Przy czym szuka?em nazw ze ?rednikiem po prostu. I tak, to s? miejsca gdzie mo?na poprawi? tylko r?cznie, nie jedyne zreszt?. Przed chwil? trafi?em na ulic? Jo?ciuszki … wpisywanie tego jako synonim Ko?ciuszki do s?ownika by?oby przegi?ciem, a tak system przepuszcza jako prawid?ow?, bo sk?d ma wiedzie? ?e nie
Wrzucam na serwer plik wrak-VALID.txt to zestaw stringów które WRAK przepu?ci? jako prawid?owe. Przy czym to nie oznacza, ?e one s? prawid?owe a tylko ?e:
- by?y w s?owniku w tej formie → s? OK
- nie by?o ich w s?owniku, ale wygl?daj? OK
Wystarczy tam spojrze? ?eby zobaczy?, ?e nie jest tak dobrze jak si? WRAKowi wydaje, cz??? z tych nazw to potencjalne ?ród?o do rozwoju s?ownika, cz??? wymaga r?cznego poprawienia.
W dyskusji na stronie WRAKA zacz??em pisa? draft naszego “Kanonu nazewniczego” (to zacz??em pisa? lokalnie u siebie i nie za?adowa?em jeszcze) i kilka propozycji do dyskusji dotycz?cych pisowni, nie po to, ?eby decydowa? si? na cokolwiek teraz, a bardziej, ?eby nie umkn??o.
UPDATE!
Czy chcieliby?my aby cudzys?owy w nazwach by?y poprawione na polskie, tzn. otwieraj?cy cudzys?ów na dole, zamykaj?cy u góry? W s?owniku i gdziekolwiek nadal wpisywaliby?my po prostu “string w cudzys?owie” oczywi?cie, a nie jakie? unikodowe krzaki, ca?o?? z powodzeniem mo?e wykona? WRAK.
Czy s? jakie? przeciwwskazania?
UPDATE 2
http://wariat.org.pl/smietnik/OpenStreetMap/wrak-VALID-UNIQUE.txt to lista wszystkich nazw które przesz?y przez WRAK jako poprawne ale odfiltrowana, to znaczy ka?dy string tylko raz i bez linka. Zacz??em przegl?da? (od ko?ca) i nawet bez u?ycia skomplikowanych automatów ?atwo odkry? czego brakuje w s?owniku.
Teoretycznie mo?na z tej listy usun?? stringi które si? w s?owniku pojawi?y bo te s? na pewno poprawne ale i tak reszt? trzeba po prostu przeczyta?.
Dobra wiadomo?? jest taka, ?e je?li ta lista zostanie poprawiona to b?dziemy prawie na ko?cu zabawy… albo ja nie zauwa?am jakiego? innego problemu