Debugger ;-)

Dok?adnie tego samego mi troch? brakuje. Pliki w tej chwili powstaj? w ten sposób:

#!/bin/bash

./OSM-wrak --showignored > wrak-TEST.txt 2> /tmp/wrak-IGNORED.txt
./OSM-wrak --showvalid > /dev/drzewo 2> /tmp/wrak-VALID.txt

sort /tmp/wrak-IGNORED.txt > wrak-IGNORED.txt
sort /tmp/wrak-VALID.txt > wrak-VALID.txt
sed s/http:.*// /tmp/wrak-VALID.txt | sort -u > wrak-VALID-UNIQUE.txt

Lista o któr? chodzi powstaje w ostatnim wierszu i oczywi?cie mo?e zosta? odfiltrowana … i jak tylko zrozumiem jednolinijkowca jakiego zapoda? tu TomDalek który robi co? podobnego jak rozumiem to tak j? uaktualni? … tylko na razie mi nie wychodzi :smiley:

Hmmm dosta?em w?a?nie wiadomo?? via OSM … tylko ona jest po krzy?acku :confused:

google translate t?umaczy to strasznie ?miesznie, ale chyba chodzi mu o WRAKa … tylko czego on sie czepia naszej strony granicy? No chyba, ?e WRAK nabroi? po ich stronie :smiley:

No to mamy pierwszy ZONK, z tym kolesiem. Przy czym nie do ko?ca rozumiem dlaczego cz?owiek który najwyra?niej potrafi rozmawia? tylko po niemiecku (odes?a? mi wiadomo?? przet?umaczon? googlem) czepia si? nazw ulic w .pl

Jest tak: jedna z ulic o które m chodzi to ta:
http://www.openstreetmap.org/browse/way/27885208

wg. bazy GUS ona nazywa si? Stefana Roweckiego, “GROT” to pseudionim, my zmieniamy nazw? na genera?a Stefana “Grota” Roweckiego, kole? na Grota-Roweckgo, czyli nie tyle poprawia po WRAKU co psuje inaczej.
W tej chwili i tak nei ma nowych danych z Geofabric wi?c WRAK dzi? nie je?dzi, ale problem trzeba rozwi?za? jako? czy raczej wymy?li? co robimy. Je?li nie zmienia? nazwy po naszemu to IMO jak ju? dostosowa? do bazy GUS.
Za?o?? w?tek na niemieckim forum, ?eby da? zna?, ?e wiemy co robimy i dlaczego, bo nie chodzi nam o “wojn? edycyjn?”, ?e u?yj? terminu z wikipedii, a po prostu o normalizacj? nazw w .pl.

Nie wiem na ile czytelne jest to co nabazgra?em, ale posz?o: http://forum.openstreetmap.org/viewtopic.php?id=1762

Hmm, ca?kiem mo?liwe ?e facet spisa? z terenu, u mnie na blokach np jest napisane “Grota-Roweckiego” i zazwyczaj tak si? okre?la t? ulic?. W podobny sposób podawa?em te? u siebie w mie?cie, dodawszy “Stefana” wcze?niej. My?l?, ?e form? “Stefana Grota-Roweckiego” stosuje si? cz??ciej, i tak bym to poprawi? - oczywi?cie przyda?by si? ? w Unicode zamiast -

Kole? jest dziwny. Gada do mnie w kó?ko po swojemu i nie do ko?ca kumam czego on si? tak czepi? ulic za granic?. Chwilowo przestan? je?dzi? WRAKiem bo w sumie jest to problem którego oczekiwali?my i dobry moment ?eby?my ustalili wspólne stanowisko raz jeszcze, przy okazji wymy?laj?c jak dyskutowa? z tym kolesiem.

Ja nadal jestem zdania, ?e nale?y poprawia? nazwy zgodnie z za?o?eniami które tu ustalili?my, bo lepsze nawet czasami lekko nadmiarowe dane ni? powa?na braki, o literówkach i spierdzielonym kodowaniu nie wspominaj?c. Przez ostatni tydzie? WRAK poprawi? 1600 nazw czego by?my r?cznie za chiny ludowe nie zrobili w tak krótkim czasie.
On jest z Niemiec i tam mo?e maj? porz?dek, ale u nas wiadomo … znam wiele ulic w Poznaniu gdzie co tabliczka to inna forma zapisu nazwy co tylko umacnia mnie w przekonaniu, ?e nic niew?a?ciwego nie robimy. No a to, ?e w bazie GUS jest inna nazwa ni? ta na któr? si? nasz kolega upiera tylko dodaje sprawie smaczku.

Pewne jest, ?e nie ma co chwilowo a? do rozwi?zania tego problemu kontynuowa? zmian (s?ownik mo?na rozwija? oczywi?cie) bo to nie ma ?adnego sensu. Tak czy siak trzeba wymy?li? co dalej. Spróbuj? go przyci?gn?? na forum, mo?e co? si? wyja?ni.

P.S. W sprawie UMP layer jest tak, ?e od kilku dni znikaj? w ma?ych porcjach i z pocz?tkowych ponad 6000 sztuk zosta?o ju? ko?o 2000. Jak si? tego pozb?dziemy zaczn? kasowa? debugi. Poza tym przenosz? g?ówn? aktywno?? na malowanie Warty :smiley:

Szybki UPDATE

Ja mu, ?e w bazie GUS jest jak jest a on mi tak:

http://translate.google.pl/ gdyby kto? chcia? to przeczyta? a zna? niemiecki jak ja czyli wcale to troch? pomaga :smiley:

Na dodatek chyba OSM pad?o i mu nie odpisz?.

Mo?e ci??ko jest komu? z tak uporz?dkowanego kraju zrozumie?, ?e to co u nas wida? na tabliczce, a to jak si? nazywa ulica to mog? by? 2 ró?ne rzeczy. Wiem, ?e mamy racj?, ale nie bardzo wiem jak go do niej przekona? :wink:
Mo?e napisz mu, ?e ludzie którzy mieszkaj? na tej ulicy maj? w dowodzie ‘nasz?’ nazw?, wi?c w praktyce (i teorii) to ona obowi?zuje?

To nie jest ?adne rozwi?zanie, musimy jako? t? sytuacj? wykorzysta? aby zbudowa? plan dzia?ania przy takich problemach. opisa?em wszystko raz jeszcze na forum niemieckim, przy czym jako? nie jestem przekonany czy to wszystko dotrze do celu.
Zastanów si? czy nie masz jakich? znajomych w tych Policach, to w ko?cu blisko sam jestem ciekaw ile wariacji nazwy uda si? znale?? na tej ulicy. :smiley:

Napisa?em te? do niego, ?eby poda? list? ulic gdzie nie zgadza si? z WRAKiem, bo nie mo?na za?o?y?, ?e on myli si? wsz?dzie, nasz s?ownik wci?? jest niedoskona?y, cho? z drugiej strony lepszy niedoskona?y s?ownik ni? ten ba?agan który mamy gdzieniegdzie w OSM:Poland :smiley:

OK, ja to znam z autopsji… Mieszkam w Szczecinie przy ulicy Gen. Grota-Roweckiego (zapis oficjalny z UM), koleżankę mam z Polic i w adresie zameldowania miała Stefana Roweckiego (bez Grota). Co ciekawe o ten przypadek chciałem zapytać już wcześniej ale jak widzę temat sam wypłynął. IMHO w wyświetlanej nazwie ulicy powinno być tak jak oficjalnie to urząd zapisuje. Do wyszukiwania natomiast powinno być “Roweckiego, Grota, Stefana, generała”…

Oczywi?cie :slight_smile:
http://storage.neostrada.pl/OSM/ulice.bez.GUStu.html
Tym razem to wersja bez ?adnych szybkich haków. Za to z linkiem - ?eby nie szuka?. Z userem - ?eby si? ze wstydu pali? i w?asne czym pr?dzej poprawia?. I z info czy z UMP - ?eby usprawiedliwia?, siebie i innych, ?e to niby nie nasza dysortografia tylko to Ci Kolesie z UMP tak narobili. :stuck_out_tongue:

Dalej:

Ten jednolinijkowiec jest istotnie paskudny i oczywi?cie nie nale?y go nawet próbowa? zrozumie?! Kajam si?. :smiley:

Ale innymi s?owy, po ludzku, i u?ywaj?c pliku zamiast $(), mo?na od czego? odci?? jaki? s?ownik tak:

#!/bin/bash

# Z pliku 'wrak-dict.csv' zróbmy sobie s?ownik 'slownik.wrak.txt',
# odcinaj?c linie komentarza i linie puste z ewentualnymi spacjami,
# a potem wybieraj?c tylko pierwsze pole - tzn. wersje poprawn?.
grep -v -e '^#' -e '^\ *$' wrak-dict.csv | cut -d \, -f 1 > slownik.wrak.txt

# Przeszukajmy, które linie z 'wrak-VALID-UNIQUE.txt'
# _nie_ zawieraj? wzorca ze s?ownika 'slownik.wrak.txt'
grep -v -f slownik.wrak.txt wrak-VALID-UNIQUE.txt > wrak-VALID-UNIQUE.bez.wrak-dict.txt

lub ewentualnie grep -i ?eby nie porównywa? wielko?ci znaków.

W mojej g?owie plan by? taki, aby w pierwszym przebiegu (który potrwa raczej kilka miesi?cy ni? dni) nada? wszystkim takim ulicom jedn? nazw?, tak? któr? uznamy za najpopularniejsz?, najw?a?ciwsz?. Lepsz? wydaje sie mi by? sytuacja kiedy ulica nazwana oficjalnie: Stefana Roweckiego zostanie przez nas nazwana Genera?a Stefana “Grota” Roweckiego, ni? kiedy wszystkie ulice nazwane imieniem tego cz?owieka nazywaj? si? “Roweckiego” a generalnie tak w wielu przypadkach w tej chwili wygl?da OSM:Poland.
W drugim przebiegu mogliby?my zmodyfikowa? s?ownik WRAKa tak, ?e nie poprawia?by niektórych nazw czyli mo?na by uci?? w tym wypadku rang? i pseudonim a WRAK by tego nie poprawi?. To wszystko umiemy zrobi? i zadzia?a. By? mo?e powinni?my zrobi? tak ju? teraz, nie wiem. Mnie ten genera? i pseudonim w niczym by nie przeszkadza?, soft do routingu i tak szuka po dowolnym kawa?ku stringa wi?c te dodatkowe s?owa nic nie psuj?. WRAK stoi w gara?u, ja maluj? Wart? … mo?emy radzi? :smiley:

@TomDalek: dzi?ki za ten kawa?ek basha … kolejna wersja plików materia?ów s?ownikotwórczych :smiley: b?dzie bez zb?dnych stringów.

Chcia?bym po pierwsze zauwa?y?, co by?o prawdziw? przyczyn? problemu. :slight_smile:
Problem by?o to, ?e nasze forum prowadzimy po polsku, nie informuj?c ludzi obcoj?zycznych co tak naprawd? ma tu miejsce. Jak rozumiem, do tej pory, wszyscy polskoj?zyczni osmerzy, maj? ?wiadomo?? w jakim stanie s? polskie drogi (te w OSM te? :slight_smile: ), weszli na forum, zobaczyli ?e WRAK jest genialny (@Jakub Klawiter: bo jest!) i nie maj?, ?adnych ale.

Zatem http://forum.openstreetmap.org/viewtopic.php?id=1762 jest prawie rozwi?zaniem, bo b?dziemy mieli feedback od s?siadów.
Ewentualnie, mo?e nale?a?oby przet?umaczy? te? http://wiki.openstreetmap.org/index.php/Pl:WRAK

Oczywi?cie faux pas te? po stronie hasse_osm_korinthenkacker, ?e wsz?dzie, nie tylko na lokalnym forum, u?ywa j?zyka ojczystego, podczas gdy lingua franca OSM jest angielski.

Jednak alv, na niemieckim forum, zauwa?y? bardzo istotn? rzecz:

Je?li kto? nie zna j?zyka kraju który odwiedza i stoi na obcej ulicy, to ma nadziej?, ?e jego przeno?ne OSM poka?e mu dok?adnie tak? sam? nazw? - literka w literk?, znaczek w znaczek, bez rozumienia o co chodzi. By?em zagubiony za granic? i wiem o czym mówi?. :stuck_out_tongue:

Dalej.

Musz? si? zastanowi?. Wydaje mi si? jednak, ?e nici z tej naszej Wielkiej Normalizacji. Jak przypuszcza?em: tak samo jak GUS, nie powinni?my si? miesza? w to, ?e ró?ni ludzie, ró?nie nazywaj?, tych samych ludzi. :laughing:
Na t? chwil? proponuj?:

  1. Skupi? si? na tym, aby do ko?ca wypleni? ulice.bez.GUStu tzn. literówki, WTF, wielko?? liter itp.
  2. Ulice kontrowersyjne, jak roweckiego uzna? za wyj?tek, gdzie jedynie jednocz?onow? (na pewno z??) zamieniamy na ‘w naszej opinii’ najlepsz? wersj?. Zatem nie:
genera?a Stefana "Grota" Roweckiego, stefana roweckiego, roweckiego, grota-roweckiego, stefana "grota" roweckiego

tylko:

genera?a Stefana "Grota" Roweckiego, roweckiego
  1. reszt? wrak-dict.csv zostawi? jak jest, jecha? po wszystkim WRAKiem z koksem, i si? nie przejmowa?! :smiley:

Malowa?em dzi? t? Wart? - przy okazji dokonuj?c kolejnego odkrycia, ?e podk?ad Yahoo nie jest wsz?dzie, a nawet jest go mniej ni? wi?cej. Pó?niej bawi?em si? z hackerem i troch? si? nad problemem zastanawia?em, a przede wszystkim emocje mi opad?y i doszed?em do podobnych wniosków. Zreszt? podejrzewam, ?e gdyby kolega z niemiec zmieni? nazw? ulicy na tak? jak w bazie GUS problemu by nie by?o wcale. Teraz jest tam równie nieprawid?owa nazwa jak nasza.

Zgadzam si?, ?e “nasi” widz?c ba?agan w nazwach ulic ?atwiej zrozumiej? co tak na prawd? robimy i ?e szkodzimy mniej ni? poprawiamy, a nade wszystko nie robimy nic ostatecznego. K?opot tak na prawd? robi? nam tylko ludzie którzy b?d? rewertowali zmiany WRAKa nie informuj?c nas o tym, wtedy g?upi automag b?dzie z nimi walczy? nei maj?c ?wiadomo?ci, ?e poprawia co? po raz 150 … jedyny sposób na takich to czeka?, a? sami si? zdenerwuj? i spróbuj? na nas nakrzycze?, wtedy wyt?umaczymy i poprawimy s?ownik WRAKa.

Inny problem:

A co z ulicami gdzie tabliczki z nazw? wyst?puj? w kilku odmianach? A takich miejsc jest wiele. Jeszcze gorzej je?li poza tabliczkami wliczy? nazwy pisane na domach (tak jak cz?sto na osiedlach). I we? to wyt?umacz komu? kto mieszka w kraju gdzie takie rzeczy dzia?aj? normalnie? :smiley:

Tak czy inaczej wychodzi, ?e przynajmniej na razie WRAKa modyfikowa? nie trzeba (od d?u?szego czasu nie wprowadza?em ?adnych zmian w skrypcie). Mam pytanie, czy powiesi? skrypt gdziekolwiek i za?o?y?, ?e nikt nie b?dzie nim próbowa? nam zrobi? QQ, czy chcemy go rozprowadzi? jako? tajnymi kana?ami? Nie jest to mo?e skrypt którego nie mo?na co chwil? pisac od nowa, ale nie ma takiej potrzeby skoro dzia?a. Poza tym praktyka mówi, ?e je?li udost?pni? skrypt to w ci?gu kilku godzin znajd? ewidentne b??dy które teraz siedz? cicho i czekaj? na release. :smiley:

K?opot mam z manualem, bo jak ja zaczn? pisa? jak tego u?ywam to wyjdzie mi powie??. :smiley: No ale jak trzeba to si? napisze :smiley: Najwy?ej napisz? krótko jak tego u?ywam i dlaczego, a pó?niej odpowiem na pytania.

Co trzeba zrobi? to w ko?cu napisa? szersz? informacj? o tym co robimy, to zrobi? bo cz??? ju? mam i by? mo?e to samo przet?umaczy? na j?zyk Królowej Eli licz?c na feedback od reszty ludzko?ci.

W szeroko rozumianym mi?dzyczasie spróbuj? zmontowa? GUStawowi jakiego? brata, który potrafi?by powiedzie? gdzie pojawiaj? si? poszczególne wariacje nazwy, tak aby pytaj?c go o tego ca?ego Roweckiego dosta? informacj?, ?e w Policach to on jest Stefan, a w Szczecinie Stefan “Grot” (dobrze pami?tam?). Bo jak rozumiem zak?adamy, ?e przynajmniej GUS si? nie myli.

OK to id? synchronizowa? s?owniki :wink:

Przegl?daj?c now? wersj? ulic.bez.GUStu zauwa?y?em, ?e nasz kolega z Niemiec ‘poprawi?’ ju? prawie 200 dróg, które nie mia?y ?adnej nazwy. Niestety nowa nazwa to “Droga” i nie b?dzie ju? widoczna w wartwie NoName…

ROTFL :smiley:
Mo?esz z nim o tym pogada? … ja te? bym móg?, ale obawiam si?, ?e on mnie nie lubi :smiley:

UPDATE
Dosta?em kolejn? wiadomo?? … google translator radzi sobie z nia kiepsko raczej :smiley:

Zaczyna mnie to po ma?u strasznie bawi? :smiley: Zrobi?em kilka fotek tabliczek na ulicach … tylko BT w kompie odmawia chwilowo pos?usze?stwa … mam nadziej?, ?e kolega nei wpadnie na genialny pomys? odwiedzenia Poznania, bo mo?e go od tego g?owa rozbole? :smiley:

Na pewno to on? Mo?e da si? mu konto zablokowa? za wandalizm :PPP Rzu? jakim linkiem…
Swoj? drog? my?l?, ?e pomys? alv z u?ywaniem nat_name nie jest taki z?y, zostawiaj?c jako name tylko najpowszechniejsze nazwy.
Gdyby bra? tylko to co na tabliczkach jest napisane to ja mam u siebie w mie?cie ile? kamienic, które maj? tabliczki z nazwami ostatni raz u?ywanymi w latach 80…

Przy okazji tej afery zosta?em wykryty i dosta?em anga? na poprawianie WTFów … ale ja nie o tym, wa?niejsze info jest jakgdyby z boku:

Czyli to nei jest tak jak my?leli?my, ?e WTFy sa po prostu brzydkie, one autentycznie szkodz?. No i ca?y czas sie pojawiaj?, warto by wi?c chyba wróci? do pomys?u, przelecenia iconvem wszystkich plików z UMP. Tylko nie wiem czy to mo?liwe, znaczy czy jest jaki? kontakt z w?a?cicielem serwera, czy co?.

ROTFL :laughing:
Dobra, ?eby nie by?o ?e brak nam poprawno?ci politycznej, napisa?em do Niego i kurtuazyjnie zainsynuowa?em, ?e nie jeste?my wybitnie zachwyceni dzia?alno?ci? Kolegi… cho? nie wiem jaki to ma sens, je?li jak mówisz On nie zna angielskiego. :open_mouth:

Tak, kontakt jest. Autorem UMP2OSM jest Damian http://wiki.openstreetmap.org/index.php/User:Damian i niedawno pisa?em do Niego, bo co?tam apropos i bardzo sympatycznie, pisa? ?e jest teraz raczej zaj?ty, ale ?e fajnie i ok i w ogóle. :smiley: Wiec jak Go poprosi? to powinno by? chyba OK. Spróbuj?.

EDIT
Cho? musz? przyzna?, ?e nie bardzo zrozumia?em o co chodzi z tym, ?e http://en.wikipedia.org/wiki/Replacement_character ‘mo?e wyk?ada? mysql po paru godzinach pracy’. Albo go wyk?ada, albo nie. Nie skuma?em.

Nie wiem czy nie trzeba by usun?? te dziwne podzia?y w Warcie (jak przy w?z?ach nr 037518717 i 18). Testowo usun??em w dwóch miejscach przy ?remie i zobaczymy czy si? nie rozjedzie :wink:

Ju? wczoraj do niego napisa?em, po ang. + pó? niemieckim z translatora. Narazie brak odpowiedzi.
Ten od “Dróg” to hasse_osm_korinthenkacker, a Ty piszesz z RambaZamba, chyba, ?e to ta sama osoba jest…

Myślę że RambaZamba to alterego hasse_osm_korinthenkacker, bo zmieniając np tę drogę http://www.openstreetmap.org/browse/way/23459377/history przezornie poprawił też created_by z JOSM na RambaZamba

Nie znam szczegó?ów ale rozumiem, ?e chodzi sobie Osmosis i co? tam wycina pobieraj?c po kawa?ku dane z bazy. Chodzi tak chodzi kilka godzin, trafia na WTF’a i si? wyk?ada, nie serwer bazy danych a Osmosis w?a?nie. Nie wiem czy o to chodzi, ale ja to tak zrozumia?em.

Killn??em w?a?nie kolejn? porcj? WTFów i trafi?em na ZONKA nie lada :smiley:

Jest sobie w bazie:

jest ich wi?cej i by?oby fajnie, ale:

$ grep -i "^d.bskiego" stat.txt 
D?bskiego;Jakuba ;ul.                             :    1
D?bskiego;Jana ;ul.                               :    2
D?bskiego;Macieja ;ul.                            :    1

kwalifikuje si? do r?cznej poprawki, bo co innego spierniczy? imi? jesli jest samo nazwisko, ale spierniczy? nazwisko to gorzej, szczególnie, ?e ma si? 25% szans na pud?o :smiley: