Dla testów zaimportowałem Pomorze do wirtualki. Jako że większość danych byla zapewne cache’owana w RAM-ie, a nazwane ulice wrzuciłem do osobnej tabeli, import i analiza trwały bardzo szybko.
W rezultacie dostałem 600 par ulic. No przyznam, że trochę z nich to były faktyczne błędy, ale większość to szum. Ale pewnie taka natura indeksu pg_trgm i jego funkcji similarity().
W każdym razie - **zeszliśmy z 787 do 501 ulic! **Dobra robota!
Twierdzę, że co się dało poprawić bez wiedzy, gdzie to właściwie jest, zostało obskoczone. Plus parę przypadków, gdzie wiedzę o położeniu dało się bez większego śledztwa wyciągnąć z tagów lub podkładu PRNG.
Teraz proszę o wersję z lokalizacją.
Ciekawostka: ulica, która wylazła pod nazwami “Kunickiego”/“Doktora Kunickiego” rzeczywiście oficjalnie nazywa się “Doktora Kunickego”. Z prawdopodobieństwem graniczącym z pewnością chodzi o Adama Kunickiego, ale skoro oficjalnie (wg TERYT) gość miał na imię Doktor…
A co byście zrobili z przypadkiem “Bednarska”/“Bednarska ?”? Jest parę takich…
Kiedy rzuciłem okiem, co tam się w JOSM otwiera, to byłem przekonany, że to ten odstający w bok kawałek nazywa się inaczej, bo tak.
A tymczasem on się nie nazywa wcale i nie wiem czemu jest podstawiany do edycji (chyba że w międzyczasie ktoś mu usunął nazwę?).
Natomiast część tego długiego ciągu ma name=“Brata Alberta”;name:right=“Świętego Brata Alberta”, a część - name=“Świętego Brata Alberta”;name:left=“Brata Alberta”. Oznaczenia wydają się równoważne - ta sama ulica po lewej stronie ma jedną nazwę , a po prawej drugą. To ja to może jednak ujednolicę?
Ja to właśnie “ujednoliciłem”, czyli nadałem nazwy zgodnie z granicami między miastem a powiatem. Na tej liście ulica wciąż będzie wyskakiwała, ale na mrówkach nie.
Tam już wcześniej ktoś bez pełnej wiedzy o skomplikowaniu sprawy poprawiał, i dodał nazwę do ulicy bez nazwy, zapewne ze względu na mrówki.
To ja nadal czegoś nie rozumiem. Jak dla mnie w tej chwili z tagów wynika, że granica cały czas leci środkiem tego nieutwardzonego odcinka, po jednej stronie ulica ma jedną nazwę, a po drugiej drugą. Czemu więc część odcinka jest oznakowana name i name:right, a część name i name:left?
Ulica jest raz po jednej stronie granicy, raz po drugiej. Nie ma tu praktycznie takiej sytuacji, by szła środkiem. Stąd taki zabieg - w name jest ta nazwa, jaka wynika z własności terenu. Nazwa dla adresów jest wówczas podana w name:left lub name:right.
Możnaby tu użyć tylko name:left|right i usunąć name, ale to jest kombinacja, którą mało co obsłuży.
Prościej by było, gdyby się władze tam dogadały i ujednoliciły pisownię. Albo gdybyśmy my w name nie trzymali tych wszystkich świętych,generałów,błogosławionych itp.
A jak chcesz przykład drogi z granicą pośrodku i to nie byle jaką oraz dwiema nazwami, to też mogę podrzucić:)
Mała aktualizacja.
Na chwilę obecną mamy 100 ulic w raporcie. Dodałem kolumnę z uwagami (z tagu note=*), aby można było zaznaczyć przypadki, których nie należy poprawiać, bo w graniczących miejscowościach przyjęto inną nazwę (są mi znane 3 takie).
Zapraszam do poprawiania, niewiele zostało
Gdy zejdziemy np. do 50 to powiększę promień sprawdzania, teraz jest to 30 metrów i niektóre nienazwane mosty przerywające ciąg nazwanej ulicy mogą przeszkodzić w wykryciu błędu.
No choćby dodajac link, otwierający właściwe miejsce w OSM, zawsze można oddalić i zobaczyć, gdzie to.
Może nie jest to tak wygodne, jak podanie pełnej ścieżki województwo-powiat-gmina-miejscowość, ale zawsze to lepiej, niż zostać z czerwoną kreską.
Dorzucę swój pomysł to tego świetnego narzędzia Może w łatwy sposób nad listą mogłaby być generowana data i godzina ostatniej aktualizacji? Czasami taka informacja mogłaby dać rozeznanie, czy to nowa czy może stara lista? Dzięki.