Przykłady problemów to sytuacje gdzie jest różnica między nazwą ulicy w TERYT (pomijając różne nazewnictwo ulic typu “Józefa Piłsudskiego” “Marszałka Józefa Piłsudskiego” “Marszałka Piłsudskiego” nie wspominając o skrótach to śmieszny przypadek znalazłem gdzie gmina nadała nazwę ulicy “LG Electronics” i nawet tak jest w uchwale gminy, ale w teryt z jakiegoś powodu wpisali to jako po prostu “LG”) i w OSM albo sytuacja kiedy ktoś ręcznie zmapował budynek i dodał do niego numer i ten budynek z numerem jest kawałek oddalony od ulicy, a w PRG punkt adresowy jest przy granicy działki czyli prawie przy samej ulicy.
Mogę zmniejszyć trochę zasięg “- taki sam numer porządkowy i odległość do 50 metrów” oraz przerobić jakoś “- punkt adresowy prg trafia w budynek osm lub jest w odległości maksymalnie 15 metrów od niego oraz ten budynek osm ma jakikolwiek numer porządkowy”, żeby np też sprawdzało czy jest taki sam numer porządkowy.
A no i jeszcze rzecz która mi wyszła na wstępnej wersji strony… połowa Świnoujścia albo Szczecina mi wyskakiwała jako nieuzupełniona pomimo, że w OSM adresy były. Po sprawdzeniu okazało się, że adresy mają tylko ulicę i numer porządkowy, a nie mają podanej miejscowości w tagach. Myślałem nawet, że to błąd który trzeba by poprawić, ale na wiki ktoś napisał, że jest to dopuszczalny sposób zapisu adresów (bez miejscowości), bo Nominatim i tak dopasuje i po co zapychać bazę tekstem. To chyba był nawet oryginalny powód dla którego dodałem tę regułę, że jak numer porządkowy się zgadza i jest lokalizacyjnie blisko to pewnie ten sam adres.
Widziałem, że te zmiany już wprowadziłeś w życie. W efekcie tego cały Szczecin został zasypany “fałszywymi brakami”.
W dużej mierze jest to spowodowane tym, że starsze adresy (z czasów poprzedniego SIP-u miasta) w PRG są często umieszczone nie na budynku, a np. przy brzegu działki. Na szczęście, w nowym SIP-ie w zasadzie wszystkie adresy są na budynkach, a te nowododane mają już identyczne położenie w PRG (zapewne poprzedni SIP nie był kompatybilny z EMUiA i adresy były dodawane osobno dla dwóch baz).
Zauważyłem również, że pojawiły się “brakujące” adresy, gdy adres jest przypisany do dużego budynku (mimo tego, że numer i nazwa ulicy pokrywają się z PRG).
Są także także “braki” w przypadku oficyn, ze względu na zapis adresu. W PRG zapis to [numer]-OFICYNA, [numer]-OFICYNY, [numer]-OFICYNAPRAWA i [numer]-OFICYNALEWA; natomiast w OSM i miejskim SIP’ie to [numer]-OF i [numer]-OFOF.
W związku z tym, może dobrym kompromisem byłaby odległość 25 metrów od punktu z PRG?
No i jeszcze trzeba coś zrobić z tymi oficynami… Sprawa nie jest taka prosta, ponieważ o ile w przypadku -OFICYNA = -OF i -OFICYNY = -OFOF, to -OFICYNAPRAWA ≠ -OF i -OFICYNALEWA ≠ -OFOF → występuje to zamiennie (o ile położenie adresu z PRG jest prawidłowe).
Jestem otwarty na zmiany warunków używanych przez system jeżeli kilka osób się zgodzi co do jakiejś wartości to przestawię.
Ad. 2
Jeżeli podasz mi konkretny przypadek to będę mógł sprawdzić co tam się stało, ale często jest tak, że adres jest jako punkt i w jednym źródle ten punkt jest np przy wejściu, a w innym na środku i dla większego budynku ta różnica może wynosić ponad 15 metrów.
Ad. 1, 3
No tutaj wydaje mi się, że gmina powinna sprawdzić, czy nie muszą poprawić tego w PRG. To gminy zasilają PRG. Czasami zdarza się, że w PRG zostaną jakieś stare obiekty z poprzednich importów, albo gmina po prostu nie robi importów do PRG przez lata i są tam stare dane.
SIP stanowi raczej źródło najbliższe obowiązującemu stanowi prawnemu, więc może oni te adresy oficyn pozmieniali tylko nie zrobili aktualizacji w PRG.
Sprawę rozbieżności zapisu adresów oficyn zgłosiłem poprzez geoportal.gov.pl. Na razie nie wysłałem zgłoszenia przez SIP miasta, ponieważ mam wrażenie, że nikt ich nie obsługuje :/. Kiedyś zgłosiłem tam sprawę szczecińskich adresów na terenie sąsiedniej gminy, ale do dzisiaj nie dostałem odpowiedzi, a te adresy nadal tam wiszą (o dziwno nie ma ich w PRG!)…
Jeszcze małe sprostowanie, odnośnie lokalizacji adresów między SIP-em a PRG: po dokładniejszym sprawdzeniu zobaczyłem, że adresy nadal nie pokrywają się dokładnie. Jednak mam wrażenie, że od czasu nowego SIP-u różnica odległości jest mniejsza (chyba nadal nie ma pełnej synchronizacji z PRG i adresy są dodawane osobno do dwóch baz [?]). Jako ciekawostkę można wspomnieć, że automatyczną synchronizację z PRG oferują np. SIP-y w *e-mapa.net (iMPA).
Normalnie takie przypadki wyłapałaby zasada: “adres się zgadza i jest w odległości 150 m”, ale tutaj właśnie wchodzi to o czym wcześniej wspominałem… adres w osm nie ma tagu ani addr:city ani addr:place, jest tylko podana ulica i numer. Tak więc przy porównaniu “Szczecin plac Orła Białeg 2” z “plac Orła Białego 2” komputer stwierdza, że to nie jest to samo. Ja się z takim schematem adresowym do mapowania nie zgadzam, ale wiki dopuszcza.
Co do zgłaszania nie wiem jak ludzie z GUGiK (geoportal) to traktują, kiedyś byli raczej oporni w samodzielnych interwencjach i odsyłali do gmin, które te dane tworzą. Nie wiem jak gmina obsługuje zgłoszenia w SIP, ale można po prostu wysłać im też pytanie mailem, albo jako pismo ogólne w ePUAP.
Może rozwiązaniem byłoby pominięcie weryfikacji addr:city i addr:place (lub tylko addr:city) dla warunku “adres się zgadza i jest w odległości 150 m”?
Wydaje mi się, że bardzo rzadko nazwa miejscowości byłaby niezgodna z adresem z PRG; chyba większość różnic występuje w przypadku numerów domów i nazw ulic. W przypadku zmiany granic jakiejś miejscowości powinno się raczej przeprowadzić kompleksowy import, niż dodać tylko nowe adresy korzystając z tej strony.
Można też zwiększyć warunek odległości między punktem z PRG a punktem/centroidem z OSM. Przychylam się też do propozycji @szydzio, że najpierw może warto spróbować z różnicą odległości w postaci 40 m, którą w zależności od efektów będzie można później dalej zmniejszać/zwiększać.
Ostatnią opcją byłoby masowe dodanie addr:city do wszystkich adresów w Szczecinie, jednak uważam, że nie jest to konieczne - wszystkie wyszukiwarki i nawigacje korzystające z OSM, z którymi miałem styczność, bez problemu rozpoznają miasto w adresie na podstawie granic.
Zobaczymy co i kiedy odpiszą… Jeśli skierują do gminy, to napiszę maila. Jeśli nic z tego wszystkiego nie wyjdzie, to chyba będzie trzeba kompletnie zignorować braki w oficynach W Szczecinie raczej ich brakuje (kiedyś zostały zaimportowane wszystkie adresy bezpośrednio z miejskiego SIP-u), a nowych chyba już nie przybywa. Nie zauważyłem, aby w innych miastach stosowano takie oznaczenie.
Oho, dzięki za przykłady! Szukałem w największych miastach, a okazuje się że OF’y są także w tych mniejszych
Przy okazji wychodzi na to, że zapis (z PRG) [numer]-oficyna, itp. nie występują w dużej ilości poza Szczecinem. W Jeleniej Górze wyłapałem tylko zapis [numer]OF, natomiast w Legnicy znalazłem jeden adres “7-7OFICYNA”, reszta ma standardowe (?) [numer]OF.
Swoją drogą, za najbardziej poprawny zapis uważam ten, ze szczecińskiego SIP-u ([numer]-OF i [numer]-OFOF), ponieważ zapis bez odstępu może sugerować, że jest to adres typu [numer]AB, [numer]XY, itd. Gdzieś widziałem całe osiedle domków z adresami tego typu. https://www.openstreetmap.org/#map=18/54.12664/16.16592 - na szybko znalazłem taki, mało “hardcorowy” przykład
Przerobiłem nowe brakujące adresy we Wrocławiu po tej ostatniej zmianie - było trochę błędnych, podobnych jak wyżej na dużych lub długich budynkach, ale w większości były nowe braki, nie błędy.
Kolejny przypadek: https://i.postimg.cc/Gp6N84by/adres.png
Dlaczego ten adres wcześniej był pominięty? Adres w zielonym kółku też ma numer domu 1, ale dla innej ulicy.
Z miastami nie byłoby może problemu, ale trzeba by sprawdzić jak z wsiami gdzie nie ma ulic i może być trochę przypadków, gdzie takie same numery są blisko tylko że w oddzielnych wsiach/koloniach/przysiółkach.
Zapis bez addr:city/place utrudnia korzystanie z danych wszystkim ludziom, którzy nie wpisują tego w Nominatim tylko chcą pobrać dane z bazy/plików/api.
Zresztą poprawcie mnie jak się mylę, ale granice przestrzenne miejscowości nie są jakoś dobrze prawnie określone w Polsce, poza miastami które jednocześnie są gminami i można skorzystać z obrysu gminy. W BDOT10k jest warstwa ADMS, która niby to zawiera, ale ostatnim razem jak kilka lat temu na nią patrzyłem to była trochę dziurawa. Więc ja nie wiem skąd w OSM te granice miejscowości są i pytanie ile miejscowości je ma, a ile nie ma.
Co do miejscowości mających adresy z oficynami to na szybko wyszło mi, że w PRG miejscowości gdzie są jakieś numery porządkowe kończące się na “of” to:
simc | msc
---------±---------------
0005167 | Łomianki Dolne
0935802 | Jelenia Góra
0945380 | Zabrze
0954047 | Legnica
0965016 | Opole
0977278 | Słupsk
0977373 | Lębork
0987213 | Oleśnica
0987331 | Strzelin
a miejscowości z numerem porządkowym zawierającym “oficyn” to:
simc | msc
---------±---------
0954047 | Legnica
0977976 | Szczecin
Nie wiem, ale ulica się źle dopasowała przy czyszczeniu PRG.
Z obrazków ciężko mi to potem znaleźć, ale pierwszy wygląda na odległość, a drugi na to że numer 6 był przypisany do budynku i wcześniej to wycinało wszystkie adresy w pobliżu tego budynku.
Wszystkie miasta mają zdefiniowane granice. W przypadku gmin wiejsko-miejskich jest dostępny podział na część miejską i wiejską.
Problem z granicami występuje przy wsiach.
Niestety Nominatim ma tendencję do „gubienia się” przy obiektach położonych blisko granicy relacji co wynika z aproksymacji jaką Nominatim stosuje do określania adresów.
Tutaj przykłady ze Szczecina które mimo zawierania się w obrębie relacji są przez Nominatim przyporządkowywane do innych miejscowości.
Koniec końców Nominatim daje rady je jednak odnaleźć (choć np. Photon w przypadku pierwszych 2 adresów się poddaje) ale bez addr:city może IMHO powstać u użytkowników wątpliwość która miejscowość jest właściwa.
Inną kwestią są też nieprawidłowo wyrysowane granice. Często spotykam niestety sytuacje, w których nawet gminy są wyrysowane (miejscami sporo) niedokładnie i „łapią” miejscowości z ościennych gmin.
Dlatego uważam, że addr:city/addr:place nawet w przypadku wyrysowanych granic nie jest redundantne i zawsze je uzupełniam jeśli są takie braki.
Wychodzi na to, że najlepszym rozwiązaniem byłoby dodanie addr:city do adresów w granicach Szczecina lub zignorowanie tego tagu przy weryfikacji braków w adresacji.
Biorąc pod uwagę wcześniejsze argumenty, przychylam się jednak do dodania tagów addr:city. Przy okazji można by uzupełnić kody pocztowe, aby była przy tym jeszcze jakaś wartość dodana Nie jestem specem od masowych edycji, więc musiałby to zrobić ktoś inny.