Podzielam zdanie @tomczk żeby nie wyłączać tych warunków. Ewidentnych braków jest jeszcze na tyle sporo, że jest co robić.
Pojedyncze nie wychwycone braki zawsze można zmapować wprost z wms-ów a te warunki jednak dość dobrze zapobiegają dublowaniu adresów.
By ty zrobić, trzeba wiedzieć, gdzie taki brak jest. Ich znajdowanie to jedna z postawowych funkcji https://budynki.openstreetmap.org.pl.
A ręczne przeglądanie okolicy i porównywanie wizualne danych z osm z podkładem wms jest wykonalne tylko dla małych obszarów.
Tego właśnie nie widzę - nie potrafię sobie wyobrazić sytuacji, w której te dwa warunki eliminują duplikat.
Duplikaty eliminuje “taka sama nazwa miejscowości, ulicy i nr porządkowy oraz odległość geometrii do 150 metrów” (zakładam tu, że to też obejmuje adresy z pustą nazwą ulicy, czyli tylko z addr:place i addr:houseumber).
Jest jeszcze trzeci, wątpliwy warunek “odległość geometrii do 5 metrów”. Znam sytuacje, w którym ma sens, ale to są jednostkowe przypadki i dotyczą gmin z bałaganem w adresach.
Nie, wszystko jest ok. Tak zawsze jest w sobotę, kiedy aktualizuje się baza. Zauważ że liczba w “kafle pozostałe do przetworzenia” cały czas spada. A trochę ich jest.
Przykłady problemów to sytuacje gdzie jest różnica między nazwą ulicy w TERYT (pomijając różne nazewnictwo ulic typu “Józefa Piłsudskiego” “Marszałka Józefa Piłsudskiego” “Marszałka Piłsudskiego” nie wspominając o skrótach to śmieszny przypadek znalazłem gdzie gmina nadała nazwę ulicy “LG Electronics” i nawet tak jest w uchwale gminy, ale w teryt z jakiegoś powodu wpisali to jako po prostu “LG”) i w OSM albo sytuacja kiedy ktoś ręcznie zmapował budynek i dodał do niego numer i ten budynek z numerem jest kawałek oddalony od ulicy, a w PRG punkt adresowy jest przy granicy działki czyli prawie przy samej ulicy.
Mogę zmniejszyć trochę zasięg “- taki sam numer porządkowy i odległość do 50 metrów” oraz przerobić jakoś “- punkt adresowy prg trafia w budynek osm lub jest w odległości maksymalnie 15 metrów od niego oraz ten budynek osm ma jakikolwiek numer porządkowy”, żeby np też sprawdzało czy jest taki sam numer porządkowy.
A no i jeszcze rzecz która mi wyszła na wstępnej wersji strony… połowa Świnoujścia albo Szczecina mi wyskakiwała jako nieuzupełniona pomimo, że w OSM adresy były. Po sprawdzeniu okazało się, że adresy mają tylko ulicę i numer porządkowy, a nie mają podanej miejscowości w tagach. Myślałem nawet, że to błąd który trzeba by poprawić, ale na wiki ktoś napisał, że jest to dopuszczalny sposób zapisu adresów (bez miejscowości), bo Nominatim i tak dopasuje i po co zapychać bazę tekstem. To chyba był nawet oryginalny powód dla którego dodałem tę regułę, że jak numer porządkowy się zgadza i jest lokalizacyjnie blisko to pewnie ten sam adres.
Widziałem, że te zmiany już wprowadziłeś w życie. W efekcie tego cały Szczecin został zasypany “fałszywymi brakami”.
W dużej mierze jest to spowodowane tym, że starsze adresy (z czasów poprzedniego SIP-u miasta) w PRG są często umieszczone nie na budynku, a np. przy brzegu działki. Na szczęście, w nowym SIP-ie w zasadzie wszystkie adresy są na budynkach, a te nowododane mają już identyczne położenie w PRG (zapewne poprzedni SIP nie był kompatybilny z EMUiA i adresy były dodawane osobno dla dwóch baz).
Zauważyłem również, że pojawiły się “brakujące” adresy, gdy adres jest przypisany do dużego budynku (mimo tego, że numer i nazwa ulicy pokrywają się z PRG).
Są także także “braki” w przypadku oficyn, ze względu na zapis adresu. W PRG zapis to [numer]-OFICYNA, [numer]-OFICYNY, [numer]-OFICYNAPRAWA i [numer]-OFICYNALEWA; natomiast w OSM i miejskim SIP’ie to [numer]-OF i [numer]-OFOF.
W związku z tym, może dobrym kompromisem byłaby odległość 25 metrów od punktu z PRG?
No i jeszcze trzeba coś zrobić z tymi oficynami… Sprawa nie jest taka prosta, ponieważ o ile w przypadku -OFICYNA = -OF i -OFICYNY = -OFOF, to -OFICYNAPRAWA ≠ -OF i -OFICYNALEWA ≠ -OFOF → występuje to zamiennie (o ile położenie adresu z PRG jest prawidłowe).
Jestem otwarty na zmiany warunków używanych przez system jeżeli kilka osób się zgodzi co do jakiejś wartości to przestawię.
Ad. 2
Jeżeli podasz mi konkretny przypadek to będę mógł sprawdzić co tam się stało, ale często jest tak, że adres jest jako punkt i w jednym źródle ten punkt jest np przy wejściu, a w innym na środku i dla większego budynku ta różnica może wynosić ponad 15 metrów.
Ad. 1, 3
No tutaj wydaje mi się, że gmina powinna sprawdzić, czy nie muszą poprawić tego w PRG. To gminy zasilają PRG. Czasami zdarza się, że w PRG zostaną jakieś stare obiekty z poprzednich importów, albo gmina po prostu nie robi importów do PRG przez lata i są tam stare dane.
SIP stanowi raczej źródło najbliższe obowiązującemu stanowi prawnemu, więc może oni te adresy oficyn pozmieniali tylko nie zrobili aktualizacji w PRG.
Sprawę rozbieżności zapisu adresów oficyn zgłosiłem poprzez geoportal.gov.pl. Na razie nie wysłałem zgłoszenia przez SIP miasta, ponieważ mam wrażenie, że nikt ich nie obsługuje :/. Kiedyś zgłosiłem tam sprawę szczecińskich adresów na terenie sąsiedniej gminy, ale do dzisiaj nie dostałem odpowiedzi, a te adresy nadal tam wiszą (o dziwno nie ma ich w PRG!)…
Jeszcze małe sprostowanie, odnośnie lokalizacji adresów między SIP-em a PRG: po dokładniejszym sprawdzeniu zobaczyłem, że adresy nadal nie pokrywają się dokładnie. Jednak mam wrażenie, że od czasu nowego SIP-u różnica odległości jest mniejsza (chyba nadal nie ma pełnej synchronizacji z PRG i adresy są dodawane osobno do dwóch baz [?]). Jako ciekawostkę można wspomnieć, że automatyczną synchronizację z PRG oferują np. SIP-y w *e-mapa.net (iMPA).
Normalnie takie przypadki wyłapałaby zasada: “adres się zgadza i jest w odległości 150 m”, ale tutaj właśnie wchodzi to o czym wcześniej wspominałem… adres w osm nie ma tagu ani addr:city ani addr:place, jest tylko podana ulica i numer. Tak więc przy porównaniu “Szczecin plac Orła Białeg 2” z “plac Orła Białego 2” komputer stwierdza, że to nie jest to samo. Ja się z takim schematem adresowym do mapowania nie zgadzam, ale wiki dopuszcza.
Co do zgłaszania nie wiem jak ludzie z GUGiK (geoportal) to traktują, kiedyś byli raczej oporni w samodzielnych interwencjach i odsyłali do gmin, które te dane tworzą. Nie wiem jak gmina obsługuje zgłoszenia w SIP, ale można po prostu wysłać im też pytanie mailem, albo jako pismo ogólne w ePUAP.
Może rozwiązaniem byłoby pominięcie weryfikacji addr:city i addr:place (lub tylko addr:city) dla warunku “adres się zgadza i jest w odległości 150 m”?
Wydaje mi się, że bardzo rzadko nazwa miejscowości byłaby niezgodna z adresem z PRG; chyba większość różnic występuje w przypadku numerów domów i nazw ulic. W przypadku zmiany granic jakiejś miejscowości powinno się raczej przeprowadzić kompleksowy import, niż dodać tylko nowe adresy korzystając z tej strony.
Można też zwiększyć warunek odległości między punktem z PRG a punktem/centroidem z OSM. Przychylam się też do propozycji @szydzio, że najpierw może warto spróbować z różnicą odległości w postaci 40 m, którą w zależności od efektów będzie można później dalej zmniejszać/zwiększać.
Ostatnią opcją byłoby masowe dodanie addr:city do wszystkich adresów w Szczecinie, jednak uważam, że nie jest to konieczne - wszystkie wyszukiwarki i nawigacje korzystające z OSM, z którymi miałem styczność, bez problemu rozpoznają miasto w adresie na podstawie granic.
Zobaczymy co i kiedy odpiszą… Jeśli skierują do gminy, to napiszę maila. Jeśli nic z tego wszystkiego nie wyjdzie, to chyba będzie trzeba kompletnie zignorować braki w oficynach W Szczecinie raczej ich brakuje (kiedyś zostały zaimportowane wszystkie adresy bezpośrednio z miejskiego SIP-u), a nowych chyba już nie przybywa. Nie zauważyłem, aby w innych miastach stosowano takie oznaczenie.