Cześć. Chciałbym poprawić tagowanie banków w Polsce. Z NSI ściągnąłem listę operujących w naszym kraju i napisałem Regexy żeby wyłapać jak najwięcej z każdej marki. Korzystam przy nich z pola name, np. w ten sposób:
"name"~"^(bank )*mill*enium( bank)*.*"
Chciałbym znalezionym tak obiektom dać jednakowy brand i inne tagi z NSI, a jeżeli w name nie ma słów jak np. “filia” albo “oddział” to również je zaktualizować.
Motywacja do tagowania - niska jakość danych w tej chwili. Mamy 21 placówek Eurobanku i 51 Raiffeisen (obie marki nie istnieją od ponad 2 lat). A istniejące marki są otagowane niejednolicie, np.:
przy zlikwidowanych sieciach banków chciałbym wykasować tagi takie jak name, brand itd. i w zasadzie zostawić tylko amenity=bank. Czy lepiej zamiast tego dać shop=vacant? Albo tylko usunąć amenity?
edit
Zgodnie z sugestiami nie będę zmieniał nic przy zamkniętych miejscach, dodam tylko do nich fixme z prośbą o sprawdzenie.
Jeśli chodzi o ujednolicenie nazw banków - jestem za. Trzeba najpierw wspólnie ustalić nazwę i potem można poprawiać.
Co do dodawania śmieciowych tagów dla botów - jestem przeciw.
Skoro dajemy w name banku np. name=ING, to to już jednoznacznie identyfikuje ten bank, nie ma potrzeby dodawania tego samego w innych tagach:
brand=ING
operator=ING
brand:wikipedia=ING
brand:wikidata=ING
Automatycznie tego się nie da zrobić, bo nie wiesz co powstało w danym miejscu.
Np. Eurobank został przejęty przez Millennium, ale nie wiesz czy w dawnej placówce jest Millennium, czy została zlikwidowana.
To są tagi sugerowane w ID, a ich brak jest chyba zgłaszany np przez Osmose. Czy tagi są śmieciowe? Tak naprawdę to większość banków powinna mieć name w rodzaju “PKO BP oddział nr 1 w Warszawie”. Z operator nie chcę nic zmieniać, zostaje link do Wikipedii i Wikidanych, nie widzę nic złego w dodawaniu tego.
Wiem, ale chyba usunięcie na pewno błędnego name to minimum co można (i należy) zrobić.
To tylko ukrywa problem… Nie jestem przekonany czy to coś poprawia.
Jest gdzieś lista zlikwidowanych banków i innych rzeczy? Np. w https://github.com/osmlab/name-suggestion-index ? Jeśli tak to może da się przekonać JOSMa/StreetComplete/iD by to wykrywały i zachęcały aktualizacji.
Albo skasować te co wiemy że nie istnieją? Nawet jeśli jest tam placówka innego banku to są to oczywiste buble.
A może disused:amenity=bank i check_date z datą ostatniej edycji? name do old_name i resztę tagów (np. brand) kasować?
StreetComplete ma taką regułę (check date starsze niż rok), ale tylko dla shop=* (źródło), wydaje mi się, że tam można zaproponować dodanie amenity=bank.
Branch ma w Polsce tylko 130 użyć i to wyłącznie przy energetyce. Nie chcę wprowadzać dodatkowych klasyfikacji, tylko wyrównać do standardu, który już ktoś przygotował. Te wszystkie sieci są jednolite w całym kraju.
Pomysł porządków uważam za słuszny, ale w praktyce może być trudny w realizacji ‘automatem’.
Głównie z powodu tego, że przy takich reorganizacjach struktur, placówki dublujące się lub nierentowne mogą ale nie muszą zostać zlikwidowane. Tu nie ma jednej zasady.
W takiej sytuacji pozostaje weryfikacja na gruncie lub choćby sprawdzenie w wyszukiwarce placówek na stronie banku.
W tagu [name] proponuję stosować czytelną, jak najkrótszą nazwę, tu przykładowo: [name]=[PKO BP].
Zaś numer lub nazwę oddziału proponuję zawierać w tagu [ref]=[Oddział 1 w Warszawie].
To jest 75 miejsc w całym kraju, ciężko by było samemu ręcznie zweryfikować.
Macie rację, nie będę ich ruszał, dodam tylko fixme z prośbą o sprawdzenie.
Tak, zamierzam dodać najkrótszą nazwę, taką jaka jest zalecana (dla tego przykładu name=PKO BP). Nie chcę nadpisać istotnych informacji dlatego pominę te nazwy, które zawierają słowa:
indywidualny | korporacyjny | fundusz | centrum | agencja | partner | filia | oddział
.
Masz rację z ref, ale to wymaga ręcznego przejrzenia żeby błędów nie narobić.
Ale jak chcesz usuwać samo name, a zostawiać pozostałe tagi? Wszystkie tagi są integralną częścią POI; jeśli w danym miejscu powstało coś nowego, to wszystkie tagi należy zaktualizować (zwykle poza wheelchair=* i adresem), a nie tylko nazwę. Jeśli w miejscu Eurobanku powstał Millennium, to wtedy doda się old_name=Eurobank, jeśli powstała Żabka, to poprawa wygląda inaczej. Nie da się automatycznie tego poprawić.
A kto przygotował ten “standard”?
NSI każdy może edytować, nie wiadomo nawet czy zrobił to ktoś z Polski. A w przypadku masowej automatycznej edycji musi być zgoda lokalnej społeczności, a nie NSI.
NSI to zło, które należy wyeliminować. Nie jest do niczego potrzebne i jest tam zbyt dużo błędów.
Ja dodaje sklep z kosmetykami Yves Rocher, a tu przychodzi ktoś, kto dokonuje masowej edycji na całym świecie i zmienia go na salon urody. I tak w kółko. No bo tak każe NSI.
Wychodziłem z założenia, że skoro nazwa jest na pewno błędna, to zmiana tej nazwy nie pogorszy, tylko polepszy stan mapy. Ale przekonaliście mnie - nie będę dotykał nieaktualnych sieci, dodam tylko fixme z informacją, że jest tu pewnie błąd.
Nie zgadzam się, NSI udostępnia wygodne szablony i jest zaakceptowane przez społeczność - szablony trafiają do ID, jest też wtyczka do JOSM. Tagowanie samemu prowadzi do takich nazw jak w pierwszym poście, przy tagowaniu POI dużo wygodniej korzystać z szablonów.
No to załóż issue w projekcie NSI, albo napisz tutaj żeby ktoś to zrobił, to błędna edycja, też bym się denerwował, ale:
nie jest to związane z moją propozycją edycji
błędne edycje można zgłaszać w przyjęty do tego sposób, nawet komentarz pod changesetem popchnął by sprawę do przodu
jeśli uważasz, że NSI jest do niczego to napisz o tym. Ta propozycja automatycznej edycji uważam, że nie dodaje błędnych tagów
Yves Rocher ma w tej chwili w Polsce wartości chemists/beauty/cosmetics. Cosmetics nie pojawia się na NSI, więc nie wszystko wynika z bezmyślnego kopiowania tagów.
Wydawało mi się, że NSI jest standardem, ale nawet jeśli nie, to tagi które chcę dodać (tożsame z tagami NSI) są zgodne z zasadami tagowania na OSM.
Jak dla mnie nie są śmieciowe. Wszystko zależy jak z danych korzystasz. Natomiast w tym konkretnym przypadku powinno być:
brand=ING
operator=ING Bank Śląski S.A.
brand:wikidata=Q1410383
brand:wikipedia=pl:ING Bank Śląski
Problemem będą nieczynne placówki to fakt ale na szybko sprawdzałem kilka i w większości przypadków lokale są na sprzedaż, lub już wynajęte (te w okolicy mojego zamieszkania) więc w tym przypadku raczej bym usuwał oznaczenie, bo lokale są mocno uniwersalne i raczej nie będzie szansy na to, że będzie tam inny bank. Co do “name” to propozycja m@rio jest spoko.
Tak na marginesie można by się zastanowić nad innymi POI i trochę temat ogarnąć.
Chciałbym to później zrobić przeglądając po kolei to co jest na NSI, tylko ograniczyłem się do banków żeby zobaczyć jakie jest zdanie społeczności i zobaczyć jakie mogą być problemy.