Propozycja automatycznej edycji: banki w Polsce

Cześć. Chciałbym poprawić tagowanie banków w Polsce. Z NSI ściągnąłem listę operujących w naszym kraju i napisałem Regexy żeby wyłapać jak najwięcej z każdej marki. Korzystam przy nich z pola name, np. w ten sposób:

"name"~"^(bank )*mill*enium( bank)*.*"

Chciałbym znalezionym tak obiektom dać jednakowy brand i inne tagi z NSI, a jeżeli w name nie ma słów jak np. “filia” albo “oddział” to również je zaktualizować.

Motywacja do tagowania - niska jakość danych w tej chwili. Mamy 21 placówek Eurobanku i 51 Raiffeisen (obie marki nie istnieją od ponad 2 lat). A istniejące marki są otagowane niejednolicie, np.:

Całość opisałem na Wiki.

Nie wiem też czy to jest dobry pomysł:

  • przy zlikwidowanych sieciach banków chciałbym wykasować tagi takie jak name, brand itd. i w zasadzie zostawić tylko amenity=bank. Czy lepiej zamiast tego dać shop=vacant? Albo tylko usunąć amenity?

edit
Zgodnie z sugestiami nie będę zmieniał nic przy zamkniętych miejscach, dodam tylko do nich fixme z prośbą o sprawdzenie.

No i czy ta edycja to dobry pomysł?

Jeśli chodzi o ujednolicenie nazw banków - jestem za. Trzeba najpierw wspólnie ustalić nazwę i potem można poprawiać.
Co do dodawania śmieciowych tagów dla botów - jestem przeciw.
Skoro dajemy w name banku np. name=ING, to to już jednoznacznie identyfikuje ten bank, nie ma potrzeby dodawania tego samego w innych tagach:
brand=ING
operator=ING
brand:wikipedia=ING
brand:wikidata=ING

Automatycznie tego się nie da zrobić, bo nie wiesz co powstało w danym miejscu.
Np. Eurobank został przejęty przez Millennium, ale nie wiesz czy w dawnej placówce jest Millennium, czy została zlikwidowana.

To są tagi sugerowane w ID, a ich brak jest chyba zgłaszany np przez Osmose. Czy tagi są śmieciowe? Tak naprawdę to większość banków powinna mieć name w rodzaju “PKO BP oddział nr 1 w Warszawie”. Z operator nie chcę nic zmieniać, zostaje link do Wikipedii i Wikidanych, nie widzę nic złego w dodawaniu tego.

Wiem, ale chyba usunięcie na pewno błędnego name to minimum co można (i należy) zrobić.

Ujednolicenie - podoba mi się co do zasady.

To tylko ukrywa problem… Nie jestem przekonany czy to coś poprawia.

Jest gdzieś lista zlikwidowanych banków i innych rzeczy? Np. w https://github.com/osmlab/name-suggestion-index ? Jeśli tak to może da się przekonać JOSMa/StreetComplete/iD by to wykrywały i zachęcały aktualizacji.

Albo skasować te co wiemy że nie istnieją? Nawet jeśli jest tam placówka innego banku to są to oczywiste buble.

A może disused:amenity=bank i check_date z datą ostatniej edycji? name do old_name i resztę tagów (np. brand) kasować?

StreetComplete ma taką regułę (check date starsze niż rok), ale tylko dla shop=* (źródło), wydaje mi się, że tam można zaproponować dodanie amenity=bank.

Jest, ale nie rozumiem jak ona powstaje:

No i można też dodać fixme, to chyba wszystko wykrywa.

Proponuję wziąć pod uwagę tag ** branch**
Czyli:
name=
brand=
branch=
ref=

Branch ma w Polsce tylko 130 użyć i to wyłącznie przy energetyce. Nie chcę wprowadzać dodatkowych klasyfikacji, tylko wyrównać do standardu, który już ktoś przygotował. Te wszystkie sieci są jednolite w całym kraju.

Pomysł porządków uważam za słuszny, ale w praktyce może być trudny w realizacji ‘automatem’.
Głównie z powodu tego, że przy takich reorganizacjach struktur, placówki dublujące się lub nierentowne mogą ale nie muszą zostać zlikwidowane. Tu nie ma jednej zasady.
W takiej sytuacji pozostaje weryfikacja na gruncie lub choćby sprawdzenie w wyszukiwarce placówek na stronie banku.

W tagu [name] proponuję stosować czytelną, jak najkrótszą nazwę, tu przykładowo: [name]=[PKO BP].
Zaś numer lub nazwę oddziału proponuję zawierać w tagu [ref]=[Oddział 1 w Warszawie].

To jest 75 miejsc w całym kraju, ciężko by było samemu ręcznie zweryfikować.

Macie rację, nie będę ich ruszał, dodam tylko fixme z prośbą o sprawdzenie.

Tak, zamierzam dodać najkrótszą nazwę, taką jaka jest zalecana (dla tego przykładu name=PKO BP). Nie chcę nadpisać istotnych informacji dlatego pominę te nazwy, które zawierają słowa:

indywidualny | korporacyjny | fundusz | centrum | agencja | partner | filia | oddział

.
Masz rację z ref, ale to wymaga ręcznego przejrzenia żeby błędów nie narobić.

Ale jak chcesz usuwać samo name, a zostawiać pozostałe tagi? Wszystkie tagi są integralną częścią POI; jeśli w danym miejscu powstało coś nowego, to wszystkie tagi należy zaktualizować (zwykle poza wheelchair=* i adresem), a nie tylko nazwę. Jeśli w miejscu Eurobanku powstał Millennium, to wtedy doda się old_name=Eurobank, jeśli powstała Żabka, to poprawa wygląda inaczej. Nie da się automatycznie tego poprawić.

A kto przygotował ten “standard”?
NSI każdy może edytować, nie wiadomo nawet czy zrobił to ktoś z Polski. A w przypadku masowej automatycznej edycji musi być zgoda lokalnej społeczności, a nie NSI.
NSI to zło, które należy wyeliminować. Nie jest do niczego potrzebne i jest tam zbyt dużo błędów.
Ja dodaje sklep z kosmetykami Yves Rocher, a tu przychodzi ktoś, kto dokonuje masowej edycji na całym świecie i zmienia go na salon urody. I tak w kółko. No bo tak każe NSI.

Ja tam byłem aktywny, głównie po to by buble poprawić.

Jeśli jakiś jest to warto poprawić - nalepiej zgłosić na https://github.com/osmlab/name-suggestion-index/issues ale można też poprosić kogoś innego by to zrobił jak ktoś się githuba boi.

Tu konkretnie chyba jest bug w iD. Z tego co widzę NSI jest poprawny i ma obie wersje. Zgłosiłem na https://github.com/openstreetmap/iD/issues/8426

na przykład? (poza Yves Rocher gdzie i tak bubel był w iD)

Wychodziłem z założenia, że skoro nazwa jest na pewno błędna, to zmiana tej nazwy nie pogorszy, tylko polepszy stan mapy. Ale przekonaliście mnie - nie będę dotykał nieaktualnych sieci, dodam tylko fixme z informacją, że jest tu pewnie błąd.

Nie zgadzam się, NSI udostępnia wygodne szablony i jest zaakceptowane przez społeczność - szablony trafiają do ID, jest też wtyczka do JOSM. Tagowanie samemu prowadzi do takich nazw jak w pierwszym poście, przy tagowaniu POI dużo wygodniej korzystać z szablonów.

No to załóż issue w projekcie NSI, albo napisz tutaj żeby ktoś to zrobił, to błędna edycja, też bym się denerwował, ale:

  • nie jest to związane z moją propozycją edycji
  • błędne edycje można zgłaszać w przyjęty do tego sposób, nawet komentarz pod changesetem popchnął by sprawę do przodu
  • jeśli uważasz, że NSI jest do niczego to napisz o tym. Ta propozycja automatycznej edycji uważam, że nie dodaje błędnych tagów
  • Yves Rocher ma w tej chwili w Polsce wartości chemists/beauty/cosmetics. Cosmetics nie pojawia się na NSI, więc nie wszystko wynika z bezmyślnego kopiowania tagów.

Wydawało mi się, że NSI jest standardem, ale nawet jeśli nie, to tagi które chcę dodać (tożsame z tagami NSI) są zgodne z zasadami tagowania na OSM.

ma - https://github.com/osmlab/name-suggestion-index/blob/ea9d441ffb3e1594fca160910219929b4393eb12/data/brands/shop/cosmetics.json#L390 (ale iD ma buga i to ignoruje - https://github.com/openstreetmap/iD/issues/8426 )

Jak dla mnie nie są śmieciowe. Wszystko zależy jak z danych korzystasz. Natomiast w tym konkretnym przypadku powinno być:

brand=ING
operator=ING Bank Śląski S.A.
brand:wikidata=Q1410383
brand:wikipedia=pl:ING Bank Śląski

Problemem będą nieczynne placówki to fakt ale na szybko sprawdzałem kilka i w większości przypadków lokale są na sprzedaż, lub już wynajęte (te w okolicy mojego zamieszkania) więc w tym przypadku raczej bym usuwał oznaczenie, bo lokale są mocno uniwersalne i raczej nie będzie szansy na to, że będzie tam inny bank. Co do “name” to propozycja m@rio jest spoko.
Tak na marginesie można by się zastanowić nad innymi POI i trochę temat ogarnąć.

Chciałbym to później zrobić przeglądając po kolei to co jest na NSI, tylko ograniczyłem się do banków żeby zobaczyć jakie jest zdanie społeczności i zobaczyć jakie mogą być problemy.

Puściłem retagowanie, linki do Changsetów są na Wiki.

Dlaczego najpierw pytasz o zgodę na automatyczną edycję, dajesz link do Wiki, gdzie opisujesz co zamierzasz zrobić, a potem robisz co innego?

Co innego zrobiłem?