Dodaję 1000+ drzew z RPDP

Koledzy/koleżanki,

Chciałbym poprosić o uwagi/sugestie przed dodaniem > 1000 drzew z Rejestru Polskich Drzew Pomnikowych (https://www.rpdp.hostingasp.pl/). Wlaścicielem serwisu jest Piotr Gach, autor “Altasu Drzew Polski”. Logika kopiowania jest następujaca: drzewo jest dodawane do OSM, jeżeli dane GPS są wiarygodne i jeśli w serwisie RPDP klasa jest >B, co oznacza, że mamy do czynienia albo z pomnikiem albo z drzewem o potencjalnej wartości pomnikowej. Dodatkowo, sprawdzam czy w OSM-ie nie ma już dodanego drzewa pomnikowego w odległości <=100m.

Proponowaną zmianę można znaleźć na OSM DEV: https://master.apis.dev.openstreetmap.org/changeset/183663?node_page=1#map=6/52.019/18.864

Źródło programu: https://github.com/rdktz/treehunter

Pozdrowienia.

Pierwsze pytanie oczywiście o licencję. Musisz zweryfikować na jakich zasadach dane są gromadzone. Na stronie za bardzo o tym nie ma informacji. Po drugie mamy projekt wprowadzania pomników z CRFOP, co oznacza, że trzeba te dane zweryfikować z rejestrem.
No i jak zamierzasza tagować te dane? Przydał by się jakiś szablon. To ci się może przydać https://github.com/openstreetmap-polska/CRFOP dyskusja o pomnikach jest tutaj https://forum.openstreetmap.org/viewtopic.php?id=66070

  1. Tagi source i website są identyczne. Jako source powinno być “Rejestr Polskich Drzew Pomnikowych” lub link do tego serwisu. A link do konkretnego drzewa w tagu url.
  2. Czy tag monument=yes|no koduje informację o pomniku przyrody? Bo do tego używamy tagu “protected”.
  3. changeset obejmuje całą Polskę - będzie sprawiał trudności innym w zapoznaniu się z jego zawartością. Wypadałoby go podzielić na 4-6 części.
  4. Proponuję zrezygnować ze sztucznego postarzania drzew, bo wiek drzew jest przybliżony i dodawanie do niego liczby lat jakie minęły od ostatniej edycji drzewa wygląda dziwnie i dokładności nie poprawia (np. jeśli wiek drzewa to około 200 lat i edycja była 2016 to w danych widnieje age=204).
  5. Aktualność danych (rok) dobrze byłoby dodać. Rozwiązałoby to powyższy problem.
  6. Ja bym dodał jeszcze tag ref:rpdz z numerem drzewa w tym serwisie.

Dziekuje za odpowiedzi.
Co do licencji - konsultowalem z autorem serwisu RPDP i w zakresie danych jaki bedzie wykorzystywany, nie ma problemów licencyjnych/regulaminowych.
Jesli chodzi o szczegółowe uwagi od kolegi Marafa24:
1 - zmienię. Czy uzyc url czy kombinacji “source:name=, source:ref= and source:addr=*.” ?
2 - taka była intencja. Użyję tagu “protected”
3 - czy podział może byc arbitralny?
4 - postarzanie drzew wdl taki logiki nie jest sztuczne (i uwidoczni sie to wraz z wiekiem serwisu) natomiast liczby mogą wyglądać nienaturalnie np 204. Uwaga jest jak najbardziej słuszna dlatego, ze w OSM wiek nie będzie rósł wraz z czasem. Jest jednak nuans dlatego, że data edycji nie oznacza daty określenia wieku… Coś z tym postaram się zrobić - zdaje się, że data pomiaru wysokości drzewa może się tu przydać
5 - jakiego tagu użyć w celu oznaczenia daty pomiaru?
6 - dodam

Pozdrowienia

https://master.apis.dev.openstreetmap.org/node/4320784356
Zamiast tagu age, który jak zauważyłeś nie będzie się zmieniał, lepiej użyć tagu start_date
i wpisać tam start_date=~1363 - o ile dane są z 2020 roku, jeśli nie, to odjąć od odpowiedniego roku.

Jaka jest dokładnie licencja tych danych? W niektórych przypadkach autor/właściciel danych nia ma problemu z dodaniem danych do OSM ale ich dodanie łamałoby zasady OSM.

Dodanie danych do OSM oznacza że mogą być wykorzystane w dowolych celach, w dowolny sposób (tak długo jak przestrzega się licencji ODBL).

Dokładnie tak, w skrócie dodanie ich do OSM oznacza, że będą dostępne na licencji ODBL. Kładziemy nacisk na to, by uniknąć przyszłych problemów. Bo się zdarzały. Miałem już dyskusje na ten temat nawet w przypadku danych publicznych.

Uwzglednilem w nowej wersji skryptu wszystkie sugestie techniczne.
Zestawy zmian sa podzielone wojewodztwami - przyklad https://master.apis.dev.openstreetmap.org/changeset/184069#map=9/51.4308/19.6103
(w ten sposob pojedynczy ‘changeset’ bedzie obejmowal maksymalnie 100-200 drzew).
Co do licencji, dziekuje za wyjasnienia. Faktycznie, wazna sprawa przedyskutowac to z wlascicielem RPDP na tym etapie… co zamierzam wlasnie zrobic.
Dziekuje

To jeszcze lepszy podział:)

Na szybko mam tylko 3 uwagi:

  • niektóre z nazw drzew nie są nazwami, przykład - https://master.apis.dev.openstreetmap.org/node/4320784961 :wink:
  • start_date, jako że są to daty przybliżone, poprzedziłbym tyldą
  • source można spokojnie dodać tylko do całego zestawu - w komentarzu lub jako znacznik zestawu, a nie do każdego drzewa.

Potwierdzilem, ze zakres danych kopiowany przez skrypt (lista tu https://github.com/rdktz/treehunter)) moze byc dowolnie wykorzystywane na zasadach licencji ODBL.

Co do 3 dodatkowych uwag powyzej:

  • z nazwami drzew nic nie poradzimy, ciezko by bylo tu takodowac jakas logike. W ogromnej wiekszosci te nazwy sa jednostkowe i sensowne. Jesli zdarzy sie ze nazwa jest mniej systematyczna, to bedzie musiala poczekac na edycje (tu moim zalozeniem jest, ze program w przyszlosci przekopiuje “nowe” drzewa z RPDP ale nie bedzie zmienial juz dodanych)

  • do start_date dodam tylde i zaokragle daty do dziesiatek

  • “source” jest o tyle potrzebnym atrybutem, ze moze sie zdarzyc, ze w przyszlosci “website” bedzie zaktualizowane, zeby wskazywac na strone organizacji, ktora opiekuje sie pomnikiem albo na ktorej terenie pomnik sie znajduje (np. w domemnie lasy.gov.pl). W takim przypadku zmiana strony ze RPDP na taka wlasnie ma sens, ale pozostajacy atrybut ref:rpdp bedzie mial sens w polaczeniu ze zrodlem (“source”). Znajac szczegolowosc niektorych opisow RPDP, podejrzewam ze czesto zrodlo RPDP moze byc bogatsze w informacje (np. fotografie) niz oficjalna strona.

Mam jeszcze jedna unicodowa poprawke do zrobienia, wiec do konca tygodnia poczekam jeszcze na Wasze ewentualne dodoatkowe sugestie.

Pozdrowienia

“z nazwami drzew nic nie poradzimy, ciezko by bylo tu takodowac jakas logike” - no to w takim razie trzeba je przejrzeć i ręcznie zweryfikować.

1000 nazw w liście nie powinno za dużo czasu zająć.

Można by też na początek pominąć nazwy z kropką w tekście nazwy

Tag source połączony jest z innymi tagami tylko w pierwszej wersji obiektu. Przy kolejnych nie wiadomo już, których tagów dotyczy. Wówczas trzeba
przejrzeć historię edycji obiektu, by dotrzeć do zestawu, w którym pojawił się sprawdzany tagi i jego źródło w tagu source. Jednak dokładnie ten sam rezultat osiągnie się umieszczając source w danych zestawu zmian.
Jeśli chcesz zachować w danych informacje o źródle tagu, należy skorzystać z konstrukcji source:=*.

Zauważyłem, że bez zapowiedzi w tym wątku rozpoczął się już import → https://www.openstreetmap.org/user/Astor%20Zdziwisz/history

Czy nie jest to przypadkiem naruszenie https://wiki.openstreetmap.org/wiki/Automated_Edits_code_of_conduct ?

Bardziej narusza https://wiki.openstreetmap.org/wiki/Import/Guidelines

Odswiezajac ten watek (niestety nie zauwazylem uwag wczesniej) - podlinkowany material mowi o tym ze importy maja byc dyskutowane wczesniej na odpowiednim kanale. https://wiki.openstreetmap.org/wiki/Mailing_lists podaje to forum jako wlasciwe miejsce.
Rozumiem, ze kolegom, ktorzy umiescili linki w dwoch poprzednich wpisach, moze chodzic o dodanie dokumentacji skryptu (https://github.com/rdktz/treehunter) do wiki. Zrobie to w ciagu nastepnych kilku dni. Jezeli sa inne uwagi to przydaloby sie kilka slow oprocz wklejonego linku.

Dzieki

@Astor Zdziwisz Na jakiej licencji są te dane? Na jakich warunkach są udostępniane?

“Co do licencji - konsultowalem z autorem serwisu RPDP i w zakresie danych jaki bedzie wykorzystywany, nie ma problemów licencyjnych/regulaminowych.” jest zachęcające ale trzeba coś konkretnejszego