Integracja danych CRFOP (Centralny Rejestr Form Ochrony Przyrody)

Chętnie pomogę w realizacji, na pewno mogę pomóc w zakresie weyfikacji dokładności danych w Krakowie i okolicach. Rozumiem że drzewa będą pierwszą importowaną grupą obiektów?

Na początek: na jakiej licencji są te dane? Z szybkiego zerknięcia na stronę nie widzę informacji o licencji.

Tak się wydaje, że drzewa będą najłatwiejsze do ogarnięcia, co do reszty jest dużo pytań bez odpowiedzi. Zobacz np. jak oznaczonę są krzaki w rejestrze.
Co do licencji to dane są ogólno dostępne natomiast oficjalnie jeszcze nie mamy stanowiska CROFP, natomiast koledzy z ochrony środowiska zdają sobie sprawę na jakiej licencji danę są u nas.

Na razie to początek drogi i współpracy z nimi. Proszę w związku z tym o cierpliwość.

WFS oferowany przez CRFOP jest na rządowej liście otwartych danych opisany jako informacja publiczna:
https://dane.gov.pl/dataset/471

Jak będzie wyglądać aktualizacja takich danych w OSM? Nie powtórzy się problem z oddziałami Lasów Państwoych, gdzie OSM ma nieaktualne dane?

Właśnie nad tym pracujemy, dane będą nam przekazane w znacznie formie rozbudowanej, niż te dostępne na stronie. Aktualizacja będzie możliwa dzięki współpracy Państwa z CRFOP. Stowarzyszenie obecnie dogaduje szczegóły techniczne, ale to trochę jeszcze potrwa.

Garść informacji co do postępu prac nad integracją:
1 .Trzeba będzie podjąć decyzje co do formy zapisu danych tzn:
Czy zaznaczamy pomniki przyrody, czy pojedyńcze składowe pomników? (W przypadku alei drzew jest to szczególnie ważne)

2 .Dane będą przygotowane przez rejestr więc będą zawierały linki do materiałów na stronach rejestru - uchwał, zdjęć itp.

  1. Na dziś mamy nie rozwiązany mechanizm aktualizacji - za wczasu chcę uniknąć problemów z aktualizacją i brakiem aktualnych danych w OSM.

Na razie to tyle. Będe w tym wątku umieszczał wszytkie informacje w miarę jak sam będe je otrzymywał.

um - z moich skromnych doświadczeń:

Dane z CRFOP są nieaktualne - ale - wiadomo, oni sami nie wiedzą że drzewo się przewróciło i już go nie ma
Te dane bywają nieprecyzyjne - ich pozycje nieraz wypadają na środku drogi, a osobiście znam jedno drzewo które w danych z CRFOP było pięćdziesiąt metrów dalej niż rzeczywiście rośnie
Jest bardzo dużo drzew i innych pomników powprowadzanych w OSM - z najróżniejszymi tagami i nie zawsze we właściwych lokalizacjach - ich miejsca różnią się nie tylko od faktycznych pozycji ale też od tych które przychodzą z CRFOP

Absolutnie po partyzancku przeniosłem wszystkie pomniki z kujawsko-pomorskiego od CRFOP do OSM i na pewno są tam tysiące duplikatów; próbowałem eliminować te najbardziej oczywiste - skrypt wyszukiwał czy w promieniu kilkunastu metrów od wprowadzanego punktu jest już jakiś istniejący obiekt - i nie dodawał nowego jeśli coś znalazł - ale to zawodna metoda z powodu braku precyzji danych z CRFOP i z OSM. Naprawdę miło byłoby usunąć wszystko o pomnikach z OSM i na to miejsce wepchać wszystko co przyjdzie CRFOP - to by ograniczyło duplikaty - ale OSM nieraz jest dokładniejszy od CRFOP, poza tym - niektóre drzewa są ładnie poopisywane w OSM.

Pamowie z CRFOP zdają sobie sprawę z tych problemów. Trzeba pamiętać, że są wyłącznie integratorem danych otrzymanych z innych instytucji. Niestety na razie nie mamy pomysłów, ale coś tam już się urodziło, mam nadzieje, że lada dzień będe mógł coś więcej powiedzieć.

Na razie możemy przygotować szablon tagowania pomników przyrody, by ruszyć z tematem. Postaram się do czwarku na stronach stowarzyszenie OSM Polska przygotować mały artykuł z propozycją, bo już trochę nad tym siedziałem. Linka umieszczę w tym wątku oczywiście.

No i jeszcze będe miał małą niespodziankę, związaną z danymi z CRFOP, także obserwujcie wątek

Zebrałem wszytkie klucze jakie wydają się przydatne do opisania Pomników Przyrody - Drzew, proszę sprawdżcie czy czegoś nie zapomniałem, oraz zastanówmy się wspólnie na szablonem jak wpisywać je w OSM.

„leaf_type=broadleaved/needleleaved” – (Liściaste/iglaste) opisuje rodzaj drzewa
„species=” - naukowa nazwa gatunku (popularnie znana jako nazwa łacińska).
„species:pl=
” - polska nazwa gatunku. (można dodać nazwę w innym języku dodając klucz gdzie zamiast oznaczenia „pl” będzie występowało oznaczenie innego języka np. „en”)
„protected=yes” Oznaczenie dla drzew pod prawną ochroną.
„circumference=” - obwód pnia (mierzone na wysokości 1,3 m powyżej ziemi). Jeśli nie ma podanej jednostka miary, zakładamy że wartość jest podana w metrach.
„height=
” - wysokość drzewa (j.w.).
„diameter_crown=” dla średnicy korony drzewa (j.w.)
„name=
” - dla pojedynczych drzew, które mają nazwę. Zazwyczaj są to pojedyncze drzewa posiadające historyczne lub tradycyjne nazwy lub drzewa o nazwie nadanej dla upamiętnienia wydarzeń specjalnych. Nie należy tu wpisywać nazwy gatunku drzewa.

„denotation=urban” Określa kontekst występowanie drzewa w środowisku miejskim. Drzewa rosnące na osiedlach, np. w parkach lub rozprzestrzeniające się na obszarach mieszkalnych.
„denotation=avenue” Określa drzewo jako części alei drzew, jego zastosowanie pozwala ominąć limity stosowania tagu: “natural=tree_row” i pozwala dokładnie opisać poszczególne drzewa wchodzące w skład alei.

“denotation=natural_monument” - Oznaczenie unikalnego, wyjątkowego drzewa - pomnikowego, nie oznacza, że obiekt znajduje się pod ochroną prawną.

„source” – klucz używany do oznaczenia źródła danych jakie zostały użyte przy oznaczeniu obiektu
„source=survey” Kombinacja stosowana w przypadku kiedy źródłem danych o obiekcie była wizja lokalna
„source:date=*” Opcjonalna data przeprowadzenia wizji lokalnej dla danego obiektu. Data powinna być podana w formie ISO 8601 tzn. YYYY-MM-DD (2019-07-28)

Propozycja oznaczenia żródła z rejestru:

„source:name=CRFOP”, Oznacza że źródłem danych jest Centralny Rejestr Form Ochrony Przyrody
„source:ref=” Numer rejestracyjny obiektu w CRFOP (np. PL.ZIPOP.1393.PP.1015082.965)
„source:url=
” Adres strony obiektu w zasobach CRFOP
„start_date=*” W przypadku obiektu z zasobów CRFOP najlepiej wpisać datę wprowadzenia obiektu do rejestru CRFOP. Data powinna być podana w formie ISO 8601 tzn. YYYY-MM-DD (2019-07-28)

Dodatkowo, czy warto dodawać linki do materiałów ze strony rejestru - takich jak ustawy i zdjęcia, ponieważ to też jest możliwe?
Co wy na to?

Na szybko, to chyba lepiej ref:crfop=* bo identyfikator w CRFOP nijak nie zależy od tego, czy zaimportowaliśmy z CRFOP.
Ogólnie, obiekt może mieć różne identyfikatory w różnych systemach, widzę dość ogólnie przyjętą konwencję ref:=* i proponuję się tego trzymać.

Przyjęło się, że w osm zawsze używamy tego tagu dla pomnika przyrody. Razem z protected=yes.
Propozycja więc przerzuca definicję całego pomnika na protected, który raczej nie był do takiego funkcji projektowany - bo wówczas nazywałby się np. protected_monument.

Użyłbym check_date= lub survey:date=

ref:crfop=
url=, ewntualnie, gdyby było już zajęte, url:crfop=

start_date to będzie data posadzenia drzewa.
Data wprowadzenia do CRFOP jest nam niepotrzebna. Można ją ustalić po ref:crfop.

Zdjęcia mogłyby się przydać. Szczególnie jedno podpięte pod tag image.

Postaram się w przyszłym tygodniu zdobyć próbkę danych - zobaczymy na tej podstawie co i jak, przetłumaczyć na język OSM.

tak - start_date jest używane jako data posadzenia - ja bym unikał zmiany znaczenia tych wpisów
url praktycznie zawsze jest wolne
image w CRFOP jak już są zdjęcia to zwykle kilka ujęć drzewa (zdjęć) gdyby dać url do strony z opisem obiektu - to są tam wszystkie zdjęcia.

w całym spisie CRFOP są nie tylko drzewa, ale też różne interesujące kamienie, albo jaskinie, skalne jakieś obiekty (ale znacząco mniej niż drzew)

Overpass-turbo mówi że aktualnie natural_monument jest:

wszystkich wezlow: 17230

dolnośląskie: 285
kujawsko-pomorskie: 12476
lubelskie: 262
lubuskie: 32
łódzkie: 35
małopolskie: 43
mazowieckie: 77
opolskie: 10
podkarpackie: 3736
podlaskie: 1
pomorskie: 80
śląskie: 33
świętokrzyskie: 37
warmińsko-mazurskie: 16
wielkopolskie: 49
zachodniopomorskie: 58

W tagu ‘natural’ oprócz wartości ‘tree’ można znaleźć:

waterfall: 2
stone: 98
spring: 11
rock: 47
cave_entrance: 1
other: 3
cave: 1
fossil: 1

4908 węzłów ma wypełniony tag ‘name’
20 węzłów ma wypełniony tag ‘image’

oprócz najpopularniejszych tagów, występują też:

kodinspire = 268,
gid = 268,
source = 176,
vitality = 108,
cluster = 108,
description:location = 108,
established = 108,
plant_count = 108,
ref:gdoś = 108,
sign = 108,
size = 108,
animate = 108,
area = 108,
genus:pl = 56,
tourism = 46,
genus:en = 30,
ref = 30,
historic = 28,
wikipedia = 24,
name:botanical = 22,
species:wikidata = 14,
species:wikipedia = 14,
is_in = 13,
is_in:city = 12,
mapillary = 8,
genus:eo = 8,
opening_hours = 7,
source:denotation = 7,
taxon:genus:en = 6,
taxon:genus:pl = 6,
waterway = 6,
picture = 5,
alt_name = 5,
type = 5,
name:prefix = 4,
addr:street = 4,
addr:postcode = 4,
memorial = 4,
addr:city = 4,
ele = 3,
genus:de = 3,
fixme = 3,
inscription = 2,
source:protected = 2,
source:name = 2,
addr:housenumber = 2,
source:geometry = 2,
source:user = 2,
denomination = 2,
religion = 2,
addr:place = 1,
access = 1,
end_date = 1,
loc_name = 1,
obiekt = 1,
wikimedia_commons = 1,
sex = 1,
age = 1,
diameter = 1,
tree = 1,
taxon:pl = 1,
fire_hydrant:type = 1,
fire_hydrant:position = 1,
fire_hydrant:diameter = 1,
emergency = 1,
diameter_crown = 1,
collapsed = 1,
location = 1

Mam kolejne wiadomości, obecnie czekamy na sprawy techniczne. Tłumaczenie bazy CRFOP na format SHP, co by było łatwiej. Trzeba będzie na serio zabrać się za szablon tagów dla integracji danych. Proponuje utworzenie jakiegoś pokoju na SKYPE, i obgadania tematu przez chętnych.

Drobna aktualizacja. Cały czas czekamy na dane z rejestru. Problemem jest ich spójność po stronie CRFOP, jak zapewnie się domyślacie się baza nie jest najmniejsza i trochę to potrwa. Na dziś mamy wyznaczony termin na około połowę Lipca.

Jak to się mówi trzeba być cierpliwym. Dane są dostępne pod adresem Rejest - Meta Dane. Dostepne są w pliku SHP. Proponuje wstrzymać się z dodawaniem do OSM, i omówić sposób tagowania by był jednolity i czytelny. Jest także szansa na bota, który będzie monitorował zmiany w rejestrze i informował o nich.

Dacie radę przygotować szablon?

Zapraszam do dyskusji. (Niestety ja niepodyskutuje bo przez najblizsze 2 tyg. jestem na cyfrowym odwyku)

Dane z jedngo województwa (Podkarpackie) jako próbka: arkusz google z danymi

Dzisiaj postaram się dodać tagi po południu, propozycje i uwagi tutaj, szczególnie do innych form miż drzewa, no i jeszcze kto chętny do weryfikacji danych? Szykuje sie duże map party przy ekranie :wink:

Jakby jeszcze w arkuszu były współrzędne w formacie WGS84 można by łatwo zaimportować dane przy użyciu Level0.

Orginalne dane są dostępne w pliku shp oczywiście w wgs84 na stronie CRFOP, próbka jest po to by dobrze dobrać klucze i wartości raczej imoport poleci, ale trzeba najpierw dobrze obrobić dane :wink:

Tutaj plik z podpiętymi kluczami i wartościami do sprawdzenia:
Arkusz google

Czekam na uwagii.

Myślę, że trzeba będzie wrzucać dla każdego klucza natural osobno.

no i jeszcze uwagii:

1.Numery gid i inspire muszą być dopisane w celach identyfikacji
2. co z nazwami drzew w objekcie - patrz Uroczysko Barcice? na to nie mam pomysłu.