КОАТУУ та інші бази по Україні

Ну я же написал выше, с сайта Верховной Рады. С Википедии я буду брать только высоту над уровнем моря, которая в свою очередь, взята с сайта украинского гидрометцентра. Раз лень поискать на форуме про ВР, вот пример. Там есть и население. и индекс, и административное деление.

По поводу сайта переписи. Особо не искал, можешь объяснить, как увидеть на экране название какого-нибудь населенного пункта на трёх языках?

Eugene

раз есть точный и более полный источник - хорошо :slight_smile:
прошу прощения за мою небольшую лень :wink:

там на этом сайте чёрт ногу сломит
еле нашел второй раз
вот как-то так

Не особо подходит – проблема в строчке “інші сільські населені пункти”. Т.е. снова неполное покрытие. Хотя, как будет закончен проект с загрузкой с ВР, можно подумать и про эти данные. Ценность тут представляет перевод с украинского на русский. Население есть на ВР, английский получается из украинского.

Eugene

Після заверешення проекту по вивантаженню nadoloni.com, поновив роботу над проектом. Також обговорив з Zverik та dezhin. dezhin буде прикручувати свій валідатор. Але обидва говорять про те, що не варто вивантажувати атоматично дані, і що теґ code:koatuu взагалі зайвий. Що скажете? На мою думку це внесе безперечну однозначність і дозволить далі вже підтримувати за допомогую валідаторів.

Пвру днів займався тим, що виправляв КОАТУУ у Вікіпедії. Планую також додати посилання на неї у всіх точках НП.

Тож зараз планується вивантажити наступну інформацію: КОАТУУ, площа, населення, стаття на Вікіпедію, індекс, код телефону, російська назва.

Далі, помітити ті НП, яких було усунено як place=abandoned, або щось подібне, далі розберуся.

На основі даних встановити admin_level, але для цього нам потрібно ще узгодити правила поділення.

До тих НП, назви яких співпадають у рамках одної сільради, додати статусну частину. Частіше за все це село або селище. Приклад: Губник, Гайсинський район, є і село і селище.

То що скажете, вивантажувати, чи тільки будувати валідатор?

Eugene

Тег потрібен! Не знаю, як вірніше, code:koatuu=* або просто koatuu=. Американці для своєї БД застосовують теги tiger:name_base= або tiger:name_type=, tiger:source= і т.д. В цих тегах міститься інформація про приналежність до районів, джерело імпорту, перевірку достовірності користувачами і багато іншого. Для України можна теж розробити подібну схему.

Підтримую майже всі вищенаведені заходи :wink:

Я проти того, щоб перейменовувати (обтяжувати додатковою інформацією) населені пункти: не варто дописувати приналежність до району в назву. Для цього є інші теги. А пошукові машини за ними мають вирізняти однойменні населені пункти. В найгірших випадках назва з районом затулить власне мапу цього селища.

Ні, я мав на увазі у випадку вище писати не район (він той самий), а “Губник село” та “Губник селище”. Район я писав, бо може комусь цікаво буде подивитись. І писати таке лише у випадку повного співпадіння назви у НП, які належать до тої самої сільради. Таких випадків небагато, але є.

Eugene

Зрозумів, особисто не заперечую.

Виникла ідея. А що як нам використати дані з сайтів і створити БД по мережевих торговельних закладах, відділеннях пошти, банкоматах і тп? Назви, адреси були б в єдиному, зручному для пошуку форматі. Чи може об’єднувати мережу в relation?!

Я на ті бази постійно задивляюся, але поки не закінчено адресацію у кожному конкретному місті, ними користуватися тяжко. А так, щоб їх зібрати докупи… Вже робилося таке, наприклад, http://gdebankomat.com

А об’єднувати мережу в relation не треба, і навіть взагалі, шкідливо. Причина в тому, що їх обробка накладає серйозне навантаження на БД, тому і в оприділенні англійською пишеться, що це “об’єкти, які поєднані гегорафічно (прилеглі або дотичні)”, і до того ж “Відношення – це не категорії”. Докладніше тут: http://wiki.openstreetmap.org/wiki/Relations/Relations_are_not_Categories

Eugene

Думаю, що це зайве.Нехай буде просто “Губник” і там і там.
Різні значення в admin_level визначатимуть де село а де селище.

Я бачу, процес пішов?
http://www.openstreetmap.org/browse/changeset/9197774
http://www.openstreetmap.org/browse/changeset/9200599

Супер. Дуже потрібна робота, давно мріяв про таке. Звідки дані?

Так, надоїло дивитися на порожню мапу. І друга ціль – переаіряти валідатором, тож хотів пізніше писати окремий пост.

Допомога потрібна. Продовжимо тут.

Eugene

Сьогодні планую вивантажити КОАТУУ та населення для 90% НП в Україні. Також там будуть name:ru, name:en та індекси.

У зв’язку з цим з’являється можливість правильно призначити статус НП. Тож постає питання, за якими правилами ми будемо призначати city, town, village та hamlet.

Я пропоную наступне:

  • 100,000 city

  • 10,000-99,999 town

  • <9,999 village

Від hamlet пропоную взагалі відмовитися на території країни.

Альтернатива – якимось чином використовувати офіційну класифікацію Смт, село, селище. До речі, в нас зараз різницю між цими трьма видами НП ніяк не відображено. Будемо щось робити у цьому напрямку?

може так:

100,000 city
місто, смт - town
село - village
селище - hamlet

деякі точки чомусь залишилися без КОАТУУ
http://www.openstreetmap.org/browse/node/337698994
http://www.openstreetmap.org/browse/node/337519248

а для районів не плануєш заповнити КОАТУУ?

Я поки що зробив тільки перший етап – взяв інформацію з Вікіпедії. Там біля 4 тисяч НП не мають КОАТУУ. Другий етап, вже на підставі геоданих призначити КОАТУУ для решти. Третій – розробка процедури поновлення інформації на підставі сайту Верховної Ради.

_sev

А значення place зараз змінювалося? А то помітив, що, наприклад, Великі Лучки як були town, так і залишилися, хоча і на вікі, і в КОАТУУ значаться як село.

Ні, не змінювалися, бо без спільного рішення я чіпати не хочу.

Допроставив КОАТУУ для більшості НП України окрім Криму. Лишилось ще трішки. Для перевірки наваляв КОАТУУ-чекер. На поточний момент маємо:

  1. закинуті села та інші місцевості, котрі вимагають ручної перевірки. Для них слід поміняти тег place (+опціонально abandoned=yes - Зона відчуження / Мертві села)
  2. деякі name в OSM не співпадають з name в КОАТУУ
  3. в OSM відсутні села, які присутні в КОАТУУ
  4. в OSM лишні села, які не присутні в КОАТУУ

Коли усі НП матимуть проставлені КОАТУУ, можна було б перевірити чи правильно проставлені їх координати та адмінкордонити батьківських (рад, районів)

  • я хочу проставити name:prefix для усіх НП згідно КОАТУУ аби відмежувати селища від смт., сіл та міст

І ще маю питання відносно place=village та place=hamlet. В яких випадках як тегувати?

place=village были понатыканы повсюду в приснопамятные времена (это был импорт?) и очень смешно теперь смотрелись для population=4.
Поскольку теперь-то population доступен можно бы и проставить place=hamlet, что я и пытался делать. Правда где-то обратно причесали под какой-то автомат (https://www.openstreetmap.org/changeset/22167837).
Как минимум для population<50 place=village смотрится слишком вопиюще.
Каковы более точные условия можно обсуждать долго.
тут ориентировочная граница - 100-200 человек
тут - 100 человек и не является центром сельского поселения.

Из того, что я менял (population<50), ничего не являлось центром сельрады.

С границами районов действительно местами непонятки. Некоторые НП убегают в соседний район
http://wowik.freevar.com/places/ua-test/5121283600.htm

Про мертвые НП есть place=locality, а чтобы отличать от всяких прочих урочищ, балок и т.п. предлагался was:place

Ок, т.е. все что population <=200 - hamlet

Как мапить мертвые села - тема отдельного холивара. В текущем контексте таких объектов еще относительно много и они требуют изменения тега place=locality, это да

P.S. на счет твоего валидатора. По Украине что-то слегка не так. Например, для Львовской области, по моим данным (я не учитываю опечатки в КОАТУУ - названия берутся с сайта Верхвной Рады):

3 - НП конфликтую с границами районов/сельских рад,
1 - не хватет
0 - лишних

У твоего же валидатора совсем дургие данные… Правда, на текущий момент я полигональную геометрию не учитываю (только точки)