Списки населенных мест с валидацией границ и адресов

Да вот есть улицы в наших селеньях.

Такой вопрос. О переименованых нас. пунктах. Находишь по валидатору нас. пункт. Наносишь его. А потом находишь ссылку на офф документ, где говорится что нас. пункт переменован. Соответственно переносишь старое в old_name, и даешь новое название.
Конечно валидатор тут же это как ошибку указывает.
Вот и вопрос. Что важнее- ссылка в КАТО и или ссылка на офф документ. И как избежать как избежать таких коллизий? Каждый раз поправлять валидатор в соответствии с офф документами?
Все таки хочется что бы процент правильно нанесенных нас пунктов стремился к 100 процентам в валидаторе

Мапинг по валидатор детектед, КАТО и прочее всего лишь сборник, а первоисточник НПА. Так что пусть валидатор дальше ругается.

:slight_smile:
Ну я то знаю что вылидатор просто хороший инструмент. Только все таки слегка напрягает когда знаешь что ты сделал на 100 правильно, а валидаторе ошибка

КАТО у меня год не обновлялся. Позавчера попробовал скачать новый, а там файлы не загружаются.
https://stat.gov.kz/faces/classificatorsPage
Написали им об ошибке. Сейчас попробовал - загружает, может помогло их пинание.

P.S. Обновил КАТО (октябрь 2017), выложил http://wowik.000space.com/places/kz/

P.P.S. Забыл заменить латинские буквы
H->Н (327 штук), c->с (8 штук), a->а (1 штука), C->С (1 штука), A->А (1 штука)

P.P.P.S. Перевыложил

Тут возник вопрос.
Я наношу сельские округа, поселковые администрации и т.д. как в валидаторе -с.о. п.а и так далее.
Но. Тут некоторые мапперы против сокращенний. Вообще то они и мне не нравятся.

Итак - можно сделать чтобы валидатор считал к примеру сельский округ и с.о равнозначным? :sunglasses:
Ну и все остальные сокращения также. Их ведь ограниченное количество.

Да в КАТО они с сокращениями. Но это просто формальный документ. Руководство к поиску данных.
В реальном адресе все таки сокращений нужно избегать.
Но так как их уже нанесено много, что бы не мучится, то хотелось бы такое дополнение. И то и это считать правильным.
Может быть сокращение как то отмечать. Цветом например. Чтобы было видно где сокращение а где нет. Чтобы потом если что можно было поправить.
Причем полное название чтобы было приоритетным и было видно в валидаторе

В общем - такое реально? :wink:

не надо такое делать, сокращениям не место в имени.

Но приходится, такова сложившаяся практика в Казахстане.
Валидатор просто ее придерживается.
Если начать разнобой, то будет хуже, так как увидев разные варианты начнут менять туда-сюда.
К тому же, насколько я смотрю по сайтам, эти сокращения очень распространены и используются в документах.
Могу попробовать длинные имена красить желтеньким, как бы warning, а не error, но с другой стороны, если name на совпадает с тем, что указано в addr:*, то конверторы не найдут куда приклеить дочерний объект, тут важна еще согласованность.

У меня нет уверенности, что надо сейчас все имена по стране раскрыть, включая addr:* .
Я считаю, что их бы хоть внести таки все правильно и однообразно, а уж потом причесать по-другому не долго.
Но тут мнение других мапперов по Казахстану нужно.

Но мы что-то не в той ветке. Лучше в этой:
https://forum.openstreetmap.org/viewtopic.php?id=24740

Как я понимаю: вопрос с КАТО и сокращениями затронет только Казахстан. В случае с сельским округом: 2453 сельский округа переименовать при 100% наличии на карте, задача посильная, а при смекалке так вообще простая. :smiley:

  1. Скачиваем через Overpass в JOSM всё в пределах Казахстана с ключём addr:subdistrict=*, сохраняем проект как имя.osm.
    По сути мы получили XML на 20 мегабайт (только что скачал всё по Казастану с этим ключом)
  2. Открываем в текстовом редакторе наш XML и функцией заменить меняем “с.о.” на “сельский округ” и что там ещё надо будет, сохраняем.
  3. Загружаем наш XML аля имя.osm в JOSM, проверяем методом тыка, что всё получилось и отправляем на загрузку.
  4. Сидим ждём пока по факту 4418 объект загрузится. :sunglasses:

Причесать проект надо будет и можно отправлять, если хотите.
Встречаются “с о” “с. о” “с.о” “сел ок” и прочее такое…валидатор заработает спокойно с.о–>сельский округ, а после приведения в порядок статусной части — появиться в валидаторе много нового. :smiley:
А дальше можно и остальным заняться. :sunglasses:

Углегорский район теперь округ (документ)

Kuritsyn Roman, преобразовать “c.о.” в “сельский округ” не проблема, это работа определенной степени нудности “и усё”.

проблема в том чтобы все вносившие/редактировавшие согласились с подобным изменением и впоследствии не было “войны правок”. плюс дополнить определяющие статьи в вики чтобы в дальнешйем не было новых с.о.

Какая война правок? Один раз сделать одинаково по стране (ранее я уже рассказал как) и подправить валидатор.

А для избежания новых с.о. надо смотреть в WIKI.
Есть в вики статья “Названия”, где прямо в заголовке написано и жирным выделено “Сокращения и аббревиатуры (не используйте их)”. Куда уж понятней.

Почему у меня такой проблемы не было?!

Надо с умом с базы брать данные. Я сюда попал как раз из-за с.о., так как один пользователь по примеру других мапил и переправлял с сельского округа на с.о., чтоб валидатор кушал правильно данные. Меня это не устраивает - мапинг под валидатор.

Сначала в маны - потом в карты.

В связи с тем что активных мапперов в Казахстане, скажем та не очень много, то переговорить с каждым вполне возможно.
И к то тому же я пока заметил что все эти с.о. и п.а Вносили в основном chnav и iwowik, ну и я в последнее время.
Остальных что то я не заметил, которых озадачивает наличие в адресе сельских округов и поселковых администраций.

И предполагаю что все сокращения вносились по валидатору. То есть поправить валидатор и возможно что больше уже никто не будет пользоваться сокращениями.
Ну можно пару строк в вики тиснуть в статью про нанесение адресов, хотя там и так написано о нежелательности сокращений.

Сам процесс удаления сокращений по всему Казахстану займет минут 30-40.
Я даже запрос через Overpass подготовил, скачал все объекты с сокращениями, заменил все объекты с сокрашениями.
Можно было даже залить. Но валидатор тут же скажет что туча ошибок.

Так что можно вообще удалить из валидатора сокращения.
Пускай будут только полные названия, те которые он пишет после “нас.пункты found”
А все остальное будет ошибкой.

Я в своё время идентифицировал и нашел на карте сотни, если не тысячи, населенных пунктов (Костанайская, Кызылординская, Жамбылская, Южно-Казахстанская), многие были переименованы, многие имеют двойников в соседних районах и т.д. Месяцы работы. Я отмечал эти населенные пункты у себя в Excel-табличке, но валидатор делает это нагляднее и сильно помогает систематизировать информацию.

Если бы была возможность сделать в валидаторе равнозначными “с.о.” и “сельский округ” то и вопросов бы не было.

Я лично неспособен сделать валидатор, поэтому завишу от доброй воли Вовика. Если прямо сейчас поменять все с.о. на “сельский округ” то, например, в ВКО навсегда останутся непроверенными/невнесенными 1.5 тысячи НП. “Правда” останется за вики, но карта будет пустая.

“непроверенными/невнесенными” где, в валидаторе или у вас в табличке?

Мы как раз тут и ведём разговор о совместной правке на карте и в валидаторе, которая затрагивает одно сокращение, чтоб никому не навредить.* Хотел бы я навредить: сделал бы правки по избавлению от сокращений, навернулись бы валидаторы и попробуй потом придумать обоснование для отката. Карта корректна, а что чей-то валидатор неправильно кушает данные — это проблема валидатора.* Но, мы тут и ведём диалог, чтоб все рады были.

А в чём проблема с вашей таблицей? ID точек и линий остаётся тот же, что и был, только меняется системно с “с.о.” на “сельский округ”. Вы так же можете поменять у себя в таблице.
Статусные части пока не трогаем типа: “г.” гора/город/грот и “п.” переулок/проспект/площадь, хотя надо бы.

Если у Вас есть правки или инфа о НП отличающееся от КАТО(устарел/ошибка/etc) — я думаю мы все будем благодарны и Вовик добавит данные в валидатор, после проверки. Выкладывайте.

Проблема только в том, чтобы инициатор(ы) взял(и) на себя труд не только провернуть переименования, но и поддерживать его, отбиваясь то нападок несогласных, объясняя вопрошающим и исправляя за неразумными.
В валидаторе не долго поменять, работать с людьми дольше.

И хорошо бы иметь место, где будет как-то зафиксировано и обосновано именно это решение, чтобы туда посылать было удобно.

А вопросов ещё много.
Сокращений много.
с.о. с.а …
Все уж сразу раскрывать надо
Г.А. в начале названия раскрывать надо, а оно в конце стоит.
Степногорск Г.А.
Городской акимат Степногорск

Давайте обкатаем с одним сокращением, чтоб валидатор нормально скушал и мы убедились, что всё так как мы думаем.

Вся проблема сейчас в поддержании актуальности данных, выгрузка с КАТО раз в N лет и внесение правок с форума. Была тут где-то идея открыть код валидатора, а нет ли желания перенести базу в что-то типо гитхаба или на сам гитхаб, чтоб видеть базу, вносить комиты, а Вам останется принимать правку или отвергать, автозагрузку базы в валидатор можно наладить на раз два.

А по сути: мы что делаем этим? Вносим правки согласно правилам/рекомендациям WIKIOSM, собираемся исправить упущенное исправление базы КАТО. Можно ссылку на данную тему, что да как и почему такая правка в пределах страны. Прямо в правке писать.

В пример с КАТО: почти по всем гос. базам(таблицам на гос. сайтах) пишется так: “КГУ ОСШ” и все документы так подаются и бланки и прочее, а на деле это “Коммунальное Государственное Учреждение Общеобразовательная Средняя Школа” и таких устоявшихся сокращений великое множество, но для обычного пользователя — эти буквы ничего не говорят. Я уже пару дней пытаюсь расшифровать аббревиатуру СИП(на технических планах фабрики), здание на территории фабрики рядом с электроподстанцией, техника и оборудование на улице явно для ремонта высоковольтных электросетей, хоть выходи и спрашивай (только по пропускам).

Сейчас стоит задача: привести данные в валидаторе и на карте к единому формату записи, без сокращений, которые в КАТО, потом пройдемся по остальным базам.

Актуальность валидатора добавит много участников.

Давайте все таки сперва с addr:subdistrict разберемся.
А Г.А в addr:district пока не будем трогать. Да и их значительно меньше в названии районов.

В в addr:subdistrict
сокращений все всего то.

  1. с.о. - сельский округ
  2. с.а. - сельская администрация
  3. п.а. - поселковая администрация
    4 г.а. городская администрация, но может быть городской акимат. с этим ,думаю,придется повозится. Автоматом скорей всего не получится. Придется сперва автоматом сменить г.а. на городская администрация, а потом вручную, где надо исправить на городской акимат. Я не думаю. что работы будет много, Думаю за несколько часов исправлю так как их мало.
    5 р.а. - районная администрация