Чистка cladr тэгов

Весь - это вся база. Два или больше - её часть. Распространять нельзя ни то, ни другое.

Что значит “наша задача”? Прописывать их буду конечно не я и не ты, а тот, кому это надо, но да - эти коды должны храниться в OSM, потому что только по адресу сопоставить однозначно объекты нельзя и потому что в OSM нет постоянных id’ов (т.е. соответствие в другую сторону хранить не получится).
И да, если будет 3 десятка баз, то нужно будет прописывать 30 кодов. В идеале, конечно, только на те объекты, для которых присутствует неоднозначность.

GaM собственно если пользователи пользуются растром, им какая разница что находится в полях вектора?
а кто берет сырые данные, для последующей обработки, тот все равно лишнее удаляет.

пусть будет. мусор не мусор. а данные всегда в цене. а если зайдет о правовом решении нахождения этих данных, то пусть заинтересованная сторона пишет… куда там… кто держит сервера… там разберутся и без вас.

что вы лезете впереди паровоза? или подражаете по аналогии медведеву по запрету русских мультов? когда западные мульт.фильмы 99% нужно запретить. дабы нефиг детишек делать тупыми

Ценность невалидной информации равна нулю. Так можно и генератором случайных чисел нагенерить мусора и сказать - “данные всегда в цене, храните”. Данные в цене только когда они корректные и поддерживаются в таком состоянии. Хотя бы через использование кем-либо. А пока что тенденция однозначная - теги никем не используются и не поддерживаются и даже изначально не везде корректные данные постепенно превращаются в полный трэш. По Питеру я эти теги с улиц повыпиливал, никто особо и не заметил. Думаю можно спокойно их удалить и по всей России. Включая и cladr:code.

Sergey Astakhov лично мне данные из КЛАДР не интересны. но когда их вносили с большим энтузиазмом значит многие считали это целесообразным. так нет? получается те кто вносил тупо бестолковые люди, сори. но с выше слов так оно звучит

слово мусор не мое слово. КЛАДР все же данные. возможно в будущем или уже их кто то использует.

как вам они мешают?

п.с. такое ощущение что здесь присутствуют вселенские благодетели и законники, которые хотят сделать мир чище :smiley:

в цене валидные данные. теги “cladr” таковыми, к сожалению, не являются

я до сих пор помню, как бот брал область, находилв ней первую деревню “Ивановка” и прописывал ей теги первой попавшейся Ивановки из кладра
а потом оказывалось, что у НП, находящегося в одном районе прописаны теги адреса другого района.
и случаев таких было дофига

не хочешь - не прописывай, чужую-то работу удалять зачем? даже если не используется, оно никому не мешает. к тому же может натолкнуть кого-нибудь на новую идею.

эти теги вносил бот. никто особо не ругался по одной простой причине - на тот момент это был чуть ли не единственный (или все же единственный?) валидатор НП

Nikolya, RusFox
постарайтесь поменьше спорить в тех вопросах, о которых знаете не так много, как нужно
вы оба, судя по всему, просто не попали в тот момент в ОСМ, когда бот Кексины прописывал эти теги и люди потом сверялись по длиннющей таблице

вот, кстати, как она выглядит http://osm.tesoro-shop.ru/66000000000(свердловская%20область).htm

:smiley: сейчас придет сотрудник совета и разрулит ситуацию под … единогласным решением в лице 3 человек и 5 воздержавшихся по причине их отсутствия… выпилить данные КЛАДР :laughing:

Будьте любезны, приведите алгоритм такого сопоставления.
Автору бота за все время создания и функционирования этого бота такое не удалось.
Не удалось потому, что это достаточно сложная самостоятельная задача. И включить ее в качестве подзадачи в другой проект - практически не реально из-за огромных трудозатрат.

Кстати, (и это, пожалуй, самое важное!), из-за того, что бот не мог справиться с задачей, для исправления и дополнения базы ОСМ была проделана масса ручной работы. И выпиливать эту работу - вандализм уже безотносительный.

Тому, кто считает это глупостью, следует просто игнорировать часть имеющейся в ОСМ информации.
Это намного проще, чем пытаться создать алгоритм вродек существовавшего кладр-бота, а потом еще и проводить по полученным даннм массовую ручную правку.

В конце концов, я лично “помогал” боту найти нужную информацию и исправлял за ним ошибки, поэтому я категорически возражаю против удаления результатов своей работы из базы ОСМ (тем более, что проведенная мной работа алгоритмически не реализуема и могла быть сделана ТОЛЬКО ручками).

Не имею своего мнения насчет нужности КЛАДР, не могу судить.
Но зато могу сказать что мне оно реально мешает в процессе добавления адресной информации.

Для меня почти всегда самым удобным способом добавления адресов - является копирование тегов с соседнего дома и последующее уточнение. :sunglasses:
При этом каждый раз приходится напрягаться и внимательно следить, что бы случайно не скопировать\не переписать cladr:code и иже с ними. Что изрядно напрягает и замедляет процесс.

И еще всегда возникает два вопроса:

  • Сколько подобных неверно-скопированных КЛАДров теми участниками кто за этим не следит?
  • Некрасиво как-то, весь квартал теперь с адресами, и только часть домов с КЛАДрами.

Собственно вот. Если кладры уберут - буду доволен. :smiley:
Если оставят, ну что ж делать - надо, значит надо. Будем работать так же неудобно как раньше %)

**upd: ** Коструктивный итог мысли - если кладры оставлять, нужен хороший валидатор для них. Что бы можно было убедится что эти данные валидны. А еще желательно где-то на заметном месте объяснение - что это такое и зачем оно нужно. Что бы не смущать новичков непонятными тэгами.

Лично ты сейчас используешь cladr:* ?

у себя сам убери и все, быстрее и проще :slight_smile:

Этот классификатор как раз и предназначен для сверки и унификации адресов при занесении их в другие базы. Об этом написано в его лицензии.

У робота никаких авторских прав на результаты обработки данных нет и быть не может.

хороший способ. то есть если в секторе частных домов случайно окажется многосекционный дом, есть риск что ты проставишь этот тег на все остальные?

попали-не попали, почему-то не возникает желания от нечего делать заниматься тем, что ломать плоды чужих трудов.

еще, как минимум одно использование этого кода:
задаем поиск по улицам и некоторые улицы в результате появляются по нескольку раз. Связано с тем, что улица имеет разное покрытие на своем протяжении (или несколько полос), соответственно состоит из нескольких линий. при сворачивании по коду КЛАДР количество таких повторов уменьшается значительно.

RusFox, для сворачивания улиц есть отношение street :slight_smile:

Суть то хранить не валидные данные? С Питера за последний год куча тегов кладр исчезла и собственно ничего не происходит.
Кладр причём имеет такую массу ошибок… Я вообще не знаю трезвых людей, которые его используют. Приходилось иметь с ним дело по налоговой отчётности.

Остальные лишние теги легко удалить\исправить после копирования.
И легко заметить отличаются они или нет, т.к. они человеко-читабельные и человеко-написабельные.

А вот КЛАДР, если различался на доме-источнике и доме-куда-копирую - будет переписан и станет некорректным. Причем, что бы заметить это нужно внимательно следить за многозначными цифровыми данными.

Можно представить насколько различается процесс на “скопировал, удалил ненужное” от “посмотрел многозначную цифру на одном доме, посмотрел многозначную цифру на другом доме, убедился что они совпадают, скопировал… если не совпадают - то вообще запарился как теги быстро перенести”.

Когда час сидишь мапишь, глаза и мозг уже устали - это особенно веселое занятие )

Разруливать айдишники руками - не человеческая это работа. Роботы должны этим заниматься… а человекам в человеческом-интерфейсе такого видеть вообще не положено :sunglasses:

+100500.

Сам постоянно согласовываю данные и могу сказать что только регулярно ВАЛИДИРУЕМОЕ данные являются данными иначе это игра в “верю - не верю”. Сам для своих нужд сопоставляю ОКАТО и ОКТМО и к сожалению, расхождений хватает.

А вопрос по существу - кто в последний месяц вдумчиво проставлял КЛАДР теги? А сколько за этот месяц внесли адресов? Я проставил много адресов в последнее время но ни разу не ставил КЛАДР коды и никто другой на эти здания КЛАДР коды не поставил.

Я по их ставил на НС, буквально с неделю перестал. Сначала думал, что они полезны раз были на других объектах. Потом думал, что они нужны валидатору. А оказалось, что он на них и не смотрит, ему окато или октмо подавай и то только когда он не сопостовляет объекты.