Валідатор назв вулиць

Ну так давайте відділимо сутність табличка від сутності адреса. Це різні речі і відповідно у них мають бути різні теги.

Адреса це пілгон у площині. Не може бути підвал з одною адресою, перший поверх з іншою, а другий ще з іншою. Відділити одну кімнату можна запросто і не обовязково по діагоналі. Приклад: периметрально-компактна забудова історичних центрів, де будинки склеїні стіна до стіни. Ми ж їх якось розділяємо. Або ж приватні будинки, які поділені на 2 частини. Фізично один будинок, але розділений стіною на дві адреси.

Прикольно.
olezh, OpenStreetMap запустив в дію якийсь спільний ментальний канал, до якого певні OSM-ери залогінились автоматично? :slight_smile:

У нашому Гондурасі усе можливо :slight_smile:

Давайте на конкретних прикладах.
http://maps.yandex.ua/-/CVuNASPB
http://www.openstreetmap.org/browse/way/95329188
Це кутовий будинок, має декілька входів - один з одного боку вулиці в музей, інший - з іншого боку вулиці в держустанову.
У музею і у держустанови окремі абсолютно різні адреси, але це один будинок.
Що ви пропонуєте з цим робити? Так як там замаплено - це найпростіші можливі “костилі”

Розділити будинок на два по стіні, що розділяє ці установи.

Такої стіни може і не існувати. Ось ще приклад
http://maps.yandex.ua/-/CVuNzW~p
http://www.openstreetmap.org/browse/way/37068811
Магазин “Врода” на куті має адресу Головна 67
http://b2btoday.com.ua/id/2717569
Займає тільки перший поверх.
Аптека з боку вулиці Кохановського має адресу Кохановського 2
http://citi.cv.ua/165.php?p=2
Вхід в квартири будинку(2й поверх і вище по всій площині) знаходиться з боку вулиці Кохановського, квартири мають адресу Кохановського 2
http://maps.yandex.ua/-/CVuN7Qya
http://www.cvk.gov.ua/vnd2012/wp029pt001f01=900pid100=73pf7331=201.html

(буд №67 пропущено, бо за адресою Головна 67 ніхто не приписаний)

Тому й логічно будинку надати адресу Кохановського 2, а іншим входам в цей будинок - адресу Головна 67
(хоча Larry0ua зробив навпаки :slight_smile: )

Фізичні помилки в адресації звичайно існують. І не лише в Чернівцях. Але у цьому конкретному випадку нам також нічого не заважає замість точки поставити полігон, що обмежує магазин в середині самого будинку Кохановського 2.

Навіть в цьому випадку, погодся, полігон більш точно описує два обєкти. Відразу було б видно, де основний будинок, а де магазин, і що у них різні адреси. Чим краща точка чи підпис у яндекса 2,67 особисто мене не дуже зрозуміло. OSM всеодно не дозволяє мапити в 3D і проставляти різну адресацію на різні поверхи. Хоча як варіант можна ввести додатковий тег, який би говорив, що це якась фігня з адресацією і різними поверхами.

блін, в НП багато назв не транслітеровані. Вручну пальці задимляться. Запросити б бота :wink:
Ще попадають варіанти коли прізвище назви вулиці транслітероване а з часом ім’я додалось в name, а name:en залишається незмінним.
Якийсь інструмент можна пришити до валідатора?

якщо до кожної адреси так підходити, можна з розуму зійти :slight_smile:
моя думка не міняється - адреса на точці має бути еквівалентна адресі на полігоні.

а якщо ми тут говорим про те, що точками мапити невірно - то, швидше за все, це вірна думка, але в більшості випадків у нас нема вибору. вважайте точки недоробленими полігонами, бо щоб з кожної такої точки зробити полігон, потрібно провести досить велике дослідження з обходом будинку, опитуванням мешканців.

Можливо й точніше було б вносити всі дані полігонами, але ніхто цього не робить.
Не маю точної статистики, але думаю що десь 95% існуючих POI задано точками.

Ігноруючи точки з адресами втрачається досить таки багато адресної інформації.
Можна вважати, що точка - це усереднений полігон. Чим вона гірша за полігон в контексті адресації?

Так зараз мова йде не про POI, а адресовані будівлі. Який відсоток з них мають подвійну адресацію через точки? Назву точну цифру сьогодні-завтра, але думається що % мізерний.

Ідея в тому, аби не робити будинок чи частину будинку точкою, нехай точками лишаються тільки POI (адже їх дійсно багацько), які б наслідували адресацію у батьківського полігону адресної ділянки. Давайте, зробимо наступним чином: якщо точкових адрес на територіях з супутниковим покриттям буде не більше 500 будемо вважати це за помилку і переведемо їх в полігональну геометрію, ок?

не знаю, як швидко виділити місця без супутникового покриття, але на Україні точок з addr:housenumber, без tourism, amenity, shop, office, building, leisure в мене получилось більше 6000. В будь-якому випадку, я не знаю, як переводити на полігональну геометрію всі ці точки, і проти поділу їх “наобум”

olehz, чето перестал работать валидатор… :frowning:

Это работа не для бота.
Простая транслитерация может быть осуществлена конечной программой, и с этой точки зрения ниличие транслитерации в базе не нужно.
С другой стороны, простая транслитерация зачастую приводит к ошибкам, а наличие ошибок в базе - безусловное зло.
Т.о. автоматическая транслитерация, в зависимости от конкреиного случая может оказаться от совершенно бесполезнной до принципиально вредной.
Пользы от нее даже в самом благоприятном случае получить не удастся.
Пример сложностей при транслитерации:
Красная площадь (Москва) - Reg Square
Красная площадь (Переславль Залесский) - Krasnaya Square

Вообще-то это обычный объем работы для занесения в базу достоверных данных.
И говорить, что “нет выбора”… В общем, если другими способами получить достоверную информацию невозможно, то выбора, действительно, нет: обойти здание со всех сторон, сфотографировать таблички, опросить жителей.
Лично я такую работу проводил. И мне кажется, что если нет желания этим заниматься, то лучше и не мапить. Лучше отсутствие информации, чем дезинформация.

Транслітерація апріорі не може призвести до помилок. Не треба змішувати поняття перекладу і транслітерації, яка покликана правильно озвучити автентичну назву якомога більшою кількістю мов (а не одною, нехай і дуже поширеною). Читаємо дуже актуальну і правильну статтю: Белорусские названия на латинице: более компетентны ученые или «знакомая американка»?.., актуальну не лише для Білорусі.

Вы ошибаетесь:
На территории бывшего СССР (local.osm с gis-lab.info)
1 581 659 адресов для полигонов,
84 342 адресов для точек.
Итого, не 95%, а лишь 5% задано точками, остальные - 95% полигонами.

5%

Собственно, лично я у себя все равно полигоны с адресами превращаю в точки с адресами, так что мне вообще без разницы - точка имеет адрес или полигон. Но это все равно некоторая потеря информации. Другое дело, что для своего приложения я такую потерю считаю оправданной. А для других приложений это может быть не так.

Вот именно.
Транслитерация может и, нередко, приводит к ошибочному значению в поле name:en.
Именно потому, что транслитерация и перевод - разные понятия.

А статья очень интересная. Еще один повод позавидовать белорусам. Хотя сами они и считают, что у них еще далеко не все в порядке, но хоть есть на что опереться на официально-государственном уровне.

IMHO, раз уж тег называется name:en, то и его значение должно быть на английском. То есть так, как бы записал его англичанин “на слух”.
И вроде бы в Украине правила транслитерации так и составлены. Без всяких там диакритических знаков.

мы точно о POI говорим? или про адреса?

осторожнее с желаниями, кто-то может воспринять всерьез :wink: неполная информация != дезинформация.