Эстония

Ну, может вот это кому поможет.

Распознанный эстонский текст (могут быть ошибки распознавания некоторых символов - их можно легко обнаружить, если загнать текст в Гугловый переводчик и почитать результат - некоторые я таким образом уже исправил).
http://kak-sam.to/~alex/osm/Maa-amet_vastus_OSM2.rtf

Гугло-перевод на английский (нуждается в редактуре):
http://kak-sam.to/~alex/osm/Translated_version_of_Maa-amet_vastus_OSM2.rtf.html

Ну, загнать текст в гугл - это не лучшая идея :slight_smile: Если перевести им на русский, на выходе будет такое:

“земля-офисные услуги” :smiley:

Нужно понимать, что перевод Гуглом на английский и перевод на русский - это две большие разницы по качеству.
Я незнакомые языки перевожу исключительно на английский, и в этом есть смысл.

И второе - перевод Гугла на английский был дан исключительно для ознакомления и поиска смысловых ошибок из-за неверно распознанных эстонских букв (например я по эстонски вообще не слова не понимаю, но с помощью перевода гугла на английский исправил штук пять ошибок OCR).

Суть - в распознанном (а не растровом) эстонском тексте.

Похоже, некудышный из меня переводчик.

Почему? Очень похоже на правду :slight_smile:

Хотелось как можно меньше отсебятины, и как можно более приближенно к оригиналу, вот и вышел текст не совсем русский. Может, дело в самокритике, и на деле не все так плохо :slight_smile:

Скачал базу адресов. Осталось подумать, что из этого импортировать.

ADOB_ID - версия(?)
ADS_OID - [недокументировано] какие-то коды… EE00636588, CU00455640, ME02766599
ADOB_LIIK - [недокументировано] какие-то коды… EE, CU, ME
ORIG_TUNNUS - “идентификатор объекта в оригинальном регистре”(?)
ETAK_ID - идентификатор в ETAK системе
ADS_KEHTIV - дата, с которой адрес действует
OLEK - статус (“действующий” или “в ожидании”(?))
ADR_ID - [недокументировано] ещё какой-то ID
KOODAADRESS - какой-то шифрованный код вида 377840387000003WY00001SGM00000000
TAISAADRESS - полный адрес (Harju maakond, Tallinna linn, Lasnamдe linnaosa, Paekaare tn 22)
LAHIAADRESS - короткий адрес (Paekaare tn 22)
AADR_OLEK - состояние адреса (K - ok, остальные не берём)
VIITEPUNKT_X - координаты
VIITEPUNKT_Y - координаты

дальше идут адреса, разбитые на уровни

для городов вроде понятно:

1 - уезд (Harju maakond)
2 - город (Tallinna linn)
3 - район (Lasnamäe linnaosa)
4 -
5 - улица
6 -
7 - номер здания

для деревень не очень… их не буду трогать

1 - уезд (Harju maakond)
2 - волость (Keila vald)
3 - деревня (Laulasmaa küla)
4 -
5 -
6 - просто названия (wtf?)
7 -

Я смотрю, они отличаются только самим словом “улица” :slight_smile: Полезность от tänav вместо tn сомнительна (а скорее даже вредна).

tänav → tn, maantee → mnt, puiestee → pst, …
А главное,


Anton Starkopfi tänav -> A. Starkopfi tn
Carl Robert Jakobsoni tänav -> C. R. Jakobsoni tn
Ferdinand Gustav Adoffi tänav -> F. G. Adoffi tn

Пробежался по базе и вот что нашел:


Jakob Liivi tänav -> J. Liivi tn
Juhan Liivi tänav -> J. Liivi tn

Какого? 2 разных наименования, но из-за сокращения пишутся одинаково

Т.е.


1 - Уезд
2 - Cамоуправление (город/волость)
3 - Часть города/поселок/деревня
4 - "небольшое место" летние котеджи/садоводческие товарищества
5 - дорога
6 - наименовение (в этом случае адресный номер должен отсутствовать, т.е. addr:name)
7 - адресный номер
8 - номер квартиры

Я бы предпочёл в навигаторе увидеть C. R. Jakobsoni tn, чем Carl Robert Jakobsoni tänav (интересно, а как жители этой улицы сами её произносят? наверное просто Jakobsoni :slight_smile: ).
К тому же, второе наверняка не поместится в навигаторах, и будет обрезано как попало, что ещё хуже.

PS. А вообще, надо посмотреть, как сама улица на карте названа.

PPS. Мы всё же привыкли видеть tn и mnt, так пишется на табличках, в справочниках, и вообще везде.

ИМХО, сокращения - дело стороннего софта. Мы же базу наполняем, а не под навигатор значения пишем. Сократить всегда можно, а вернуть J. Liivi tn полное название уже не удасться

В OSM принято обозначение без сокращений. Любители сокращений норвеги и шведы и то пишут полностью gata/gaten вместо gt/gtn и veien вместо vn.

Информация:
С того момента, как появилась возможность открыть JOSM, я режу каждый слипшийся дом, вместо его пометки “!”.
(при этом режу и те, что в редакторе оказались рядом с ним).
Рассчитываю, что через сутки порезанные домики поступят в общий пул скрипта.
(по статистике, сейчас резать нужно примерно каждую 15-ю выдачу скрипта).

Так вот, за последние сутки я получил дважды выдачу, которая для скрипта выглядела контуром, который нуждается в порезке, хотя на самом деле, я ее уже разрезал ранее.
На самом деле, проблемы я здесь пока не увидел, поскольку, судя по истории в базе OSM, я это разрезал менее суток назад, и скрипт имеет право еще быть не в курсе.

Пишу же об этом затем, чтобы обратить внимание на важность периодической синхронизации пула домов скрипта с базой OSM - не реже раза в сутки.
Ну, пока нет фактов, что это не так.

==
Ну и дополнительно, подметил, что в Эстонии бывает еще и вот так. (на картинке это я дома порезал - изначально точки с адресом были накиданы в один контур дома).
Не знаю, учитываются ли такие ситуации скриптом.

А почему 78.153.131.* (Москва) не признается, кто он есть?

Коли домики порезаны, может стоит и адреса кинуть на них? Задачка то значительно проще порезки домов. Ctrl + C, Ctrl + Shift + V. Некоему kaupov, видимо, лень было домики резать.
PS: по области на скрине прошелся и перенес адреса на домики

Не знаю :slight_smile:

Судя по тому, что написано у gis-lab:

Где-то к 10:17 у них файл готов.
Значит, отставание может составить минимум 1 сутки + 4 часа + моё время на импорт.

А слово “улица” вообще надо писать? Ведь сам тег и так называется addr:street. Получается “масло маслянное”, не? :roll_eyes:
(я с OSM разбираться начал относительно недавно, так что не вкурсе)

Предлагаешь импортировать весь набор?
Опять же, об избыточности данных - вроде и так ясно, в каком городе здание, надо ли каждому зданию это повторять?
(если это кому-то полезно, то без проблем, но полезно ли? или будет лишним мусором в базе?)

Не, тут дело такое:
я в EE регионе - чужой, и ихних правил маппинга - не знаю.
Я вижу, что есть некоторые отличия с тем, как мы делаем в России, но полностью изучать все гласные и негласные правила у меня ни времени, ни желания, нет.
Поэтому я стараюсь вносить как можно меньше необязательных изменений.
Нужно было порезать дома - я порезал.
Где было просто внести адреса на порезанные дома - я кое-где так сделал (но сейчас я уже склоняюсь к тому, что лучше я буду просто резать, а адреса будет вносить скрипт, поскольку вижу, что желающих проставлять номера домов на порезанные контуры - примерно в 15 раз больше, чем тех, кто их готов порезать).

Но вот так, чтобы изменять одну схему адресации (через точку внутри контура дома) на другую (адрес на контуре дома) - пусть это лучше делают местные.
Чтобы мне не отвечать за вандализм на чужой территории.
Поэтому, я совершенно сознательно не меняю уже существующую систему адресации.
А о том, что есть такие вот отклонения - просто предупреждаю.

Не, я лишь расписал значения уровней. Хотя, для каких-то схем адресации рекомендовалось добавлять addr:place. Обязательные поля addr:housenumber, addr:street или addr:name (номер и улица в этом случае отсутствуют).

addr:street - тип значения, указывающий на дорогу, по которой идет адресация. Улица в названии дороги - ее статус, не проспект или шоссе, а именно улица. Я бы оставил. При конвертации в навигационный софт, если мешает, выкинуть всегда можно. Можно с легкостью составить файлик замен полные → сокращенные названия улиц и кормить его конвертерам, файлик всего-то 82Kb.