Эстония

Нет, меркартор ничего не собирает. Посмотрел код, у маамета этот слой тоже идёт отдельной опцией:

  <Layer>
    <Name>MA-KAART</Name>
    <Title>Maa-ameti kaardimaterjal</Title>

Но, при желании можно и собрать.
hoone - контур здания
ads_hoone_nr - номер здания
и т.д.

Надо перевести на русский или английский. Поможешь?

Ну, может вот это кому поможет.

Распознанный эстонский текст (могут быть ошибки распознавания некоторых символов - их можно легко обнаружить, если загнать текст в Гугловый переводчик и почитать результат - некоторые я таким образом уже исправил).
http://kak-sam.to/~alex/osm/Maa-amet_vastus_OSM2.rtf

Гугло-перевод на английский (нуждается в редактуре):
http://kak-sam.to/~alex/osm/Translated_version_of_Maa-amet_vastus_OSM2.rtf.html

Ну, загнать текст в гугл - это не лучшая идея :slight_smile: Если перевести им на русский, на выходе будет такое:

“земля-офисные услуги” :smiley:

Нужно понимать, что перевод Гуглом на английский и перевод на русский - это две большие разницы по качеству.
Я незнакомые языки перевожу исключительно на английский, и в этом есть смысл.

И второе - перевод Гугла на английский был дан исключительно для ознакомления и поиска смысловых ошибок из-за неверно распознанных эстонских букв (например я по эстонски вообще не слова не понимаю, но с помощью перевода гугла на английский исправил штук пять ошибок OCR).

Суть - в распознанном (а не растровом) эстонском тексте.

Похоже, некудышный из меня переводчик.

Почему? Очень похоже на правду :slight_smile:

Хотелось как можно меньше отсебятины, и как можно более приближенно к оригиналу, вот и вышел текст не совсем русский. Может, дело в самокритике, и на деле не все так плохо :slight_smile:

Скачал базу адресов. Осталось подумать, что из этого импортировать.

ADOB_ID - версия(?)
ADS_OID - [недокументировано] какие-то коды… EE00636588, CU00455640, ME02766599
ADOB_LIIK - [недокументировано] какие-то коды… EE, CU, ME
ORIG_TUNNUS - “идентификатор объекта в оригинальном регистре”(?)
ETAK_ID - идентификатор в ETAK системе
ADS_KEHTIV - дата, с которой адрес действует
OLEK - статус (“действующий” или “в ожидании”(?))
ADR_ID - [недокументировано] ещё какой-то ID
KOODAADRESS - какой-то шифрованный код вида 377840387000003WY00001SGM00000000
TAISAADRESS - полный адрес (Harju maakond, Tallinna linn, Lasnamдe linnaosa, Paekaare tn 22)
LAHIAADRESS - короткий адрес (Paekaare tn 22)
AADR_OLEK - состояние адреса (K - ok, остальные не берём)
VIITEPUNKT_X - координаты
VIITEPUNKT_Y - координаты

дальше идут адреса, разбитые на уровни

для городов вроде понятно:

1 - уезд (Harju maakond)
2 - город (Tallinna linn)
3 - район (Lasnamäe linnaosa)
4 -
5 - улица
6 -
7 - номер здания

для деревень не очень… их не буду трогать

1 - уезд (Harju maakond)
2 - волость (Keila vald)
3 - деревня (Laulasmaa küla)
4 -
5 -
6 - просто названия (wtf?)
7 -

Я смотрю, они отличаются только самим словом “улица” :slight_smile: Полезность от tänav вместо tn сомнительна (а скорее даже вредна).

tänav → tn, maantee → mnt, puiestee → pst, …
А главное,


Anton Starkopfi tänav -> A. Starkopfi tn
Carl Robert Jakobsoni tänav -> C. R. Jakobsoni tn
Ferdinand Gustav Adoffi tänav -> F. G. Adoffi tn

Пробежался по базе и вот что нашел:


Jakob Liivi tänav -> J. Liivi tn
Juhan Liivi tänav -> J. Liivi tn

Какого? 2 разных наименования, но из-за сокращения пишутся одинаково

Т.е.


1 - Уезд
2 - Cамоуправление (город/волость)
3 - Часть города/поселок/деревня
4 - "небольшое место" летние котеджи/садоводческие товарищества
5 - дорога
6 - наименовение (в этом случае адресный номер должен отсутствовать, т.е. addr:name)
7 - адресный номер
8 - номер квартиры

Я бы предпочёл в навигаторе увидеть C. R. Jakobsoni tn, чем Carl Robert Jakobsoni tänav (интересно, а как жители этой улицы сами её произносят? наверное просто Jakobsoni :slight_smile: ).
К тому же, второе наверняка не поместится в навигаторах, и будет обрезано как попало, что ещё хуже.

PS. А вообще, надо посмотреть, как сама улица на карте названа.

PPS. Мы всё же привыкли видеть tn и mnt, так пишется на табличках, в справочниках, и вообще везде.

ИМХО, сокращения - дело стороннего софта. Мы же базу наполняем, а не под навигатор значения пишем. Сократить всегда можно, а вернуть J. Liivi tn полное название уже не удасться

В OSM принято обозначение без сокращений. Любители сокращений норвеги и шведы и то пишут полностью gata/gaten вместо gt/gtn и veien вместо vn.

Информация:
С того момента, как появилась возможность открыть JOSM, я режу каждый слипшийся дом, вместо его пометки “!”.
(при этом режу и те, что в редакторе оказались рядом с ним).
Рассчитываю, что через сутки порезанные домики поступят в общий пул скрипта.
(по статистике, сейчас резать нужно примерно каждую 15-ю выдачу скрипта).

Так вот, за последние сутки я получил дважды выдачу, которая для скрипта выглядела контуром, который нуждается в порезке, хотя на самом деле, я ее уже разрезал ранее.
На самом деле, проблемы я здесь пока не увидел, поскольку, судя по истории в базе OSM, я это разрезал менее суток назад, и скрипт имеет право еще быть не в курсе.

Пишу же об этом затем, чтобы обратить внимание на важность периодической синхронизации пула домов скрипта с базой OSM - не реже раза в сутки.
Ну, пока нет фактов, что это не так.

==
Ну и дополнительно, подметил, что в Эстонии бывает еще и вот так. (на картинке это я дома порезал - изначально точки с адресом были накиданы в один контур дома).
Не знаю, учитываются ли такие ситуации скриптом.

А почему 78.153.131.* (Москва) не признается, кто он есть?

Коли домики порезаны, может стоит и адреса кинуть на них? Задачка то значительно проще порезки домов. Ctrl + C, Ctrl + Shift + V. Некоему kaupov, видимо, лень было домики резать.
PS: по области на скрине прошелся и перенес адреса на домики

Не знаю :slight_smile:

Судя по тому, что написано у gis-lab:

Где-то к 10:17 у них файл готов.
Значит, отставание может составить минимум 1 сутки + 4 часа + моё время на импорт.

А слово “улица” вообще надо писать? Ведь сам тег и так называется addr:street. Получается “масло маслянное”, не? :roll_eyes:
(я с OSM разбираться начал относительно недавно, так что не вкурсе)

Предлагаешь импортировать весь набор?
Опять же, об избыточности данных - вроде и так ясно, в каком городе здание, надо ли каждому зданию это повторять?
(если это кому-то полезно, то без проблем, но полезно ли? или будет лишним мусором в базе?)