Распознанный эстонский текст (могут быть ошибки распознавания некоторых символов - их можно легко обнаружить, если загнать текст в Гугловый переводчик и почитать результат - некоторые я таким образом уже исправил). http://kak-sam.to/~alex/osm/Maa-amet_vastus_OSM2.rtf
Нужно понимать, что перевод Гуглом на английский и перевод на русский - это две большие разницы по качеству.
Я незнакомые языки перевожу исключительно на английский, и в этом есть смысл.
И второе - перевод Гугла на английский был дан исключительно для ознакомления и поиска смысловых ошибок из-за неверно распознанных эстонских букв (например я по эстонски вообще не слова не понимаю, но с помощью перевода гугла на английский исправил штук пять ошибок OCR).
Суть - в распознанном (а не растровом) эстонском тексте.
Хотелось как можно меньше отсебятины, и как можно более приближенно к оригиналу, вот и вышел текст не совсем русский. Может, дело в самокритике, и на деле не все так плохо
Скачал базу адресов. Осталось подумать, что из этого импортировать.
ADOB_ID - версия(?)
ADS_OID - [недокументировано] какие-то коды… EE00636588, CU00455640, ME02766599
ADOB_LIIK - [недокументировано] какие-то коды… EE, CU, ME
ORIG_TUNNUS - “идентификатор объекта в оригинальном регистре”(?)
ETAK_ID - идентификатор в ETAK системе
ADS_KEHTIV - дата, с которой адрес действует
OLEK - статус (“действующий” или “в ожидании”(?))
ADR_ID - [недокументировано] ещё какой-то ID
KOODAADRESS - какой-то шифрованный код вида 377840387000003WY00001SGM00000000
TAISAADRESS - полный адрес (Harju maakond, Tallinna linn, Lasnamдe linnaosa, Paekaare tn 22)
LAHIAADRESS - короткий адрес (Paekaare tn 22)
AADR_OLEK - состояние адреса (K - ok, остальные не берём)
VIITEPUNKT_X - координаты
VIITEPUNKT_Y - координаты
дальше идут адреса, разбитые на уровни
для городов вроде понятно:
1 - уезд (Harju maakond)
2 - город (Tallinna linn)
3 - район (Lasnamäe linnaosa)
4 -
5 - улица
6 -
7 - номер здания
для деревень не очень… их не буду трогать
1 - уезд (Harju maakond)
2 - волость (Keila vald)
3 - деревня (Laulasmaa küla)
4 -
5 -
6 - просто названия (wtf?)
7 -
1 - Уезд
2 - Cамоуправление (город/волость)
3 - Часть города/поселок/деревня
4 - "небольшое место" летние котеджи/садоводческие товарищества
5 - дорога
6 - наименовение (в этом случае адресный номер должен отсутствовать, т.е. addr:name)
7 - адресный номер
8 - номер квартиры
Я бы предпочёл в навигаторе увидеть C. R. Jakobsoni tn, чем Carl Robert Jakobsoni tänav (интересно, а как жители этой улицы сами её произносят? наверное просто Jakobsoni ).
К тому же, второе наверняка не поместится в навигаторах, и будет обрезано как попало, что ещё хуже.
PS. А вообще, надо посмотреть, как сама улица на карте названа.
PPS. Мы всё же привыкли видеть tn и mnt, так пишется на табличках, в справочниках, и вообще везде.
ИМХО, сокращения - дело стороннего софта. Мы же базу наполняем, а не под навигатор значения пишем. Сократить всегда можно, а вернуть J. Liivi tn полное название уже не удасться
Информация:
С того момента, как появилась возможность открыть JOSM, я режу каждый слипшийся дом, вместо его пометки “!”.
(при этом режу и те, что в редакторе оказались рядом с ним).
Рассчитываю, что через сутки порезанные домики поступят в общий пул скрипта.
(по статистике, сейчас резать нужно примерно каждую 15-ю выдачу скрипта).
Так вот, за последние сутки я получил дважды выдачу, которая для скрипта выглядела контуром, который нуждается в порезке, хотя на самом деле, я ее уже разрезал ранее.
На самом деле, проблемы я здесь пока не увидел, поскольку, судя по истории в базе OSM, я это разрезал менее суток назад, и скрипт имеет право еще быть не в курсе.
Пишу же об этом затем, чтобы обратить внимание на важность периодической синхронизации пула домов скрипта с базой OSM - не реже раза в сутки.
Ну, пока нет фактов, что это не так.
==
Ну и дополнительно, подметил, что в Эстонии бывает еще и вот так. (на картинке это я дома порезал - изначально точки с адресом были накиданы в один контур дома).
Не знаю, учитываются ли такие ситуации скриптом.
Коли домики порезаны, может стоит и адреса кинуть на них? Задачка то значительно проще порезки домов. Ctrl + C, Ctrl + Shift + V. Некоему kaupov, видимо, лень было домики резать.
PS: по области на скрине прошелся и перенес адреса на домики
Где-то к 10:17 у них файл готов.
Значит, отставание может составить минимум 1 сутки + 4 часа + моё время на импорт.
А слово “улица” вообще надо писать? Ведь сам тег и так называется addr:street. Получается “масло маслянное”, не?
(я с OSM разбираться начал относительно недавно, так что не вкурсе)
Предлагаешь импортировать весь набор?
Опять же, об избыточности данных - вроде и так ясно, в каком городе здание, надо ли каждому зданию это повторять?
(если это кому-то полезно, то без проблем, но полезно ли? или будет лишним мусором в базе?)
Не, тут дело такое:
я в EE регионе - чужой, и ихних правил маппинга - не знаю.
Я вижу, что есть некоторые отличия с тем, как мы делаем в России, но полностью изучать все гласные и негласные правила у меня ни времени, ни желания, нет.
Поэтому я стараюсь вносить как можно меньше необязательных изменений.
Нужно было порезать дома - я порезал.
Где было просто внести адреса на порезанные дома - я кое-где так сделал (но сейчас я уже склоняюсь к тому, что лучше я буду просто резать, а адреса будет вносить скрипт, поскольку вижу, что желающих проставлять номера домов на порезанные контуры - примерно в 15 раз больше, чем тех, кто их готов порезать).
Но вот так, чтобы изменять одну схему адресации (через точку внутри контура дома) на другую (адрес на контуре дома) - пусть это лучше делают местные.
Чтобы мне не отвечать за вандализм на чужой территории.
Поэтому, я совершенно сознательно не меняю уже существующую систему адресации.
А о том, что есть такие вот отклонения - просто предупреждаю.
Не, я лишь расписал значения уровней. Хотя, для каких-то схем адресации рекомендовалось добавлять addr:place. Обязательные поля addr:housenumber, addr:street или addr:name (номер и улица в этом случае отсутствуют).
addr:street - тип значения, указывающий на дорогу, по которой идет адресация. Улица в названии дороги - ее статус, не проспект или шоссе, а именно улица. Я бы оставил. При конвертации в навигационный софт, если мешает, выкинуть всегда можно. Можно с легкостью составить файлик замен полные → сокращенные названия улиц и кормить его конвертерам, файлик всего-то 82Kb.