“Для обеспечения вышеназванных потребностей разработана автоматизированная
информационная поисковая система, позволяющая осуществлять регистрацию и учет
наименований географических объектов, хранение, обновление и оперативную выдачу по
запросам пользователей информации, регистрируемой в Государственном каталоге.
По состоянию на 31 марта 2007 года в базу данных Государственного каталога занесена
информация о наименованиях 181,5 тыс. географических объектов на территории 66
субъектов Российской Федерации. На территории Липецкой и Нижегородской областей
информация о наименованиях географических объектов занесена в полном объеме.”
Вопрос один: как получить доступ к информации в этой системе?
Понятно какая лицензия. Названия географических объектов - государственная собственность. Поэтому использовать можно только с письменного разрешения Президента страны или лица его замещающего.
Нда, чуда опять не случилось. Глянул по своему району - смещение от сотен метров до 5 км, часть обьектов несуществующие… Ракеты по этим координатам не долетят, видимо, такой расчет был.
Спасибо, это очень круто (я про проделанную работу, а не про содержимое - содержимое еще предстоит оценить).
Хотел сделать то же самое, но сломался на этапе OCR’нья PDF’а.
Хочу поинтересоваться:
Этот пакет gpx’ов был создан из какого-то другого источника, нежели PDF (может, у Росреестра где-то то же самое в txt или ином человеческом формате выложено?),
или удалось так ловко распознать такую тяжеловесную таблицу в PDF?
Если последнее - то иначе как чудом я это назвать не могу.
Хотелось бы подробностей, чем и как.
Ну и по содержимому - взглянул чуть.
К сожалению, исходные координаты без секунд получаются сильно округлены, точка с названием озера находится более, чем в километре от самого озера.
А рядом есть и другие озера.
Т.е. в ряде случаев использовать эти названия - большой риск - можно неправильно понять, чье же это название.
Вопрос к общественности - а нельзя ли так запинать Росреестр, чтобы они давали координаты с бОльшей точностью (в координаты еще и секунды добавили)?
Или, у них у самих точнее координат нет?
(на самом деле, не понимаю смысла в проделывании Росреестром такой, на первый взглад, правильной работы, и в конце так бездарно свести ее почти к нулю, не дав нормальных координат. Каким образом, они сами предполагают, это можно использовать?)
И в связи с изложенным выше, вопрос к liosha - а нельзя ли в desc дополнительно в круглых скобках добавить содержание тектового поля “Привязка к другим геогр. объектам”, где оно есть (находится в таблице под координатами, содержит что-то типа “севернее оз. Капшозер”) ?
Понимаю, что распознавать и парсить сложнее, но …
Это без ocr-инья, это через xpdf. А он даёт не таблицу, а набор строчек в несколько перемешанном виде.
И получить что-то более структурированное, чем сейчас, уже сложно.
Теоретически можно попробовать вписать в desc “всё остальное”, но там будет уже мешанина из альтернативных названий и примечаний.
Так как секунд в исходных координатах нет, коорината ‘59 гр. 20 мин’ на самом деле означает любое значение
от ‘59 гр. 20 мин’ до ‘59 гр. 21 мин’ или, в десятичных дробях,
от 59.3333333333333 до 59.35
Т.е. мне кажется, больше трех цифр после десятичной точки - приводить просто не нужно, нет такой точности в исходных координатах.
Но зато есть другая проблема, которую тут можно решить заодно.
Сейчас зачастую несколько точек падают ровно в одну (из-за округления).
Прочитать их названия из-за наложения меток становится невозможным.
(хотел привести пример, но даже не могу распознать эти точки на экране - не читаются из-за наложения)
В то время, как если мы говорим, что настоящая точность исчерпывается максисмум тремя цифрами после десятичной точки - то после них можно внести случайный сдвиг, чтобы точки не ложились в одно место на карте, когда у них одинаковые координаты.
На примере:
Пусть есть две точки, которые имеют одинаковые координаты (из за отсутствующих секунд).
Рассмотрим одну координату - ‘59 гр. 20 мин’
На самом деле, в десятичном виде, с достаточной точностью, она будет 59.34.
Но мы запишем одну точку с координатой 59.342, а другую - 59.349 (т.е. в третью цифру после запятой внесли случайный сдвиг).
И то и другое будет вполне себе ‘59 гр. 20 мин’, но на карте они уже не будут совпадать.
Есть два варианта - делать так только для тех точек, которые реально совпадают по коодинатам (их немного, но их нужно будет вычислять),
либо делать это абсолютно для всех точек, подставляя третью цифру после десятичной точки случайным образом.