Государственный каталог географических названий

Живёт на сайте Росреестра:
https://rosreestr.ru/wps/portal/cc_ib_data_catalog_place_names?param_infoblock_document_path=infoblock-root/cc_ib_data_catalog_place_names/index.htm

Оригинальное сообщение:
На сайте Росреестр http://www.rosreestr.ru/kartografy/cartographical_works/ доступен следующий файл http://www.rosreestr.ru/upload/rosreest/files/gos_katalog.pdf, цитирую выборочно:

“Для обеспечения вышеназванных потребностей разработана автоматизированная
информационная поисковая система, позволяющая осуществлять регистрацию и учет
наименований географических объектов, хранение, обновление и оперативную выдачу по
запросам пользователей информации, регистрируемой в Государственном каталоге.
По состоянию на 31 марта 2007 года в базу данных Государственного каталога занесена
информация о наименованиях 181,5 тыс. географических объектов на территории 66
субъектов Российской Федерации. На территории Липецкой и Нижегородской областей
информация о наименованиях географических объектов занесена в полном объеме.”

Вопрос один: как получить доступ к информации в этой системе?

http://www.rosreestr.ru/kartografy/state_catalogue/data/

Реестр зарегистрированных в АГКГН географических названий объектов на 18/11/2010 Липецкая область (1)
Реестр зарегистрированных в АГКГН географических названий объектов на 18/11/2010 Липецкая область (2)
Реестр нормализованных названий ранее существовавших географических объектов, зарегистрированных в АГКГН на 18/11/2010 Липецкая область

Как по-вашему, какая у этого списка лицензия?

Понятно какая лицензия. Названия географических объектов - государственная собственность. Поэтому использовать можно только с письменного разрешения Президента страны или лица его замещающего.

Для таких списков вариантов всего два: “опубликован” и “не опубликован”

т.е. PD, как и GNS? (до меня долго доходит)

поднимаю тему, чтобы не плодить дублей
спасибо Лёше, что нашёл
спасибо тому программисту, кто сделает из этого списка csv или сразу карту

Вот в первом приближении (gpx)
http://data.gis-lab.ru/mp/gkgn.zip

А можно русский текст в нормальном UTF-8? Искать неудобно.

Это Geo::Gpx так пишет.
Другой писалки с ходу не попалось, а руками писать было лениво


import java.io.*;
import javax.xml.transform.*;
import javax.xml.transform.stream.*;

public class Transform
{
 public static void main(String[] args) throws Exception
 {
   Source source = new StreamSource(new File(args[0]));
   Result result = new StreamResult(new File(args[1]));

   TransformerFactory tf = TransformerFactory.newInstance();
 
   Transformer tr = tf.newTransformer();
 
   tr.transform(source, result);
 }
}

Делается тупое копирование содержимого, файлы в результате становятся в 2 раза меньше и в честном UTF-8. :slight_smile:

Парсер лох: всё отваливалось на 1000-й записи.
Исправил, теперь всё полное.
Ссылка та же.

Нда, чуда опять не случилось. Глянул по своему району - смещение от сотен метров до 5 км, часть обьектов несуществующие… Ракеты по этим координатам не долетят, видимо, такой расчет был.

Там координаты приблизительные да ещё и округленные, так что в любом случае высокой точности ждать от них не следует.

Но зато статусная часть!..

Я сразу бросился добавлять урочища! Обожаю locality!

Выяснилась другая беда — из-за округлений часто слипаются нп и причитать названия на экране в JOSM становится нельзя.

Хотелось бы некое раcталкивание.

Спасибо, это очень круто (я про проделанную работу, а не про содержимое - содержимое еще предстоит оценить).
Хотел сделать то же самое, но сломался на этапе OCR’нья PDF’а.

Хочу поинтересоваться:
Этот пакет gpx’ов был создан из какого-то другого источника, нежели PDF (может, у Росреестра где-то то же самое в txt или ином человеческом формате выложено?),
или удалось так ловко распознать такую тяжеловесную таблицу в PDF?
Если последнее - то иначе как чудом я это назвать не могу.
Хотелось бы подробностей, чем и как.

Ну и по содержимому - взглянул чуть.
К сожалению, исходные координаты без секунд получаются сильно округлены, точка с названием озера находится более, чем в километре от самого озера.
А рядом есть и другие озера.
Т.е. в ряде случаев использовать эти названия - большой риск - можно неправильно понять, чье же это название.
Вопрос к общественности - а нельзя ли так запинать Росреестр, чтобы они давали координаты с бОльшей точностью (в координаты еще и секунды добавили)?
Или, у них у самих точнее координат нет? :slight_smile:
(на самом деле, не понимаю смысла в проделывании Росреестром такой, на первый взглад, правильной работы, и в конце так бездарно свести ее почти к нулю, не дав нормальных координат. Каким образом, они сами предполагают, это можно использовать?)

И в связи с изложенным выше, вопрос к liosha - а нельзя ли в desc дополнительно в круглых скобках добавить содержание тектового поля “Привязка к другим геогр. объектам”, где оно есть (находится в таблице под координатами, содержит что-то типа “севернее оз. Капшозер”) ?
Понимаю, что распознавать и парсить сложнее, но …

Это без ocr-инья, это через xpdf. А он даёт не таблицу, а набор строчек в несколько перемешанном виде.
И получить что-то более структурированное, чем сейчас, уже сложно.

Теоретически можно попробовать вписать в desc “всё остальное”, но там будет уже мешанина из альтернативных названий и примечаний.

А вот, кстати, еще предложение:

Так как секунд в исходных координатах нет, коорината ‘59 гр. 20 мин’ на самом деле означает любое значение
от ‘59 гр. 20 мин’ до ‘59 гр. 21 мин’ или, в десятичных дробях,
от 59.3333333333333 до 59.35
Т.е. мне кажется, больше трех цифр после десятичной точки - приводить просто не нужно, нет такой точности в исходных координатах.

Но зато есть другая проблема, которую тут можно решить заодно.
Сейчас зачастую несколько точек падают ровно в одну (из-за округления).
Прочитать их названия из-за наложения меток становится невозможным.
(хотел привести пример, но даже не могу распознать эти точки на экране - не читаются из-за наложения)
В то время, как если мы говорим, что настоящая точность исчерпывается максисмум тремя цифрами после десятичной точки - то после них можно внести случайный сдвиг, чтобы точки не ложились в одно место на карте, когда у них одинаковые координаты.

На примере:
Пусть есть две точки, которые имеют одинаковые координаты (из за отсутствующих секунд).

Рассмотрим одну координату - ‘59 гр. 20 мин’
На самом деле, в десятичном виде, с достаточной точностью, она будет 59.34.
Но мы запишем одну точку с координатой 59.342, а другую - 59.349 (т.е. в третью цифру после запятой внесли случайный сдвиг).
И то и другое будет вполне себе ‘59 гр. 20 мин’, но на карте они уже не будут совпадать.

Есть два варианта - делать так только для тех точек, которые реально совпадают по коодинатам (их немного, но их нужно будет вычислять),
либо делать это абсолютно для всех точек, подставляя третью цифру после десятичной точки случайным образом.

Как-то так.

Можно и неслучайное - просто добавлять в младшие разряды порядковый номер точки.