Да, Окункуль не находится потому что поиск пока работает только по официальному имени.
Про GNS подскажите, как оттуда взять данные.
Бота я наверное пока не осилю, надо сначала довести этот проект до нужной кондиции. Некоторые статусные части (оз., озеро, пруд, водохранилище) я отбрасываю при сравнении, возможно ещё какие-то надо пишите, добавлю.
Мой проект хостится на рамблеровском сервере http://wiki.openstreetmap.org/wiki/RU:Сервера_OSM_в_Рамблере
там есть зеркало - база на PostgreSQL, плохо только что я про нее узнал поздно, а то бы сразу делал с использованием ее в качестве источника.
Есть такая задумка, но пока это не реализовано. При сравнивании в JOSMе кстати большие расхождения, как правило измеренная длина в JOSMе оказывается больше, иногда в разы.
Топология пока тоже не используется, это в ближайших планах.
Ну в общем правильно, только добавлять gvr:code надо для всех линий реки. И еще, валидатор не понимает разветвлений, для него водоток должен быть цепочкой: каждая следующая линия начинается в точке, где заканчивается предыдущая.
Я считаю, что не стоит торопиться и проставлять gvr:code всем подряд не определившимся речкам. Когда будет добавлена проверка топологии, то большинство из неопределившихся речек - определится правильно. А проставление кода - уже должно быть крайней мерой.
Посмотрите, например, на валидатор границ - там никакие коды в базу не добавляются, кроме okato:user в исключительных ситуация.
Переделал алгоритм сопоставления, теперь учитывается место впадения реки. Запустил обновление (к сожалению пока не получается настроить автоматический запуск), часа через 3 можно будет увидеть результат.
Также сделал общие итоги на главной странице, сейчас 2943 успешно сопоставленных объекта и 11829 неоднозначных. Посмотрим что будет после обновления.
А можете посмотреть, почему вот эта река не определяется? (Можно увидеть, что последний сегмент впадает в реку Южная Уньга, которая прекрасно определилась валидатором.)