Ну в общем правильно, только добавлять gvr:code надо для всех линий реки. И еще, валидатор не понимает разветвлений, для него водоток должен быть цепочкой: каждая следующая линия начинается в точке, где заканчивается предыдущая.
Я считаю, что не стоит торопиться и проставлять gvr:code всем подряд не определившимся речкам. Когда будет добавлена проверка топологии, то большинство из неопределившихся речек - определится правильно. А проставление кода - уже должно быть крайней мерой.
Посмотрите, например, на валидатор границ - там никакие коды в базу не добавляются, кроме okato:user в исключительных ситуация.
Переделал алгоритм сопоставления, теперь учитывается место впадения реки. Запустил обновление (к сожалению пока не получается настроить автоматический запуск), часа через 3 можно будет увидеть результат.
Также сделал общие итоги на главной странице, сейчас 2943 успешно сопоставленных объекта и 11829 неоднозначных. Посмотрим что будет после обновления.
А можете посмотреть, почему вот эта река не определяется? (Можно увидеть, что последний сегмент впадает в реку Южная Уньга, которая прекрасно определилась валидатором.)
Код ГВР не полный, 22 цифры, видимо первый ноль утерян (код ГВР это не число, это по сути своей строка длиной 23 символа, в которой составляющие ее коды стоят каждый на своей позиции).
Участки с gvr:code разделены участком без gvr:code, соответственно они не могут объединиться в одну цепочку.
Один участок с gvr:code почему-то течет в обратном направлении, это тоже препятствует объединению в цепочку и является грубой ошибкой в ОСМ.
Конечная точка реки присоединяется к полигону, а не к линии. Для правильного определения места впадения линия притока должна соединяться с линией реки, в которую она впадает.
Это так в ГВР записано. Если озера уже обрисованы, можно плагином JOSMа измерить площадь каждого, и соотнести с данными ГВР, разница в 0.15 кв. км не так уж мала. Еще можно порыскать по сайту Федерального агенства водных ресурсов, может там что-то есть.
Проверка топологии (пока проверяются только реки, впадающие в другие реки и имеющие запись о месте впадения в базе водного реестра, сейчас в базе водного реестра около 76% водотоков имеют запись о месте впадения). Ошибки отображаются красным цветом. Нажав на ссылку !!! можно увидеть расшифровку ошибки.
На странице расшифровки объекта с неоднозначным сопоставлением для водных путей выводится куда впадает его последняя линия.
Добавлена обработка тега gvr:code=0. Этот тег должен использоваться для обозначения водных объектов, отсутствующих в водном реестре, но имеющих “однофамильцев” в виде объектов с таким же названием. Объекты, обозначенные тегом gvr:code=0 валидатор игнорирует и не пытается сопоставлять с водным реестром.
Коли тут про воды, спрошу тут: вот в валидаторе например река Урал состоит из нескольких кусочков, полилиний, конечными точками соединенные (хотя не весь Урал еще обозначен).
Так вот, надо ли объединять эти куски в одно?? или же этого ненадо делать по какой то причине, или просто оставить как есть из-за бессмысленного объединения???