во-первых не нужно ждать “окончательного перехода”.
Я и предлагаю делать по слоям.
Первый слой - остановки ОТ. Его начали, но бросили.
Формально соглашение про язык в name касается лишь топонимов и улиц, так что остановки запросто можно и надо доделать на белорусский name уже сейчас.
А смирится и понимать надо то, что будет заметная часть, которая не будет переведена никогда.
Не у всего есть белорусское название.
Вот возьмем для примеру названия автодорог. Есть документы, их присваивающие, только на русском языке.
Сабраў статыстыку па выкарыстоўваню name па катэгорыях, тут бярэцца дамп беларусі, таму можа трошкі захопліваць суседзяў, а праз postgis ня ўсе катэгорыя ўлічваюцца
звычайны элемент з тэгамі name, name:be, name:ru - name будзе заменены на name:be
залежны элемент (напрыклад addr:street) - спачатку знаходзіцца бліжэйшы элемент з тэгамі name, name:be, name:ru дзе залежны тэг будзе у адным з name, name:be, name:ru тэгаў і потым замяняем залежны тэг на name:be.
Напрыклад node1 мае тэг addr:street=улица Скарыны, знайшлі бліжэйшы элемент way1 з тэгамі name=вуліца Скарыны, name:be=вуліца Скарыны, name:ru=улица Скарыны і мяняем node1 addr:streetна way1 name:be: addr:street=вуліца Скарыны
Разьдзел прагрэсу разьбіты на катэгорыі, кожная катэгорыя утрымлівае набор простых тэгаў, напрыклад у катэгорыю admin уваходзяць admin_level=2, admin_level=4 і г.д.
Кожан радок разьбіты на некалькі частак - назва катэгорыі ці тэгу, абсалютная статыстыка, статыстыка ў адсотках.
зялёны - name пазначаны па-беларуску (name і name:be аднолькавыя)
жоўты - name пазначаны па-расейску (name і name:ru аднолькавыя), name:be прысутнічае - элемент гатовы да аўтаматычнае міграцыі
чырвоны - цяжка сказаць на якой мове name - элемент не гатовы да аўтаматычнае міграцыі
Кожан радок разьдзелу прагрэсу паказывае бягучы стан моўных тэгаў:
be=ru азначае што name, name:be і name:ru аднолькавыя
be+ru азначае што name і name:be аднолькавыя, name:ru прысутнічае
be азначае што name і name:be аднолькавыя, name:ru адсутнічае
ru+be азначае што name і name:ru аднолькавыя, name:be прысутнічае
ru азначае што name і name:ru аднолькавыя, name:be адсутнічае
other both азначае што name адрозны ад name:be ці name:ru, name:be і name:ru прысутнічаюць
other be азначае што name адрозны ад name:be, name:be прысутнічае, name:ru адсутнічае
other be азначае што name адрозны ад name:ru, name:ru прысутнічае, name:be адсутнічае
no lang азначае што name:be і name:ru адсутнічаюць
Калі націснуць на ячэйшку то зьяўляецца папап дзе могуць знаходзіцца спасылкі на дэталі па дадзенай ячэйцы ў CSV ці overpass.
CSV
Прыклад з CSV дзе адсутнічае name:ru
На дадзенай старонцы можна знайсьці дэталі па асобных элементах з інфармацыяй аб osm_type і osm_id
overpass
Прыклад з overpass дзе name адрозны ад name:be ці name:ru
Запыт у overpass да таго ж можна выкарыстоўваць у JOSM для далейшага рэдарагваньня дадзеных
Хачу прапанаваць правіла на галасаваньне для абмяркоўваньня
Кароткае правіла:
беларуская мова зьяўляецца моваю па замоўчаньні, калі ўзьнікае сытуацыя раўназначнага выкарыстаньня розных моваў, то прыярытэт аддаеца беларускай
назвы ў name для тапонімаў, дзяржаўных ці грамадзка значных ўстановаў і інфраструктуры павінны пісацца па-беларуску, таксама абавязкова запаўненьне моўных тэгаў name:be і name:ru для беларускай і расейскай назвы
назвы ў name для POI мае сэнс пазначаць адпаведна шыльдам, таксама пажадана запаўненьне моўных тэгаў name:be і name:ru для беларускіх і расейскіх адпаведнікаў назвы, калі такія існуюць
назвы ў залежных тэгах кшталту addr павінны адпавядаць name незалежна ад мовы выкарыстаньня
Тлумачэньні:
беларуская мова зьяўляецца моваю па замоўчаньні, калі ўзьнікае сытуацыя раўназначнага выкарыстаньня розных моваў, то прыярытэт аддаеца беларускай
дадзенае правіла зьяўляецца працягам логікі калі новым геаграфічным аб’ектам назва даецца па-беларуску, пасьлся чаго транслітаруецца на іншыя мовы
дадзеная правіла звычайна не распаўсюджваецца на назвы іншамоўнага паходжаньня за выключэньнем назваў якія былі асіміляваныя беларускаю
напрыклад дадзенае првіла можа дапамагчы ў выбары калі існуюць шыльды на розных мовах ці існуюць шырока вядомыя варыянты назвы на неаклькіх мовах
назвы ў name для тапонімаў, дзяржаўных ці грамадзка значных ўстановаў і інфраструктуры павінны пісацца па-беларуску, таксама абавязковае запаўненьне моўных тэгаў name:be і name:ru для беларускай і расейскай назвы
назвы населенных пунктаў на шыльдах пераважна пазначаюцца па-беларуску
назвы вуліцаў, напрыклад па Менску маюць у асноўным шыльды на беларускай мове
прыпытнкі і маршруты грамадзкага транспарту, напрыклад па Менску маюць у асноўным шыльды на беларускай мове
установы адукацыі, аховы здароўя і іншыя дзяржаўныя ўстановы звычайна маюць шыльды на дзьвух мовах
тэгі тапонімаў:
admin_level=*
boundary=*
place=*
traffic_sign=city_limit
landuse=*
highway=*
type=associatedStreet
type=street
bridge=*
tunnel=*
waterway=*
type=waterway
water=*
natural=*
ele=*
назвы ў залежных тэгах кшталту addr павінны адпавядаць name незалежна ад мовы выкарыстаньня
залежныя ад тапонімаў тэгі:
addr:region
addr:district
addr:subdistrict
addr:city
addr:place
addr:street
addr2:street
from
to
via
destination
destination:backward
destination:forward
water_tank:city
тэгі дзяржаўных ці грамадзка значных ўстаноў і інфраструктуры (аб’екты грамадзкага транспарту, інфраструктуры, рэлігійныя, адукацыі, аховы здароўя, пошты, бібліятэкі, міліцыі, вайсковыя, дзяржаўныя, турызму):
public_transport=*
route=*
route_master=*
type=route
type=route_master
railway=*
barrier=*
power=*
substation=*
man_made=*
embankment=*
amenity=place_of_worship
amenity=monastery
building=church
building=cathedral
building=chapel
religion=*
amenity=university
amenity=college
amenity=school
amenity=kindergarten
building=university
building=college
building=school
building=kindergarten
amenity=hospital
amenity=pharmacy
amenity=clinic
amenity=doctors
amenity=dentist
building=hospital
building=clinic
emergency=*
healthcare=*
amenity=post_office
amenity=police
amenity=library
military=*
office=government
government=*
tourism=*
historic=*
memorial=*
ruins=*
information=*
attraction=*
resort=*
artwork_type=*
назвы ў name для POI мае сэнс пазначаць адпаведна шыльдам, таксама пажадана запаўненьне моўных тэгаў name:be і name:ru для беларускіх і расейскіх адпаведнікаў назвы, калі такія існуюць
шмат якія POI могуць мець першапачатковую назву не на беларускай мове, дадзены падыход мусіць спрасьціць запаўненьне name для POI і выкарыстоўваць правіла https://wiki.openstreetmap.org/wiki/Ground_truth
Ідэя правільная. Можна дадаць у “новым геаграфічным аб’ектам назва даецца па-беларуску”, што “старыя назвы да 1930-х гадоў даваліся таксама толькі па-беларуску”.
А што тычыцца “З чаго і як павінна ўтравацца лацінcкая транслітарацыя int_name? Якая транслітарацыя павінна ўжывацца клясічная (Ł) ці афіцыйная (Ĺ)?” - то гэта мусіць быць толькі афіцыйны варыянт. Гэта і ground truth, і афіцыйнасць, і адсутнасць шмат якіх іншых праблем.