Сабраў статыстыку па выкарыстоўваню name па катэгорыях, тут бярэцца дамп беларусі, таму можа трошкі захопліваць суседзяў, а праз postgis ня ўсе катэгорыя ўлічваюцца
звычайны элемент з тэгамі name, name:be, name:ru - name будзе заменены на name:be
залежны элемент (напрыклад addr:street) - спачатку знаходзіцца бліжэйшы элемент з тэгамі name, name:be, name:ru дзе залежны тэг будзе у адным з name, name:be, name:ru тэгаў і потым замяняем залежны тэг на name:be.
Напрыклад node1 мае тэг addr:street=улица Скарыны, знайшлі бліжэйшы элемент way1 з тэгамі name=вуліца Скарыны, name:be=вуліца Скарыны, name:ru=улица Скарыны і мяняем node1 addr:streetна way1 name:be: addr:street=вуліца Скарыны
Разьдзел прагрэсу разьбіты на катэгорыі, кожная катэгорыя утрымлівае набор простых тэгаў, напрыклад у катэгорыю admin уваходзяць admin_level=2, admin_level=4 і г.д.
Кожан радок разьбіты на некалькі частак - назва катэгорыі ці тэгу, абсалютная статыстыка, статыстыка ў адсотках.
зялёны - name пазначаны па-беларуску (name і name:be аднолькавыя)
жоўты - name пазначаны па-расейску (name і name:ru аднолькавыя), name:be прысутнічае - элемент гатовы да аўтаматычнае міграцыі
чырвоны - цяжка сказаць на якой мове name - элемент не гатовы да аўтаматычнае міграцыі
Кожан радок разьдзелу прагрэсу паказывае бягучы стан моўных тэгаў:
be=ru азначае што name, name:be і name:ru аднолькавыя
be+ru азначае што name і name:be аднолькавыя, name:ru прысутнічае
be азначае што name і name:be аднолькавыя, name:ru адсутнічае
ru+be азначае што name і name:ru аднолькавыя, name:be прысутнічае
ru азначае што name і name:ru аднолькавыя, name:be адсутнічае
other both азначае што name адрозны ад name:be ці name:ru, name:be і name:ru прысутнічаюць
other be азначае што name адрозны ад name:be, name:be прысутнічае, name:ru адсутнічае
other be азначае што name адрозны ад name:ru, name:ru прысутнічае, name:be адсутнічае
no lang азначае што name:be і name:ru адсутнічаюць
Калі націснуць на ячэйшку то зьяўляецца папап дзе могуць знаходзіцца спасылкі на дэталі па дадзенай ячэйцы ў CSV ці overpass.
CSV
Прыклад з CSV дзе адсутнічае name:ru
На дадзенай старонцы можна знайсьці дэталі па асобных элементах з інфармацыяй аб osm_type і osm_id
overpass
Прыклад з overpass дзе name адрозны ад name:be ці name:ru
Запыт у overpass да таго ж можна выкарыстоўваць у JOSM для далейшага рэдарагваньня дадзеных
Хачу прапанаваць правіла на галасаваньне для абмяркоўваньня
Кароткае правіла:
беларуская мова зьяўляецца моваю па замоўчаньні, калі ўзьнікае сытуацыя раўназначнага выкарыстаньня розных моваў, то прыярытэт аддаеца беларускай
назвы ў name для тапонімаў, дзяржаўных ці грамадзка значных ўстановаў і інфраструктуры павінны пісацца па-беларуску, таксама абавязкова запаўненьне моўных тэгаў name:be і name:ru для беларускай і расейскай назвы
назвы ў name для POI мае сэнс пазначаць адпаведна шыльдам, таксама пажадана запаўненьне моўных тэгаў name:be і name:ru для беларускіх і расейскіх адпаведнікаў назвы, калі такія існуюць
назвы ў залежных тэгах кшталту addr павінны адпавядаць name незалежна ад мовы выкарыстаньня
Тлумачэньні:
беларуская мова зьяўляецца моваю па замоўчаньні, калі ўзьнікае сытуацыя раўназначнага выкарыстаньня розных моваў, то прыярытэт аддаеца беларускай
дадзенае правіла зьяўляецца працягам логікі калі новым геаграфічным аб’ектам назва даецца па-беларуску, пасьлся чаго транслітаруецца на іншыя мовы
дадзеная правіла звычайна не распаўсюджваецца на назвы іншамоўнага паходжаньня за выключэньнем назваў якія былі асіміляваныя беларускаю
напрыклад дадзенае првіла можа дапамагчы ў выбары калі існуюць шыльды на розных мовах ці існуюць шырока вядомыя варыянты назвы на неаклькіх мовах
назвы ў name для тапонімаў, дзяржаўных ці грамадзка значных ўстановаў і інфраструктуры павінны пісацца па-беларуску, таксама абавязковае запаўненьне моўных тэгаў name:be і name:ru для беларускай і расейскай назвы
назвы населенных пунктаў на шыльдах пераважна пазначаюцца па-беларуску
назвы вуліцаў, напрыклад па Менску маюць у асноўным шыльды на беларускай мове
прыпытнкі і маршруты грамадзкага транспарту, напрыклад па Менску маюць у асноўным шыльды на беларускай мове
установы адукацыі, аховы здароўя і іншыя дзяржаўныя ўстановы звычайна маюць шыльды на дзьвух мовах
тэгі тапонімаў:
admin_level=*
boundary=*
place=*
traffic_sign=city_limit
landuse=*
highway=*
type=associatedStreet
type=street
bridge=*
tunnel=*
waterway=*
type=waterway
water=*
natural=*
ele=*
назвы ў залежных тэгах кшталту addr павінны адпавядаць name незалежна ад мовы выкарыстаньня
залежныя ад тапонімаў тэгі:
addr:region
addr:district
addr:subdistrict
addr:city
addr:place
addr:street
addr2:street
from
to
via
destination
destination:backward
destination:forward
water_tank:city
тэгі дзяржаўных ці грамадзка значных ўстаноў і інфраструктуры (аб’екты грамадзкага транспарту, інфраструктуры, рэлігійныя, адукацыі, аховы здароўя, пошты, бібліятэкі, міліцыі, вайсковыя, дзяржаўныя, турызму):
public_transport=*
route=*
route_master=*
type=route
type=route_master
railway=*
barrier=*
power=*
substation=*
man_made=*
embankment=*
amenity=place_of_worship
amenity=monastery
building=church
building=cathedral
building=chapel
religion=*
amenity=university
amenity=college
amenity=school
amenity=kindergarten
building=university
building=college
building=school
building=kindergarten
amenity=hospital
amenity=pharmacy
amenity=clinic
amenity=doctors
amenity=dentist
building=hospital
building=clinic
emergency=*
healthcare=*
amenity=post_office
amenity=police
amenity=library
military=*
office=government
government=*
tourism=*
historic=*
memorial=*
ruins=*
information=*
attraction=*
resort=*
artwork_type=*
назвы ў name для POI мае сэнс пазначаць адпаведна шыльдам, таксама пажадана запаўненьне моўных тэгаў name:be і name:ru для беларускіх і расейскіх адпаведнікаў назвы, калі такія існуюць
шмат якія POI могуць мець першапачатковую назву не на беларускай мове, дадзены падыход мусіць спрасьціць запаўненьне name для POI і выкарыстоўваць правіла https://wiki.openstreetmap.org/wiki/Ground_truth
Ідэя правільная. Можна дадаць у “новым геаграфічным аб’ектам назва даецца па-беларуску”, што “старыя назвы да 1930-х гадоў даваліся таксама толькі па-беларуску”.
А што тычыцца “З чаго і як павінна ўтравацца лацінcкая транслітарацыя int_name? Якая транслітарацыя павінна ўжывацца клясічная (Ł) ці афіцыйная (Ĺ)?” - то гэта мусіць быць толькі афіцыйны варыянт. Гэта і ground truth, і афіцыйнасць, і адсутнасць шмат якіх іншых праблем.