Називи/Names

@kmilos

Nema problema, sve u sklopu mogucnosti.

Dobro, posto je ocigledno neko pametniji od nas odradio dosta dobar deo posla, kao prvo da prosledim link gde ce publika moci da se uveri i sama u ovo o cemu pricamo:

http://unicode.org/repos/cldr-tmp/trunk/diff/summary/sr.html

  • Cini mi se da je “sr” alias za “sr-Cyrl” ne za “sr-Cyrl-RS”? Jel moze ovo negde da se proveri/prouci?

E sad dalje: ovo je cetvrti put da brisem/pisem ovo :slight_smile: Prvo sam se slozio sa tvojim predlogom, a onda je neki crv poceo da me jede, i posle jedno pola sata sam shvatio sta mi ustvari smeta.

  • sa stanovista programera, mislim da je najelegantnije i najcistije resenje da se koristi pun BCP 47 naziv, umesto skracenice. Ionako je ideja i vizija da se sr-Cyrl-RS koristi kao osnova za auto-generisanje nekolicine drugih tagova.

name=Булевар Зорана Ђинђића
name:sr-Cyrl-RS=Булевар Зорана Ђинђића
name:sr-Latn-RS=Bulevar Zorana Đinđića
name:en=Zoran Djindjic Boulevard

  • predlog koji predlazes je nesto sto bi ja licno nazvao “podrazumevajuci” ili “logican”, iliti "naravno da je ‘sr’ ustvari ‘sr-Cyrl’ i to specificno ‘sr-Cyrl-RS’. E sad, da se nebi stvari podrazumevale, tj, da bi svima bilo jasno sta se radi i zasto se radi, ipak mi se cini da je pametnije drzati se punih tagova/kljuceva nego skracenica. I onda je opet sve ovo na neki nacin otvoreno interpretaciji, dali je “sr-Latn” ustvari “sr-Latn-RS” ili nesto drugo? A sta ako taj tag stoji za neko mesto u Bosni, tj u Republici Srpskoj? A sta ako stoji na nekom mestu u Kosovu? Ovako nekako, koristis puno ime tog tag-a/kljuca i kraj price, nema puno filozofiranja sta bi moglo, sta nebi moglo.

  • takodje mislim da bi koriscenjem punog naziva kljuca na neki nacin “resetovalo” i raskrstilo sa koriscenjem ‘name:sr’ taga i popunjavanjem istog sa kojecime. Ovako bi to ostao kao neki rep, koji bi onda mi menjali, pa bi onda neki ljudi imali mozda malo vecu emotivnu reakciju na takvu promenu itd itd… Mislim da bi punom implementacijom BCP 47 totalno raskrstili sa starom praksom i uveli novu praksu na pravi nacin. Sto bi rekli: “clean break”.

  • e sad, moram da priznam da postoji odredjena satisfakcija emotivne/politicke/dusevne prirode kad se koristi samo “sr”… “to se tako kaze na srpskom” :slight_smile: Nekako se osecam ispunjenije :slight_smile: Poruka bi bila: ovo je srpski, tako se pise na srpskom, a moze i na latinici ovako. Priznajem, svidja mi se. Ali ovde gledamo da budemo objektivni i racionalni.


name=Булевар Зорана Ђинђића
name:sr=Булевар Зорана Ђинђића
name:sr-Latn=Bulevar Zorana Đinđića
name:en=Zoran Djindjic Boulevard

Voleo bih da cujem druga misljenja i razmisljanja na ovu temu.

Sto se tice stranaca, uvek bi mogli da ukljuce english layer ili latin layer i da uzivaju do milje volje.

Za oba u stvari. Preuzmeš izvorne podatke i zaviriš u common/main, videćeš da su definisani samo ‘sr’ i ‘sr-Latn’, sve ostalo je izvedeno iz njih.

Ne razumem, pa na srpskom toponim ima svoj jednistven naziv bez obzira gde je. Nećeš Bijeljinu zvati ‘Beljina’ ako nisi u BiH.

Znači i dalje sam protiv punih oznaka, jer onda moraš višestruko da unosiš npr. ‘name:sr-Cyrl-RS’, ‘name:sr-Cyrl-BA’, ‘name:sr-Cyrl-ME’ za jednu istu stvar, što je totalno van pameti. Ko što BCP 47 predlaže, samo koristi one dodatne atribute oznaka kada želiš da suziš definiciju kada je to apsolutno neophodno.

Apsolutno, ovo je po meni najpraktičnije i najpragmatičnije rešenje jer se prirodno nastavlja na trenutno stanje stvari. Kao što rekoh, ‘sr’ oznaka je zahvaljujući pametnim ljudima već bespovratno otišla u željenom smeru, tako da je ovo stvarno ‘no brainer’, ‘win-win’… :wink:

Da, upravo sam procesljao kroz “common/main” i sr*.xml fajle.

Sto se mene tice, prihvatam da se koristi BCP-47 i slazem se sa Milosevom interpretacijom implementacije tog resenja.

E sad, voleo bih da cujem/vidim/procitam jos necije misljenje?

@Drazha
Odlično. I mene interesuje da čujem šta ostali misle.

Da nastavim onda sa drugim delovima diskusije.

  • Problem sa ključem ‘name’

Kao što je Christophorus lepo primetio, mešanje jezika i pisama u ključu ‘name’ stvarno vodi do nezadovoljavajuće papazjanije, kako u prikazu, tako i pri bilo kakvoj obradi podataka. Zamislite npr. da imate tako popunjenu bazu i sad iz nekog sučelja treba da vršite pretagu za nekim objektom. Znači korisnik treba unapred da zna na kom jeziku (i pismu) je neki objekat unet ni bi li ga našao npr. na svom uređaju za navigaciju. Kao rezultat se mora vršiti pretraga po svim jezicima i svim pismima sve vreme. Rekao bih malo daleko od idealnog.

Da ne spominjemo konstantna natezanja oko toge čiji je ‘name’ u multinacionalnim sredinama.

Moj jedini zaključak je da OSM arhitekte uopšte nisu razmišljale o višejezičnim (i ‘višepismovnim’) sredinama u početku projektivanja sistema, i da je ovo što imamo danas samo nakalemljeno.

Kada se pogleda iz daljine, samo ‘name’ bez ikakvog konteksta jezika (i pisma) da naznači kako je informacija u njemu sačuvana je krajnje beskorisno. Po meni bi onda suvo ‘name’ bez dodatnih naznaka jednostavno trebalo ukinuti.

Kako onda prikazivati informaciju?

Pa mogao bi se npr. dodati ključ za podrazumevane jezike na nivou administrativne relacije. Tako bi npr. lista za celu Srbiju bila ‘sr;sr-Latn’ (ako npr. želimo dvojni prikaz), ali za relaciju na nivou npr. opštine Subotica bi imali ‘hu;sr’ (ili koja god je već kombinacija i redosled poželjan: ‘sr-Latn;sr’, ‘sr;hu;sr-Latn’…) itd., i na tom nivou bi imala presedan.

Ovo se oslanja na činjenicu da algoritam za nalaženje administrativnih relacija koje sadrže željeni objekat naravno radi posao.

Za razliku od dodavanja još jednom ‘loc_name’ ključa za svki objekat, ovo je mnogo održivije rešenje, jer se ne oslanja na to da je svaki novi objekat označen tim ključem, već samo svim ispravnim ‘name:xyz’.

U međuvremenu možda nije najbolje forsirati ‘name’=‘name:sr’ već bi pragamatično bilo pozvati se na ‘on the ground rule’, koliko god to vizuelno bilo nezadovoljavajuće?

  • Pitanje automatskog genersanja latiničnih naziva

@Pedja, skroz si u pravu kada kažeš da se ovo može raditi na više načina. Evo npr. šta ja vidim kao mogućnosti.

  1. Ručni unos u bazu: svaki put kada se doda/izmeni ‘name:sr’, treba ručno dodati/izmeniti i ‘name:sr-Latn’

    Problem su naravno, greške u kucanju, ali i lenji maperi. (Treba takođe dodati i problem sledećeg načina.)

  2. Automatski unos u bazu: svaki put kada se doda/izmeni ‘name:sr’, neka ‘udica’ (hook) doda/izmeni i ‘name:sr-Latn’
    a) udica je pri serveru/bazi
    b) udica je kod klijenta preko koga se vrše izmene (JOSM, Potlatch, itd.)

    Problem ovde su klijenti van OSM kontrole koji koriste onda te podatke (programi za renderovanje, uređaju za navigaciju, itd.), jer ako nisu ažurirani da podržavaju BCP 47, oznaka ‘sr-Latn’ im ništa ne znači. (Hajde da ne brinemo o nepotrebnom ‘trošenju’ bajtova, recimo da su i prostor na disku kao i mrežni opseg za ovaj slučaj neograničeni.)

  3. Automatsko preslovljavanje po potrebi: čuvaju se samo ‘name:sr’ izmene, udica preslovljava na latinicu pri čitanju
    a) udica je pri serveru/bazi
    b) udica je kod klijenta koji potražuje podatke

    Ovo je zanimljivo jer pruža mogućnost podrške za ‘legacy’ i nestandardne klijente koji još nisu osveženi za BCP 47. Npr. klijent traži ‘name:sr@latin’ i nema prepreka da to i dobije (pretpostavljajući da možemo pokriti sve znane slučajeve).

E sad ide odricanje od odgovornosti :wink: Niti sam ‘hardcore’ programer niti DBMS stručnjak, tako da samo iznosim ideje koje mi imaju smisla, nemam pojma šta izabrati i kako implementirati, to već čini mi se zavisi od same OSM platfrome. Da se ja pitam, na duže staze bih možda gađao na 3a :wink:

Немам податке о тачној статистици али чини ми се да смо ми (српско говорно подручје) мање од једног промила целе планете. Стога не верујем да би нам ико дозволио да се уведе провера током сваког уписа у базу да ли постоји наш таг name:sr да би се евентуално додао/изменио још један таг - то би било баш велико расипање процесорског времена.

Ми можемо да се побринемо да база буде ажурна на други начин - да повремено (дневно, недељно, месечно) прочешљамо базу и да аутоматски извршимо пресловљавања где је то потребно. Ако је цела Србија 30так мегабајта неће бити проблем да се постави да се то одвија и у позадини током свакодневног рада на рачунару. Дакле, у најгорем случају потребна би била само добра воља једног појединца са flat приступом интернету. Уз комбинацију са 1 и 2б могли бисмо да постигнемо завидан степен ажурности.

Поздрав,
Пеђа

Sa ovim se slazem:
name=Булевар Зорана Ђинђића
name:sr=Булевар Зорана Ђинђића
name:en=Zoran Djindjic Boulevard

sr je (obicno) u genitivu a en bi trebalo vratiti u nominativ (ili ne?)

Ako je takav zvanicni standard, moze i ovo:
name:sr-Latn=Bulevar Zorana Đinđića
i nije mi jasno da li je Latn, ili Latin, i jel mora veliko slovo?

Ali ako pravimo novi standard, mozda bi moglo:
name:srl ili name:sr-l ili name:sr-lat

Sto se tice nacionalnih manjina, nema potrebe komplikovati jer svaki jezik (osim nesrecnog srpskog) ima jasno definisan name:xx kljuc i to treba koristiti.
Evo primer za madjarski:
-ako bi name pisali na madjarskom tamo gde su vecina madjari, onda svi oni koji nisu (a ima ih dosta osim srba) za default imaju nesto sto ne znaju da procitaju (zasto bi recimo slovak morao da zna i madjarski)
-Novi Sad se na madjarskom zove Ujvidek (ili tako nekako), i nema smisla da se za default stavlja madjarski a opet, zasto madjar ne bi mogao da vidi NS kao Ujvidek? To se postize tako sto svako podesi svoj jezik na kome hoce sve da gleda, a ako neko mesto nema naziv na njegovom jeziku, onda se prikazuje na sluzbenom jeziku
-U ustavu jasno pise http://www.predsednik.rs/mwc/pic/doc/Ustav%20Srbije.pdf
Clan 10
U Republici Srbiji u sluzbenoj upotrebi su srpski jezik i cirilicko pismo.
Sluzbena upotreba drugih jezika i pisama uredjuje se zakonom, na osnovu Ustava.

Znaci u Srbiji svi treba da znaju (bar da citaju) srpski (cirilicu), a sto se ostalih tice, jedino ce onima sa severa bivse jugoslavije znaciti i name:sr-lat (ili kako vec) jer uglavnom ne znaju cirilicu (a ni njima ne treba jer imaju name:hr i ostale)… a svima ostalima je svejedno.
S obzirom da dosta ljudi zna engleski kao strani jezik, to bi moglo da posluzi…
Opet dajem primer kako pretraga na latinici (en) funkcionise savrseno i kad je naziv samo na cirilici: Maksim Gorki, Skopje

Strancima je svejedno da li c ima kukicu, ili ne, a pretraga, a onda verovatno i renderovanje na drugim jezicima nije problem ako je naziv samo na cirilici.

Licno, ne znam zasto uopste postoje dva pisma u srpskom, kada su (sve) zemlje posle raspada Jugoslavije zadrzale samo ono pismo koje su koristile i pre (ako su uopste i uvodile drugo)… A ovo sto vidjamo na televiziji, u novinama itd. je cisto ismevanje sistema (ako on uopste postoji) i to je nacin da nam skrenu paznju sa bitnijih tema.

Treba postovati nacionalne manjine ali i one treba da postuju drzavu i narod koji postuje njih… (30 dana, 30 slova, 30 glasova, znanje za ceo zivot)

@Pedja
Pa valjda će i tih upita koje treba obraditi za ‘sr-Latn’ bisto isto toliko proporcionalno malo, tako da ne vidim neki značajan dodatni teret tu?

Drugo, zaboravljaš da ovo ne radimo samo zbog nas. Postoje i drugi jezici koji koriste više od jednog pisma.

Dalje, otvara zanimljive mogućnosti: generiši mi transkribovanu mapu Grčke, Rusije, Kine, Koreje, itd., što već nije mala stvar.

Treba misliti malo šire, zato i postoji ovaj problem kojeg mi danas imamo. Treba osmisliti OSM i18n platformu da bude fleksibilna i skalabilna.

(Ne kažem da je ovo najbolje, samo igram đavoljeg advokata.)

Bilo bi korisno za diskusiju da pročitaš linkove koji se ljudi trude da ostave kao jasne argumente.

Da, ‘Latn’. Veliko slovo ‘L’. Bez ‘i’. Tako kaže ISO 15924.

Može neki razlog za izmišljanje novog standarda ako međunardno prihvaćen već postoji?

@magnumns:

Procitaj gore pazljivo BCP 47, imas linkove.

Da rezimiram: Da, mora da bude Latn ili Cyrl ili sta god, to je 4 slovna varijabla (znas ono… Char(4)). Preporuka je da language code drzi malim slovima, da se script kapitalizuje iliti da prvo slovo bude veliko, a alfa-2 code drzave pise sve velikim slovima, tacno onako kako je navedeno u primerima koje sam okacio.

Poenta cele ove price je da nema potreba da stvaramo novi standard i izmisljamo rupu na saksiji jer kao sto je kmilos objasnio i pokazao: postoji standard koji je definisan, koji se koristi i koji je zvanican po tom pitanju. Na nama je samo da ga usvojimo.

Engleski ne poznaje padeze, pa samim tim, kao sto si i rekao, nominativ vazi.

Slazem se sa magnumns-ovom argumentacijom u vezi pisma i jezika za nazive i sluzbenog jezika.

@mpele:

Slazem se sa kombinacijom 1 i 2b. Ako treba masina sa koje ce da se tera skripta, imam par sa jacim resursima koje mogu da zaposlim da se bave i ovim poslom. Koliko kapiram iz prethodnih prica, imas neke skripte od ranije koje si koristio, ako zelis mozemo da to postavimo i isprobamo: prvo na ogranicenom test podrucju a onda i sire.

@all / svi ostali:

Jeli ima nekih primedbi na sve ovo do sada? Zamerki? Komentara? Da ostavimo da prelezi/presedi malo?

Не очекујем да ће нам требати било шта са јачим ресурсима, поготову не пар машина. Верујем да бих овај мој телефон могао да натерам да, док у кафани попијем пиво, да одради посао - наравно ако има у близини wireless.
Раније сам направио програм који се ослањао на ЈОСМ за скидање података и слање на сервер док је он сам радио пресловљавање уз контролу корисника. И то је фино радило - Томас је га је користио да обрадио Вршац.

Моја нека визија је да се прво направи плагин за ЈОСМ где би корисници самостално радили а тек касније да се постави нешто за тоталну аутоматизацију.
Видим да постоји плагин за ЈОСМ TagEdit који има основне функције које нам требају (учитава објекте означене на мапи, нуди графички интерфејс за обраду тагова и ради ажурирањ истих), тако да ако му нађемо код за очекивати је да ћемо га прилагодити за оно шта нама треба.

По претходном договору било је напоменуто да се уноси таг name:alt (или нешто слично) док се сада инсистира на name:en. Да ли се дефинитивно одустаје од оног алтернативног наива?

@mpele

Ako te ne mrzi, prosledi mi tu aplikaciju da se malo poigram

Re: name:alt nemam nista protiv. Cak mi deluje bolje nego name:en, jer ce tu ionako cucati celava latinica u vecini slucajeva. A ako bas ima neki specijalan engleski naziv nek ide u name:en (ili kojigod jezik)

@Drazha, @mpele
Zašto bre moram stalno da postrojavam :wink: Nemojte gurati ‘alt’ gde mu nije mesto, ostavimo ‘name:xx’ samo za važeće oznake lokaliteta.

Pedja je verovatno mislio na stari ‘alt_name’? Što se mene tiče može da izumre, ionako je bio namenjen za druge svrhe.

@kmilos: mora neko da postrojava. generalno celavu latinicu koristimo za strance? ili ne koristimo celavu latinicu uopste? either is fine with me

@mpele
Nažalost ja nisam ništa stigao da uradim oko JOSM plugina. Sad malo pogledah, možda ne moramo ni da pišemo Java kod za preslovljavanje:

http://icu-project.org/apiref/icu4j/com/ibm/icu/text/Transliterator.html

@Drazha
Naravno, ćelava latinica u ‘name:en’ i ostale.

@mpele
Da izdvojimo diskusiju oko implementacije ovde: http://forum.openstreetmap.org/viewtopic.php?id=15687

Da se vratimo na ‘name’.

Sve je to lepo, srpski i ćirilicu bi trebalo svi da (barem znaju da) koriste.

Ali postoji nažalost ‘mali’ raskorak između želja i stvarnosti.

Kako mislite npr. mapere iz okoline Preševa i Bujanovca [1] da ubedite da nazive unose prvenstveno ćirilicom?

[1] http://www.openstreetmap.org/?lat=42.3651&lon=21.7112&zoom=12&layers=M

Znači moraćemo da pravimo neke kompromise, tu i na još par mesta.
Pa neka bude onda po principu stanja na terenu, tamo gde su nazivi ulica na Ćirilici pišemo ćirilicu a tamo gde su na latinici koristimo latinicu. Primetio sam da su sve nove table sa nazivima ulica (barem u Nišu i verovatno u Beogradu) ulavnom na ćirilici sada, a nazivi mesta i sela, barem oni stariji, su ili na oba pisma ili na latinici, ovi novi su na ćirilici.