Preslovljavanje (Transliteration)

Правопис не познаје категорију приватне својине. Он је прилично једноставан: како ће се назив или лично име писати зависи само од воље онога ко га записује у датом тренутку и у датом документу где се записује. Не постоји начин да се било ко позове на својину, ауторско право, заштиту имена или сличним методама утиче на начин писања. Управо су то код нас покушали Мајкрософт и још неке велике светске компаније - хтели су да се позивом на заштићено име обезбеде да се називи фирми увек пишу изворно. Није им успело јер је то противно нашем Уставу и другим прописима.

Код нас још и добро пролазе јер ми користимо и латиницу али у Русији на пример, све се пише ћирилицом.

Мени се ипак чини да постоји разлика. name је подразумеван приказ у функцији простора на коме се приказује. name:int је приказ који се примењује интернационано невезано за простор.

Na svu sreću, ni ‘fixme’ ni ‘note’ nemaju neke predviđene i propisane vrednosti, zato sam ih i izabrao. :wink:

Ovo mi nikako nema smisla. To znači da u ‘name:sr’ mogu da trpam i kinesko pismo, arapsko, itd.? Onda ‘name:sr’ oznaka po meni gubi svaki smisao jer mi ne garantuje da je u njoj sačuvano nešto na srpskom jeziku (i ćirilici).

Upravo o ovim izuzecima i pričamo. Ako brendirani naziv nečega nije prihvatljivo transkribovati na ćirilicu i tako koristiti stalno (iz bilo kog razloga, dovoljna je želja vlasnika brenda), onda nema svrhe imati ‘name:sr’ za taj objekat. Inače dolazimo u situaciju da prikazujemo transkribovani naziv na mapi umesto izvornog, suprotno želji vlasnika brenda.

@Pedja
Kao što Drazha ili mpele jednom reče, Internet ne poznaje Ustav R. Srbije, niti Pravopis.

Možemo da se dogovorimo da ih poštujemo kada je god to moguće za svrhe mapiranja teritorije Srbije i to za one objekte za koje je to neupitno, ali će nažalost uvek biti izuzetaka nad kojim ta dva dokumenta nemaju nikakvog uticaja, jer je nadležnost nad virtuelnom teritorijom u najmanju ruku upitna.

Danas sam nastavio sa čitanjem pravila OSM (mnogo komplikovano brate) i između ostalog tamo stoji da se što se tiče korišćenja jezika i pisma primenjuju lokalna pravila. To upravo znači da treba da primenjujemo pravila koja važe za srpski jezik.

По мени, не узимајући у обзир оправданост због машинске обраде, ово је најбоље решење. После много написаних речи, чини ми се са се моје и Пеђино мишљење усагласило: name:sr не мора да буде чиста ћирилица и увек се попуњава, називи фирми на страним језицима се пишу на оригиналу и name је копија name:sr.

Дражо, како ти видиш рад са плагином? Шта он треба да ради и у чему се то разликује од тренутне верзије?

Објаснићу моју визију рада са плагином/ботом.

  1. Плагин проналази објекте међу даунлодованим објектима где се користи таг name и

  2. онда одлучује да ли има потребе да се раде неке иземене
    а) ако треба предлаже измене
    б) ако не онда игнорише тај објекат.

  3. Бот проналази објекте у дневној копији базе за Србију где се користи таг name и

  4. онда одлучује да ли има потребе да се раде неке иземене
    а) ако треба испитује да ли је безбедно пресловљавање (да ли је можда двосмислено)
    i) ако је безбедно сам га мења
    ii) ако није шаље га на лектуру
    б) ако не онда игнорише тај објекат. (овде можда постоји потреба за помоћним тагом)

Е сад, главни недостатак тренутног рада са плагином је што се мора прво преузети сви подаци неког региона и онда да се на њима стартује плугин. Са само оваквим приступом постоји велика вероватноћа да многа места и делови места никада неће доћи на пресловљавање док ће друга бити под сталним ударом. Узгред, ефикасност оваквог рада је мала гледано са количине пренетих подата.

Главна функција бота је тачка 2. а) ii), односно слање на лектуру. То би подразумевало генерисање већег броја фајлова са ограниченим бројем објеката за које је процењено да је потребна измена али није безбедно да то бот сам одради. Фајлови би били преузимани са нашег централог сервера и отварани у ЈОСМ и онда обрађивани са плагином. Број објеката по фајлу би био ограничен јер постоји могућност да је неки од објеката већ мењан што би довело до краха аплоада и пропасти целог посла.
Ефикасност оваквог приступа је неупоредиво већа од преузимања неке области и њене анализе, цела област Србије би била једнако покривена и у случају неких измена/нових уноса сутрадан би се тај објекат појавио у листи за измену (ажурност).

Видећу да се организујем и направим малу демонстрацију рада са ботом још колико вечерас.

@Pedja
Ako ćemo već da se strogo držimo pravopisa,

name:sr=железничка станица Ужице

nikako ne ide, treba početi velikom slovom (isto i za ‘Apoteka Melem’, ‘Pekara Joca’, itd.). Inače važi i ‘fakultet dramskih umetnosti’, ‘srpska akademija nauka i umetnosti’, i sl., što svakako nije tačno.

A kad smo već kod ovog primera, barem se železničke stanice prikazuju sasvim korektno u svim alatima, tako da je taj predmetak suvišan.

P.S. Mod bi mogao možda diskusiju vezanu za pravopis da izmesti u novu nit.

Ja bih da vas podsetim da se tagovi trenutno raspravljaju na forumu Nazivi. Bez obzira na to sta je lakse za bota, i plugin, moraju se postovati dogovori.
Ako imate predlog kako da prilagodimo dogovor botu, predlozite u Nazivi. Ako ima nesto sto je nemoguce uraditi u pluginu, a trenutno vazi kao dogovor, mapomenite i to.
Vazno je da sve informacije vezane za standardizaciju tagova budu na jednom mestu, i to ce ubrzati dogovaranje.

Drugo, ponovo, name:sr je vezan za srpski jezik, i cirilicu. U primeru skywalker, koristi se jezik koji nije srpski. U tom slucaju, vazi Vukovo fonetsko previlo, pisi kao sto govoris. Za razliku od srpskog, u hrvatskom se strani nazivi pisu u originalu (ne znam kako je kad nije latinica), i cini mi se vasi argumenti baziraju na ovom pravilu.
Ne radi se o tome sta se meni vise svidja, nego o gramatici i pravopisu koji su jasno definisani davnih dana, a mi treba da ih primenjujemo…

Jos jedan preblog za bota/plugin:
Ako je naziv moguce napisati cistom cirilicom, bez dvoumljenja.
Korisniku je dovoljno da unese jedan tag, a on automatski da se prekopira i preslovi. To bi mogao da bude name tag, i samo ako je sve cisto, da automatika odradi name:sr i name:sr-Latn. Ne znam kakav je algoritam za rimske brojeve… Da li je to moguce?

Погледајте http://mpele.co.cc/osm/ . Ово је излаз који даје бот.

Фајлови који имају екстензију osc могу да се шаљу директно на сервер у простој петљи користећи osmosis. Њих има око 1500.
Фајл pregled.txt представља преглед измена у osc фајловима где се види вредност тага name као и тага name:sr и новог и старог (ако га има).

Фајлови који имају екстензију osm представљају груписане објекте од по 100 за учитавање у плагин. Дакле, преузмите фајл, учитајте га у ЈОСМ, исправите шта желите и пошаљите на сервер. Да напоменем да је могуће да ЈОСМ ништа не приказује на екрану ако су улице у питању па је пре стартовања плагина потребно све означити са CTRL-A . Ових фајлова има око 150. Ако ово заживи направиће се систем где ће се у току једног дана само једном један фајл моћи да се преузме.

Ово је демонсрација како би се допуњавали плагин и бот. За конкретну реализацију се чека само наш договор шта желимо.

Samo na brzaka da se javim, malo sam u guzvi ovih dana.

Kako je name:sr skracenica za name:sr-Cyrl-RS onda je apsolutno besmisleno da se pise bilo sa sem cirilice u taj tag. Ako se ne varam, Pedja je iskucao detaljno na temu pravopisa, pa bi to sve mozda trebalo da izgleda ovako:


name:sr=Печењара Скајвокер
name:sr-Latn=Pečenjara Skajvoker (Skywalker)
name=Pečenjara Skywalker
name:en=Skywalker roastery

E sad, argumentacija drage uvazene kolege…
name:sr je jasno, sve mora na cirilici po Vuku
name:sr-Latn isto tako, sve na latinici, sprskoj ako cemo tako, po Vuku, stim sto sad dozvoljavamo ono iz pravopisa sto je Pedja pomenuo, da stavimo taj originalni naziv u zagrade.
Skywalker se pise Skywalker, ne Skywallker, ako mislimo na isto :wink:
name je tako kako jeste jer ga je tako (nepismeni?) gazda nazvao pa original, koliko god da je los, mora da se ispostuje
name:en je samo po sebi jasno… stim sto u sustini nije roastery, vec bakery… al to je sad najmanje bitno.

Na ostale upite cu odgovoriti kad budem mogao da sastavim sat vremena na miru :slight_smile:

BR//D.

Pre nego sto nastavis sa odgovorima, zar nije name:sr-Latn samo preslovljena verzija name:sr, bez dodataka?
I bakery je pekara a ne pecenjara…

Zar ne bi bilo lakse da se u slucajevima kada jezik u name nije srpski, ili je kombinacija, a nije u interesu vlasnika da se drugacije pise (ime brenda), da se ostavi samo name. Nema potrebe dodavati bilo koji drugi tag, jer se taj brend tako predstavlja.
Nas ne zanima koji je jezik ako nije cisto srpski, mi treba da ostavimo original, a vlasnik ako hoce, nek stavi drugacije (bez obzira na jezik). U njegovom je interesu da ljudi lako prepoznaju brend, a u nasem da se lako snalazimo na karti, i omogucimo koriscenje interneta na nasem jeziku… U ostalom, to je poenta svega ovoga…
Mesanje stranih i domacih reci, na razlicitim pismima, nikako ne pomaze.
Kada bi rasprevljali zasto je firmama pogodnije da se zovu na drugim jezicima, a ne na srpkom, odlutali bi od sustine (interesi su razliciti)…

Primer, LukOil se pre predstavljao latinicom, a presli su na cirilicu… A u Rusiji se svi predstavljaju na ruskom ukljucujuci i McDonalds (MakDonalds na cirilici)…

@magnumns: Pazi, postoji ono sto je formalno, pravopisno i gramaticki tacno. A postoji i ono sto je nama najlakse da uradimo, pogotovu sa stanovista programiranja, i automatizacije iste.

Za 10 godina zivota po britanskim i irskim ostrvima nigde nisam video “roastery” :slight_smile: Best case scenario je bio bakery… Ali to je zato sto oni neznaju sta je dobro pecenje! :slight_smile: Da ne zapocinjem temu kako su se Irci cudili kad smo kupili jedno prase, zaklali ga ni krivo ni duzno na sred livade i bacili na razanj… Em sto oni ne kolju prasice i telad, jer je to njima “waste of meat” em sto jedva sastave nedelju dana lepog vremena da mogu da se propisno bave rostiljem. Nego, to je sve malo off-topic.

Ako primetis… napisah:


name=Pečenjara Skywalker

ergo, ispostovali smo vlasnika i njegovu zelju da se napise to u originalu.

u…


name:sr=Печењара Скајвокер

ima samo cirilice… dakle nema mesanja pisama…


name:sr-Latn=Pečenjara Skajvoker (Skywalker)

je napisano po Vuku i prema pravopisu koji to dozvoljava je napisano u originalu (u zagradama) jer je pismo kojim je pisano isto… mada neko moze da argumentuje da W ne postoji u srpskoj latinici…

Rusi su… rusi… i oni nek rade sta se njima radi i sta se njima radi… Bolji primer za uporedjivanje bi bila Bugarska ili Makedonija… Rusa ima 300 miliona (ili koliko god) a nas… voleli mi to ili ne, mnogo manje.

Imamo Pravopis… ili pravopis… koji je donekle fleksibiliniji na ovu temu nego sto je bio ranije, tako da… teraj Misko!

Сви примери које сам дао су исправни и што се нас тиче, чак и није битно који начин записивања ће нек да изабере. То треба сотавити ономе ко у конкретном случају уноси конкретан податак.

Оно што нама јесте битно, то је даља машинска обрада, а за све рпимере могућа је и то по истим правилима, што додатно показује да нам је облик који ће неко да изабере приликом уписа да изабере.

Према правопису треба малим словом а може и великим јер то “железничка станица” није део званичног имена.

Слажем се, да се нам се мало забрљале дисксуије јер о истом причамо на вишеместа. Ево о Ппавопису сам покренуо засебну тему http://forum.openstreetmap.org/viewtopic.php?id=16031 али би било добро да се и тамо не дискусује него да се наводе конкретна правила. Ако треба да се дискутује о правопису, згодније је покретати посебне теме.

Што се тиче писања општих појмова као што су “железничка станица”, “апотека”, “извор”, “биоскоп”, “полицијска станица”, мало сам гледао како се то ради на ОСМ и видим да има разних приступа. Генерално, то треба писти за сваки објекат где тип не мора да једнозначно одреди врсту објекта. З друге случајеве, ја не видм проблем да се то упише јер нису баш ретки случајеви да се карте рендерују ан начин да није лакиз симбола протумачити о ком објекту се ради па је ту текст од велиек помоћи. Штавише неки катографски системи често и неприказују све називе на самој акрти али ако се оначи објетак могу се видети детаљи. Ово је нарочито битно за орјетнацију и кретање на терену. Мислим да би о томе како се рендерује наив требало да одлучи онај ко рендерује карту а не онај ко уноси.

Ако је ово тема за дискусију и то ваља наставитиу другој теми, да не разводњавамо.

Правопис то дефинише мало другачије. Није као што је устаљено мишљење. Покренуо сам тему за Правопис где сам издвојио шта Правопис каже на ту тему.
Конкретно, није искључено да се у ћириличном запису појаве и латинична имена.

Боље је користити name:sr таг јер је он једнозначно намењен запису српском ћирилицом.

Римски бројеви се преписују. Они важе и у ћириличном писању. Колико сам видео и у другим земљама су имали сличне проблеме када су вишејезични записи у питању и решење им је било да се окану name тага као основе. Користе тагове за језике а у name иде оно што се договори.

Мени је ово ок, мада могао би да рецимо ставиш линк ка OSM сајту тако да се измена може урадити директно на њему. То би ишло брже.

Бот би можда могао даима базу податак у позадини у коју би уписао све што је кроз њега прошло и у км статусу (шта он сам исправио, шта је неко ручно исправио, шта треба да сеисправи…).

Не бибило лоше и кад бисмо могли да некако преузмемо те обејкте које треба исправити директно из ОСМ или макар да ихгрупишемо па преузмемо више њих одједном. Ко ће се бактати са свикм појединачно.

Чак, можда је најједнотанвије, с обзиром да се ради о оедитовању тачно познатих тагова да бот омогући једноставну форму за упис и да он директно пошаље измене у ОСМ?

Али није тако. ПРавопси каже да код првог писања имена ако се пише ћирилицом уз ћирилични облик се може у заграде ставити и облик на изворном писму.

Тако је “name:sr=Печењара Скајвокер (Skywalker)” врло исправно а уједно задовољава све стране које су заинтересоване укључујући и Правопис, осим стране која инсистира да ту буде само ћирилица.

А уз то, директно омогућава и ово:

… да name:sr-Latn заиста буде директно пресловљено name:sr без икаквих компликација а чак се задржава и изворно писање имена. Ово одозго би постало “name:sr-Latn=Pečenjara Skajvoker (Skywalker)” што је, и даље и по правопису, и има српски назив и има оригиналан назив. Дакле, све што се тражи је испуњено.

Не би ваљало. За сваки назив треба да стоји таг на језику у коме се тај назив корсити који прикатује како се он пише у том језику. name само приказује подразумевани испис и он не одређује језик и писмо.

Видео сам на ОСМ вики да је ово и другима проблем. Тамо где псотоји само наме а ради сео језичком изузетку, рендеровање мапа постаје проблем јер тада рендерер мора да зна локална језичка правила.

Мислим да је баш незгодан пример био у Енглеској где имају исто области у којима се локално користе различити језици и имају праву збрку јер не могу да одреде који је језик употребљен у name тагу.

А ово што ја предлажем је и правописно исправно, и садржи све потребне информације и најлакше је за аутоматску обраду.

Да ли сам добро разумео - предлажеш да се направи веб интерфејс за измену тагова?

Бот не може да зна шта је неко радио у плагину, а добар део ће морати да прође кроз људске руке.

Изгледа да нисам био јасан. На серверу су два типа фајлова izmena152_d.osc и lektura123.osm . Први тип представља појединачну измену коју би бот сам послао на ОСМ сервер (http://www.openstreetmap.org/user/preslovljavanjeBot/edits?page=1) а други су груписани 100 објеката за које је бот проценио да треба изменити а он то не може сам да одради.

U jednostavnijoj formi ne, nego samo da das link ka OSM gde vec ima editor i sve sto treba, samo treba da se usmeri na konkretan objekat koji terba editovati.

U boljoj formi, da. Ali ne neki komplikovan editor nego najosnovija forma za popunjavanje tih nekoliko jezickih tagova pa da bot sam to upise u OSM bazu.

Aha, ovo sam prevideo. To je ok.

Ne bi bilo loše da plugin osm i osc datoetke razdvoji u dva direkorijuma. Biće preglednije.

Par komentara za plugin:

Valjalo vi da oznaci slogove da bi se moglo razlikovati:

  • koje je slogove sam menjao ali to treba proveriti
  • koji slogovi po njemu ne sadrže dobre unose
  • koje je slogove korisnik menjao ispravljajući ih
  • koje slogove treba proveriti (to su oni koji nemaju neki drugi status)

Kada korisnik upiše podatak u tag name:sr trebalo bi da se automatski ažurira name:sr-Latn a i name, prema podešavanju “Podrazumevano pismo”.

Još jedna stvar, prilikom unosa, valjalo bi da program proverava da li je trenutni unos ispravan, na primer tako da upozori ako korisnik ukuca ćirilični znak u tag gde može biti samo latinica. Može mnogo da pomogne oko grešaka sa slovima koja izgledaju isto u ćirilici i latinici. Lako se zeznuti u prebacivanju tastature sa jednog na drugo pismo pa može da seukuca negde pogrešno.

Valjalo bi da može da se iz plugina pokrene gugl pretraga po sadržaju taga. Može dosta da pomogne kada se edituju nazivi ulica u mestima koje ne poznajemo. Ja sam već naišao na neke slučajeve da sam morao da potražim ulicu preko gugla da vidim kako se tačno zove jer ono što je bilo upisano nije bilo tačno ali nisam bio siguran kako treba.

Malo je nezgodno što se ulice ne vide pa se radi napamet.

Može li da se polje na kome je kursor učini više izraženim? Često počnem unos a kursor mi na pogrešnom polju. Generalno, pravilo je da ako se korsinik po tabeli može kreati po poljima onda ne treba da se označava ceo slog tako da to izgleda važnije od polja. Važnije je da se vidi u kom je polju korisnik. Ne znam kakve su mogućnosti ove java tabele ali bi bilo dobro ako bi se slog označio kvačicom na početku sloga (ili da ceo red bude blago zasivljen) a da polje na kome je kursor bude plavo. To je neki ustaljen standard.

Valajlo bi da može da se sadržaj polja/sloga vrati na vrednost koja je bila pre nego što ju je korinsik poeo menjati, za slučaj da greškom izmeni sadržaj.

Može li da se ceo slog zaedituje da ne mora svako polje posebno da se edituje pa upiše? Smara i usporava unos.

Bilo bi dobro da za slog piše redni broj da se vidi koliko još ima da se radi :slight_smile:

Kad se krene sa unosom mora da se završi unos svih objekata, jer plagin ih sve odmah izmeni. Ne može da se srdi deo pa da se pošalje na OSM samo sređeni deo jes JOSM ne zna koje je objekte menjao plagin a koje korisnik.

Bitno!,Kada se skine osm koji je bot napravio, obavezno uraditi update pre izmena, jer taj OSM može da sadrži zastarele podatke u tagovima.

I još malo komentara

Malo me zbunjuje učitavanje objekata. Izaberem Podrazuemvano pismo ĆIRILICA i kliknem učitaj sve. Plagin učita neke podatke i koliko vidim sam pokuša da namesti tagove. Nakonnjega prođemja kroz tabelu i unesem ispravke. Izađem, pošaljem na OSM.

Zatim uđem ponovo i kad aponovim učitavanje, ne dobijem nijedan slog. To plagin zakquči da je sve u radu i ne prikaže mi nšta? To znači dami plagin prikazuje samo one objekte za koej on misli da ih treba srediti?

Primetio sam jedna objekat koji mi plagin nije prikazao da ga sredima treba da ga sredim. Jedna ulica je u ćiriličnom nazivu imala З umesto Ж. Plagin je, izgleda, zakqučio da pošto je sve ćirilica, unos je u redu iako nije.

Bolje bi bilo da plagin uvek učita sve selektovane objekte, a da označi šta misli da je u redu, šta je on isravio i šta da treba korisnik da ispravi. Korisnik treba da pregleda sve i da utvrdi šta je ispravno odnosno da popravi šta treba da se popravi. Korisniku može da se stavi dodatna opcija da filtrira prikaz prema tom statusu ili čak da sve štoje plugin ispravio jednim klikom proglasi da je u redu.

Kada se završi ispravljanje, plagin treba da upiše izmene samo u one objekte koji zaista jesu promenjeni: oni koje je promenio plagin a promene je potvrdio korisnik i one koje je korisnik promenio. Ostali objekti treba da ostanu neizmenjeni čak i ako plugin misli da su neispravni. Ako korsinik ponovo otvori plagin ponovo će videti sve slogove, samo će njihovi statusi biti drugačiji, jer oni koji su u međuvremenu izmenjeni, sada će biti ispravni, pa će korisnik moći da nastavi izmene na onim slogovima koji su i dalje neispravni.

Što se tiče jezičkih tagova, mislim da redosled treba da bude:

name:sr
name:sr-Latn
name
name:en

jer se najčešće unosi name:sr a osalo bi trebalo da se izgeneriše na osnovu njega.

Negde ukomentarima procitah da se name:en samo prikazuje ali ne menja. Zato ne? Onaj ko sređujenazive ako zna kako terba da seime zapiše naengleskom jeziku treba da može to i da popravi. Ja sam recimo video imena ulica gde su ispustena slova, permutovana, slova, upisane skracenice i slicno. To treba da se popravi u svim tagovima a ne samo nasim.

Ako korisnik ne zna kako naziv treba da se upiše na engleskom jeziku, onda ga neće ni dirati, ostaviće kako jeste.

Pored engleskog, mislim da treba predvideti tagoe za još nekoliko jezika koji su kod nas u nekoj meri službeni. Ovaj alat može da bude veoma koristan za unos naziva i na tim jezicima. Ovi tagovi mogu da ostanu prazni, pa na izlasku, plagin njih neće ni podešavati u datim objektima.

Već sam pomenuo u ranijoj poruci, valjalo bi omogućiti automatiku da se izvrši na pojedinačnom slogu u toku unosa. Ako korisnik unese ispravno name:sr od toga može da se automatski generiše name:sr-Latn i name a i name:en. To bi mnogo ubrzalo sređivanje. Ne mora automatika da se automatski pokreće, dovoljno bi bilo da korisnik može da aktivira da se automatski srede ostala polja u slogu na kome je trenutno.

Можеш ли да ми даш пример линка?

Крајњи корисник (лектор) ће имати само приступ osm фајловима и то на такав начин да се спречи да се један фајл може преузети више пута у току једног дана (једном дневно би се обрађивао дневна копија базе Србије). Фајлови osc би се после слања на сервер брисали и они би били невидљиви за лекторе.

Коментари су углавном на свом месту и углавном су били у плану, али за почетак мени је проблем да осмислим сам радни прозор плагина. Како приказати табелу са старим вредностима тагова, са новим вредностима тагова и још по нечим а да то буде прегледно и практично. Могу ли ту да добијем педлоге?

База на којој је радио бот је стара преко недељу дана ( имам ограничен проток а сада је крај месеце :frowning: ). Због овога ће бити ограничен број објеката у једном фајлу па ће евентуална штета бити мања ако се задеси такав случај.