OpenStreetMap Forum

The Free Wiki World Map

You are not logged in.

Announcement

A fix has been applied to the login system for the forums - if you have trouble logging in please contact support@openstreetmap.org with both your forum username and your OpenStreetMap username so we can make sure your accounts are properly linked.

#1 2017-11-08 13:22:19

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Sophox servis

TL;DR
Kliknite ovde, kliknite Play dugme, kad se mapa prikaže ulogujte se na OSM (ako već niste ulogovani) i dobićete fancy poluautomatizovano dodavanje name:sr na svetske gradove! Paziti na ime nije prosta transliteralizacija da ga ne bi revertovali!!!

Zdravo svima,
Znam da postoji vec gomila tema u vezi ovoga, ali otvorio bih novu posto smatram da zasluzuje. Isti problem (name:sr, cirilica, preslovljavanje, provere, povezivanje sa wiki), ali resen na drugi nacin - koristeci SPARQL i Sophox. Napravio sam stranicu ovde koja kontam da treba da bude "zvanični" repo za srpske querije:
https://wiki.openstreetmap.org/wiki/Serbia/Sophox

Ovo su worldwide upiti koji nam mogu biti korisni. Dopunite ako imate ideju sta jos bi mogli da proveravamo. Ako ne znate SPARQL, recite recima sta mislite da treba proveriti, pa da probamo da napisemo SPARQL upit zajedno:)

Pozadina cele price je da pokusavam da posaljem moju Lint skriptu u penziju koristeci Sophox, ali trenutno Sophox ne moze da radi unutar jedne drzave (moze samo da mu das bounding box ili radijus unutar koga treba da nadje nesto). Ako imate ideja kako bi bio dobar boundingbox/circle za Srbiju, recite? Za sada je upotrebljiv samo worldwide i to mi je bila motivacija da napisem ove queryje. Da bi radio na konkretnoj mapi/boundovan na Srbiju, pricam sa Yuri-jem (koji drzi Sophox), pa cemo da pisemo neki SPARQL servis za ovo (Yuri je otvorio bug vec). Ali ideja je da jednog dana imamo par queryja, neke worldwide, neke za Srbiju koji za 2 sekunde rada mogu da nam ukažu na sve greške na mapama!

edit: paziti na https://wiki.openstreetmap.org/wiki/Nam … literation

Last edited by Branko Kokanovic (2017-11-08 18:03:50)

Offline

#2 2017-12-01 14:21:34

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Update:
* Prestao sam da se petljam po svetu sa Sophox-om, očigledno OSM community ne želi transliterizovana imena gradova
* Iskoristio sam Sophox servis (https://wiki.openstreetmap.org/wiki/Serbia/Sophox) i prebacio SVA imena puteva na ćirilicu. Da ponovim - ne postoji više nijedan entitet "highway" u Srbiji koji nije na ćirilici! Dosta sam se mučio sa oshishanom latinicom u nekim gradovima, kao i sa mestima koja nisu imala srpske prevode.

Pogledao bih šta još od low-hanging fruit entiteta ima da se prebaci u ćirilicu, ali sad me više zanima koji nam je plan za imena ulica, ćirilicu, latinicu i sl.

Da li želimo ovakvo imenovanje:
name=Карађорђева
name:sr=Карађорђева
name:sr-Latn=Karađorđeva

Ja bih prošao sa Sophox-om i sredio sve kako treba, ali bih prvo da se konsultujem sa zajednicom šta nam je cilj. Evo pitanja:
* Ako je već ime na ćirilici, da li nam zapravo treba "name:sr". Deluje redundantno? Ako nam ne treba, da ga brišem?
* Da li nam treba "name:sr-Latn"? Nije redundantno kao "name:sr", ali definitivno je "izračunljivo" po potrebi. Možda želimo da ga ostavimo zbog Nomanatima?
* Da li da dodajemo "name:sh" koji bi bio isti kao i "name:sr-Latn"?
* Da li ima smisla da dodajemo ošišanu latinicu na neko polje? Razmišljam da li to može da pomogne Nominatimu i ostalim servisima za pretragu, pošto ja bar tako kucam na telefonu i računaru stvari kad treba nešto naći? Ili da prepustimo tim servisima da brinu o tome? Ima li neko više insight-a kako Nominatim i sl. rade?

Ako se niko ne javi sa predlozima, moj plan je da dodam "name:sr" da bude isto kao "name", da dodam "name:sr-Latn" gde fali i da bude transliterizovano "name", a da ne diram "name:sh".

Offline

#3 2017-12-03 11:17:14

Pedja
Member
From: Užice, Serbia
Registered: 2012-03-22
Posts: 283
Website

Re: Sophox servis

Mislim da je neko već rekao da je ok raditi tako nešto ali samo uz NADZOR. Ne sme se prepustiti skripti da automatski to preuredi a da nakon toga neko ručno ne proveri SVAKU izmenu. Ako se ne radi ručna provera svakog pojedinačnog unosa onda se takve izmene graniče sa VANDALIZMOM.

Drugim rečima, alat koji praviš treba da ti ponudi moguću izmenu ali da se izmena upiše SAMO AKO je ti prethoddno pogledaš, uveriš se da je u redu i potvrdiš.

Iz iskustva, mi smo to već radili sa alatom koji je napravljen za JSOM i koji potuje gore navedeni princip. Pokazalo se da neke ispravke može da uradi samo neko ko je iz lokala i poznaje nazive, pogotovo ako je naziv unet samo ošišanom latinicom pa se ne zna gde ide c, gde č a gde ć i slično.


Da li želimo ovakvo imenovanje:
name=Карађорђева
name:sr=Карађорђева
name:sr-Latn=Karađorđeva

Da.

* Ako je već ime na ćirilici, da li nam zapravo treba "name:sr". Deluje redundantno? Ako nam ne treba, da ga brišem?

Name tag je vrlo diskutabilan i sklon promenama. name:sr je jasno definisan čemu služi. name:sr uvek treba da sadrži naziv zapisan na srpskom jeziku, ćirilicom. name tag sadrži naziv na jeziku i pismu koji se de fakto koristi na terenu. kdo nas to može ali ne mora biti srpski.

* Da li nam treba "name:sr-Latn"? Nije redundantno kao "name:sr", ali definitivno je "izračunljivo" po potrebi. Možda želimo da ga ostavimo zbog Nomanatima?

Treba. Nemaju svi rendering alati mogućnosti ni znanja da konvertuju ćirilicu u latinicu. Njima taj podatak treba da bude dostupan već pripremljen. name:sr-Latn tag uvek treba da sadrži naziv na srpskom jeziku, latinicom.

* Da li da dodajemo "name:sh" koji bi bio isti kao i "name:sr-Latn"?

Kome treba neka ga dodaje. Za naše potrebe u Srbiji, taj tag nije potreban. Štaviše, prema dogovoru kojim je usvojen srpsko-hrvatski jezik, ćirilica i latinica se koriste podjednako, tako da je pitanje koje pismo bi trebalo da ide u name:sh, odnosno da li bi trebalo da idu oba. Pošto se radi o jeziku koji je sada van praktične primene, neka se time bavi neko kome to zatreba.

Što se nas tiče, interesantni su nam name:sr i name:sr-Latn zbog praktične primene, takođe i name:en zbog internacionalne primene a gde god je to moguće i potrebno, treba unositi i nazive na jezicima nacionalnih manjina i drugim jezicima ali to treba da unose ljudi koji te jezike znaju i znaju kako treba unositi nazive.

Treba imati u vidu i da govornici većien velikihjezika mogu sasvim dobro da se snađu sa čiranjem naziva i na lolanim jezicima ako su napisani njima poznatim pismom. U tom smislu srpska latinica je sasvim zadovoljavajuća i ne mora se unositi posebno "ošišana". Ako se već "šiša" sasvim je dovoljno uraditi to u, na primer, name:en.

Moj lični stav je da je dovoljno pepisati iz name:sr-Latn u name:en bez ikakvog "šišanja" jer se tako omogućava da ako neko renderuje mapu na engleskom jeziku, za teritoriju Srbije na mapi dobije prihvatljivo napisane latinine nazive, odnosn urpavo onakve kakve će nalaziti na tablama.

Offline

#4 2017-12-03 11:18:30

Pedja
Member
From: Užice, Serbia
Registered: 2012-03-22
Posts: 283
Website

Re: Sophox servis

Vidi https://forum.openstreetmap.org/viewtopic.php?id=15687

Diskusija je obimna ali je treba pročitati od početka do kraja.

Last edited by Pedja (2017-12-03 11:19:17)

Offline

#5 2017-12-03 12:12:44

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Hvala na brzom odgovorima! Ne znam da li si ispratio prethodnu temu, ali tamo sam već pisao o tome kako skripta radi. Definitivno ne radi ništa automatski, već te pita šta želiš da uradiš. Ima ovde više detalja. Uostalom, pogledaj izmene koje je bot pravio (tj. ja pod botom:)), ne bi trebalo da ima nekih grešaka. Diskusiju koju si naveo sam naravno pročitao, još pre nego što sam počeo da radim moju skriptu!

Jedino nisi bio konkretan kod name:en (u smislu da li treba tu ošišana latinica ili ne). Ne znam da li tu bot uopšte može da pomogne. Npr. jasno mi je šta bi bio name:en za "Nehruova", ali nisam pametan šta bi bio name:en za "Улица Џорџа Вашингтона". Jel "Ulica Džorža Vašingtona", "Ulica Dzordza Vasingtona", "Džordža Vašingtona street" ili "George Washington street"?:) Mislim da bot ne sme da dira name:en, jer 1) već sam viđao svašta za name:en po Beogradu (bar), 2) ne znam koji bi algoritam bio i 3) treba istražiti šta se radilo po Evropi generalno za ovo pre nego što diramo name:en, nije ovo problem specifičan za Srbiju. Ako tu imamo neki konzensus, i bot to može da "izračuna", mogu da ga uposlim, ali za sada "ne bih ja tu ništa dirao":)

Moje pitanje za ošišanu ćirilicu nije bilo toliko za name:en, koliko za podršku za alate. Gomila ljudi koristi Nominatim, GeoNames, OsmAnd+ (posredno ili neposredno) i očekuje (bar ja očekujem!) da kada uneseš "dzordza vasingtona" da ti nađe tu ulicu. Najtužniji primer je TomTom aplikacija za Android koja ne može da ukapira ni "Backa" da je "Bačka", a kamoli primer sa Vašingtonom iznad. Ne želim da OSM to ne može da uradi. Pitanje je više dakle bilo:
* Da li očekujemo/pretpostavljamo/ostavljamo teret aplikacijama da razlučuju naša slova i da li mislimo da najveći servisi i aplikacije to danas već rade (npr. šta koristi OsmAnd+ ispod, ili CycleMaps za naming servis, ja nemam pojma!)
* Da li bismo teorijski mogli da im "pomognemo" ako bismo imali name:sr-Oshishana (nebitno je ime sad)? Ovde sad ja pretpostavljam da naming servisi (Nominatim, GeoNames) koriste sve dostupne name:* tagove da razluče ime? Možda grešim?

U prvom slučaju, nemamo šta da radimo, samo da imamo dobar name:sr-Latn. U drugom, treba da dobro razmislimo...

Offline

#6 2017-12-04 10:45:36

mpele
Member
Registered: 2012-02-25
Posts: 197

Re: Sophox servis

Branko Kokanovic wrote:

* Da li očekujemo/pretpostavljamo/ostavljamo teret aplikacijama da razlučuju naša slova i da li mislimo da najveći servisi i aplikacije to danas već rade (npr. šta koristi OsmAnd+ ispod, ili CycleMaps za naming servis, ja nemam pojma!)

Бранко,

Да ли си знао да мапе Србије за OsmAnd генеришу хрвати (као и иначе за цео балкан). Ја сам им предлагао да користе наш плагин JOSM_transliterate за генерисање и ћириличне и латичничне верзије мапе, али није било интересовања са њихове стране.
Иначе, генерисање прилагођене мапе је релативно просто.

И додао бих да се за комерцијалне програме типа TomTom ја не бих узбуђивао.

Offline

#7 2017-12-04 11:26:42

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Nisam znao, ali lepo za znati. Da li imaš neku referencu gde popričati sa njima/gde je source za generisanje mapa, možda je prosto kao dopisati im logiku u generisanje/normalizovanje?

Inače, ne bih rekao da je problem "njihov", evo na primer probajte da tražite "djakovacka" i na nominatimu i na geonames - nema rezultata:( Štaviše, kad sam malo kopao, shvatio sam da nema name:sr-Latn dodat za naš jezik. Tako da mi sad više nije jasno ni ko consume-uje name:sr-Latn tag (osim što ga Nominatim uzima, pošto prosto uzime sve "name:*" tagove, a inače i "name:sr-Latn" bi mogao da se zove i "name:mali-perica")? Sad se igram sa Nominatim normalizacijom, da vidim da li je lakše rešiti problem sa normalizovanjem "ђ" i "џ" u "dj" i "dz" u tom kodu ili da prosto dodajemo alt_name. Možda alt_name reši i OsmAnd, why not? Tako da - ja bih prvo da počistimo naše dvorište; ako Nominatim i GeoNames ne mogu da rade sa "djokovacka", to je naš problem, ni OsmAnd-ov, ni hrvatski:) Tako da - trenutno pokušavam da vidim Nominatim da sredim. Nekako mi rešenja sa generisanjem custom mape (ako je OsmAnd, CycleMaps i sl. ne bi koristili!) nisu interesantna, pošto jednostavno ne rešavaju osnovni problem. Ako postoji opcija da OsmAnd koristi našu mapu, da se uglavimo u njihov deployment proces, recite.

Ne uzbuđujem se ni ja za TomTom, samo dajem primer lošeg user experience-a:)

Offline

#8 2017-12-04 11:44:36

mpele
Member
Registered: 2012-02-25
Posts: 197

Re: Sophox servis

Branko Kokanovic wrote:

Ako postoji opcija da OsmAnd koristi našu mapu, da se uglavimo u njihov deployment proces, recite.

Процес генерисања мапе и није нешто посебан:

1. Скинеш pbf за Србију: https://download.geofabrik.de/europe/serbia.html
2. Пресловиш како желиш
3. Стартујеш генерисање мапе са OsmAndMapCreator https://wiki.openstreetmap.org/wiki/OsmAndMapCreator
4. Видиш са OsmAnd да се твоје мапе нађу на серверу https://download.osmand.net/list.php

Цео процес се на мом старом рачунару (сем задње тачке) завршавао за 15так минута.

Све се лако да урадити кроз једну скрипту која би могла да се стартује једном недељно.

Offline

#9 2017-12-04 11:46:44

Pedja
Member
From: Užice, Serbia
Registered: 2012-03-22
Posts: 283
Website

Re: Sophox servis

Pravila su vrlo jasna:

name=Карађорђева улица
name:sr=Карађорђева улица
name:sr-Latn=Karađorđeva ulica

i (po meni)

name:en=Karađorđeva ulica


Ko iz toga ne prikazuje ili ne nalazi nazive kako treba, to je njegov problem. Ne možemo menjati pravila da bi ih prilagodili nekome ko ih ionako ne poštuje.

Offline

#10 2017-12-04 12:22:42

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

mpele wrote:

...
Све се лако да урадити кроз једну скрипту која би могла да се стартује једном недељно.

Hvala @mpele, upravo to što mi je trebalo! Bacam se na to čim vidim ovo za Nominatim.

Pedja wrote:

Ko iz toga ne prikazuje ili ne nalazi nazive kako treba, to je njegov problem. Ne možemo menjati pravila da bi ih prilagodili nekome ko ih ionako ne poštuje.

Ne shvatam baš šta si hteo da kažeš? Niko ne postavlja ovde pitanje "name", "name:sr" i "name:sr-Latn" tagova i da li njih treba menjati (odgovor je naravno ne). Pitanje je sledeće - mali Perica hoće da pređe da koristi OSM, čuje da postoji neki tamo OsmAnd i otkuca "djakovacka" (kao ja juče) i ne nađe ništa. Šta će on da pomisli o OSM-u? Džabe sav trud svih ljudi, džabe što ta ulica postoji i što je mapirana, kad zbog "dj" on ima utisak da je OSM/OsmAnd neupotrebljiv. Ne kažem da treba da promenimo "name:sr" u "djakovacka", da me ne razumeš pogrešno:) Samo smatram da je ovakav user experience loš za OSM i OSM Srbija. I da treba korisnicima da napravimo što ugodnije korišćenje, naročito ako se problem može svesti na tehnički problem. A može! I probaću da vidim šta može da se uradi u tom pravcu, pa javljam:)

Offline

#11 2017-12-05 10:34:17

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Update: shvatio sam šta je problem sa nominatimom. Ispod se svi nazivi normalizuju u latinicu i kad se nešto pretražuje, to se isto normalizuje i onda se tako traže stvari. Problem uopšte nije veliki kao što sam mislio i dešava se samo u situacijama kada imamo i "đ" i "č/ć" u istoj reči (kao što je to bio primer sa đakovačkom). Napravio sam issue na githubu - pogledajte tamo normalizaciju, ali ne očekujem da to može tako lako da se promeni (jer nije srpski jedini koji koristi ta slova). Mislim da je bolje rešenje da dodamo alt_name sa našom normalizacijom na ulice koje imaju "đ" i "č/ć" (dakle alt_name:Djakovacka) - ne verujem da će biti mnogo ovakvih slučajeva, a ja ću ovaj bug ubaciti u bota da se proverava. Da objasnim sa druge strane pošto može da bude konfuzno - jedini razlog zašto ne vidimo još problema je što imamo i ćirilicu i latinicu i to dosta pomaže Nominatimu - da imamo samo ćirilicu ili samo latinicu, bilo bi mnogo više ulica i gradova koje ne bismo mogli da nađemo:) Ako pretpostavimo da imamo oba (a imamo i JOSM plugin i ovo moje čudo), onda se problem vidi samo kada su prisutni i "đ" i "č/ć". Mislim da su nam braća "ugroženija", pošto imaju samo latinicu i tamo svaki entitet sa "đ" ne može da se traži sa "dj", tako da ću im javiti.

Kad wrap-ujem ovo, bacam se na OsmAnd generisanje

Offline

#12 2017-12-06 07:14:19

Pedja
Member
From: Užice, Serbia
Registered: 2012-03-22
Posts: 283
Website

Re: Sophox servis

Branko Kokanovic wrote:
Pedja wrote:

Ko iz toga ne prikazuje ili ne nalazi nazive kako treba, to je njegov problem. Ne možemo menjati pravila da bi ih prilagodili nekome ko ih ionako ne poštuje.

Ne shvatam baš šta si hteo da kažeš? Niko ne postavlja ovde pitanje "name", "name:sr" i "name:sr-Latn" tagova i da li njih treba menjati (odgovor je naravno ne). Pitanje je sledeće - mali Perica hoće da pređe da koristi OSM, čuje da postoji neki tamo OsmAnd i otkuca "djakovacka" (kao ja juče) i ne nađe ništa. Šta će on da pomisli o OSM-u? Džabe sav trud svih ljudi, džabe što ta ulica postoji i što je mapirana, kad zbog "dj" on ima utisak da je OSM/OsmAnd neupotrebljiv. Ne kažem da treba da promenimo "name:sr" u "djakovacka", da me ne razumeš pogrešno:) Samo smatram da je ovakav user experience loš za OSM i OSM Srbija. I da treba korisnicima da napravimo što ugodnije korišćenje, naročito ako se problem može svesti na tehnički problem. A može! I probaću da vidim šta može da se uradi u tom pravcu, pa javljam:)

Nemoj me shvatiti kao matoro zakeralo smile

Radi se o tome da mi editujemo BAZU. Princip je da se u bazu ne stavlja nešto što je izračunljivo.

Ošišana latinica je izračunljiva. Ćak i OSM ne preporučuje da se u bazu upisuju nazivi koji su samo preslovljeni (http://wiki.openstreetmap.org/wiki/Name … literation), štaviše postoje alati koji umeju da rade preslovljavanje.

E sad, tako gledano ne bi trebalo da imamo ni name:sl-Latn u bazi jer je to takođe izračunljivo, tako da smo uvođenjem name:sl-Latn već prekršili princip. smile

Slažem se da je preslovljavanje u ošišanu latinicu potrebno prilikom pretrage i tu je razlika u odnosu na name:sr-Latn koji je potreban i radi prikaza. U našu odbranu, razlika je i u tome što je preslovljavanje iz srpske ćiirilice u srpsku latinicu stvar samo srpskog jezika, naša interna potreba pa taj problem moramo da rešavamo sami.

Preslovljavanje u ošišanu latinicu je šira potreba i može se kao pravilo primeniti i na druge jezike, ali se slažem da je to i naš problem, jer zaista postoji realna potreba da neko ukuca naziv ošišanom latinicom i nađe to što je tražio i dobro bi bilo da to radi sa svakim alatom bez posebnog prilagođavanja (iz istog tog razloga mi i koristiomo name:sr-Latn za latiničnu verziju srpskog jezika).

Tako gledavši, ima smisla očekivati da alati za pretragu mape znaju da bilo koji naziv iz bilo kog jezika preslove u kako oni to zovu romanizovanu latinicu (a mi je zovemo ošišana latinica) i da se negde mogu podesiti pravila takvog preslovljavanja za svaki jezik. Nisu mi poznati detalji oko toga ali mislim da takvi alati postoje, tako da bih ja prvi tu gledao kako da se reši stvar, odnosno kako da se ti alati nauče da preslovljavaju srpski u ošišanu latinicu. Pogledaj http://blog.gegg.us/2013/09/ i https://github.com/giggls/mapnik-german-l10n.

U tom smislu to što prokušavaš da rešiš kroz Nominatum je verovatno bolji način, jer možda će i oni da ukapiraju (ako već nisu) da to nije samo problem srpskog jezike nego svakog jezika koji sadrži znakove koji nisu latinični ili su razičiti os skupa znakova latinskog jezika. Probaj da im to tako i predstaviš, da problem nije samo sa srpskim jezikom već širi i da ako već nisu, valjalo bi da negde postoji mogućnost da se definiše mapiranje iz bilo kog jezika u latinsku abecedu.

Kad smo to pomenuti, treba imati u vidu da verovatn postoji potreba i da se radi automatsko preslovljavanje u takozvani mašinski oblik. On je na primer primenjen u latinizovanju zapisa naziva u međunarodnim dokumentima, na rimer pasošima. Postupak je vrlo sličan "šišanju" latinice samo što pravila nisu ista i dobijeni rezultat nije namenjen za prikazivaje ljudima već da se svaki naziv po unapred jasno utvrđenim pravilima može prevesti u latinizovani oblik radi lakše računarske obrade (pretrage na primer).

Uzgred budi rečeno, postoji i potreba za obrnutim proceosm, da se latinični naziv preslove u druga pisma, jer kao što mi imamo problem što neko može da u pretrazi ukuca "djakovacka" isto takо neko može da ukuca "џорџ таун". Problem je suštinski isti. Al da ne širimo temu pošto ga mi rešavamo pešačkim putem, preslovljavanjem i upisom u name:sr tag.

Ako se ne može postići da alati za pretragu automatski preslovljavaju u ošišanu latinicu, onda ne preostaje ništa drugo do da se ošišani oblik upiše u bazu. Najlogičniji način je da se uvede tag koji je upravo tome namenjen, ali je to i najmanje zgodno rešenje jer opet zahteva da se alati prialgode da znaju da korsite taj tag. Zgodnije je upotrebiti neki od postojećih tagova ali je pitanje koji.

Meni je na prvi pogled logično da se upotrebi int_name ali mi nije baš jasno da li je to pravi izbor. Sama namena taga nije baš nešto podrobno opisana i moguće je da ga negde neko upotrebi i za nešto drugo. Sklon sam da mislim da ako je neko upotrebio ovaj tag za nešto drugo, da je pogrešio. Ipak mogu da zamislim jednu problematičnu situaciju: da li u int_name upisati Beograd ili Belgrade?

Druga opcija je alt_name koji si pomenuo ali tu treba malo gimnastike, jer alt_name se može koristiti i za druge namene pa je moguće da neki naziv već ima alt_name iz svim drugog razloga. Međutim dobra stvar je što je u alt:name moguće upisati više varijanti, sa ';' kao separatorom (otuda je potrebno malo gimansitke, ako alt_name već ima neki sadržaj, onda ošišanu latinicu treba dodati a ne prepisati preko postojećeg). Kažu da nije baš preporučljvo ali je dozvoljeno.

U svakom slučaju ako se ošišana latinica upiše u int_name ili alt_name verovatno će svi postojeći alati da to vide pa će pretraga da radi.

Nije loše istražiti kako su taj problem rešili sa drugim jezicima koji originalno ne koriste latinicu, grčkim, kineskim, japanskim, ruskim...

Offline

#13 2017-12-06 07:21:35

Pedja
Member
From: Užice, Serbia
Registered: 2012-03-22
Posts: 283
Website

Re: Sophox servis

Samo da dodam da je za Београд (https://www.openstreetmap.org/relation/2728438) int:name Beograd a alt_name nije ni definisano i meni je to dovoljno da zaključim da je int_name prihvatljivo rešenje za ošišanu latinicu.

Last edited by Pedja (2017-12-06 07:21:52)

Offline

#14 2017-12-06 11:00:39

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Nemoj me shvatiti kao matoro zakeralo:)

Jok, a moguće je i da sam stariji od tebe:)

E sad, tako gledano ne bi trebalo da imamo ni name:sl-Latn u bazi jer je to takođe izračunljivo, tako da smo uvođenjem name:sl-Latn već prekršili princip. smile

Ne brinem se o izračunljivim stvarima. Za pola dana ih možemo dodati i izbrisati po potrebi:) Drugo, principi su uvek lepa stvar, ali kod baza (ako pričamo sad tehnički) postoji i nešto što se zove denormalizacija, gde namerno ostavljaš nešto duplirano zato što ti je lakše posle da ga vadiš. That being said, znajući sad kako Nominatim radi, mislim da, da nemamo name:sr-Latn, ne bi mogli više od 50% stvari da nađemo (zato što je "ч", "ћ" i sl. stavljeno da budu "ch", "tsh", a i ostala slova su slična i imanje latinice nas ovde "vadi"). Tako da, ima razloga zašto želimo da ostavimo latinicu, čak iako je izračunljiva.

Kad smo to pomenuti, treba imati u vidu da verovatn postoji potreba i da se radi automatsko preslovljavanje u takozvani mašinski oblik...

OK, nisam znao za ovo, ali ovo je upravo ono što radi Nominatim (a ja nisam umeo da objasnim najbolje:). "Č" postaje "C", a "Ч" postaje "ch" i tu je uzrok problema sa pretragom.

Meni je na prvi pogled logično da se upotrebi int_name ali mi nije baš jasno da li je to pravi izbor.

Meni se sviđa predlog! Prodato!:) alt_name i nije za ovo, ako ćemo pravo, bolje ga je koristiti stvarno za alternative (tu mislim "Jurija Gagarina"=>"Gagarinova" i ostale kreativne transformacije koje imamo na ovim prostorima>), int_name mi ima više smisla!

Samo još jednom da naglasim dve stvari:
1. ovo bi stavljali samo tamo gde imamo kombinacije "đ" i "č/ć" u imenu, što pretpostavljam da je jako retko, tako da tag int_name treba da bude slabo popunjen (tj. samo tamo gde ima potrebe, ne bih svuda da stavljamo u njega romanizovanu latinicu!) Nemam još tačno brojke na koliko bismo ga mesta teorijski stavili, pošto trenutno pokušavam da stavim name:sr-Latn (dodam ga tamo gde ga nema i ispravim ga tamo gde je pogrešan) i to je baš zeznut i pipav posao (pravopisne greške, popunjeno ćirilicom, stara imena ulica...), tako da se javljam kada završim to.
2. pošto planiram da ovu proveru za "int_name" (ako se dogovorimo za to) stavim u skriptu, onda imamo teorijski na dnevnom nivou provere koje skripta pljuje na sajtu (trenutno je đubre tamo pošto radim sad na tome:). To znači da odmah znamo ako se pojavi nova ulica sa "đ" i "č/ć" u imenu, kad nam neko izmeni int_name u nešto što nije romanizovana latinica od name i sl. da ne davim sad

Offline

#15 2017-12-16 20:02:33

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Update: proverio sam jos jednom i problem je samo slovo Đ. Tako da bih ja sad krenuo i stavljao "int_name" da bude romanizovana latinica, tamo gde već nije postavljen, i to samo na one entitete koji imaju slovo Đ u name:sr-Latn tagu. Evo ga upit koji ih pronalazi i koji može čak i da predloži romanizovani int_name tag. Imamo da dodamo int_name na nekih 2300 entiteta.

Derite se ako neko ima nesto protiv! Bacam se na ovo ovih dana.

edit:reword

Last edited by Branko Kokanovic (2017-12-16 20:13:22)

Offline

#16 2017-12-16 22:17:34

Pedja
Member
From: Užice, Serbia
Registered: 2012-03-22
Posts: 283
Website

Re: Sophox servis

Može li ovaj tvoj program nekako da pomogne da se ubrza unošenje srpskih naziva na Kosovu i Metohiji?

Offline

#17 2017-12-16 22:22:11

Branko Kokanovic
Member
Registered: 2017-10-02
Posts: 22

Re: Sophox servis

Možda je pre za posebnu temu, ali nije ovaj program magičan - sve što može JOSM Transliterator, može i on. Ako treba da prespe iz šupljeg u prazno i algoritamski nešto unese/izmeni/izbriše, onda može. Ako ta informacija ne postoji, naravno da ne može on da je izmisli. Koliko ja znam, za Kosovo nemamo podatke ni na Wikiju ni na WikiDati, pa da prespemo bar odande imena (iako ne bi trebali). Ako imaš konkretno šta da se uradi, reci, lako se u ovom programu napiše novo pravilo koje se može poluautomatski primeniti, ali ne znam šta

Offline

Board footer

Powered by FluxBB