OpenStreetMap Forum

The Free Wiki World Map

You are not logged in.

#1 2010-05-13 16:15:20

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Теги: стандартизация и исправление ошибок.

С одной стороны, формат OSM допускает наличие каких угодно, в том числе "авторских" тегов.
С другой - как только возникает потребность тем или иным способом использовать накопленные данные, появляется вопрос о конвертации в какой-либо формат и, следовательно, сведение произвольных тегов в стандартные типы, применяемые в том или ином приложении.
Одновременно с тем стандартизация позволяет находить ошибки, а их среди данных OSM достаточно много.
Не так давно провел статистику по используемым тегам, пока только по ключевому слову. Оказалось по России (данные от 23 апреля) почти 800 тегов, причем добрая половина из них встречается в ЕДИНСТВЕННОМ экземпляре, что для 3.5 Гбайт информации (всего обработано 594622 тегов) выглядит, мягко говоря, странно.
В основном, естественно, уникальные теги - следствие ошибок (как орфографических, так и путаницы ключа и значения). Но встречается немало и явно странных тегов, например "game:...".
Статистику приведу в конце сообщения (если влезет), а пока приведу еще небольшой файлик, сделанный из станички ссправки
http://wiki.openstreetmap.org/wiki/RU:Map_Features
Сам файл:
http://slil.ru/29127684
можно просматривать любым XML-радактором или вьюером.
Ну а теперь отчет о частоте тазличных тегов (номер по порядку / сколько раз встретился / сам тег):

   1       5 "randomjunk_bot"
   2   32739 "highway"
   3    4405 "crossing"
   4    5489 "barrier"
   5    9046 "railway"
   6     711 "crossing_ref"
   7     549 "layer"
   8    1955 "bicycle"
   9  120447 "name"
  10    1247 "traffic_sign"
  11    2019 "foot"
  12     556 "motorcar"
  13    1401 "alt_name"
  14   10033 "name:en"
  15    1402 "wikipedia"
  16     338 "wikipedia:en"
  17     295 "name:fi"
  18     183 "old_name"
  19      13 "hgv"
  20     361 "fixme"
  21     213 "horse"
  22     388 "motorcycle"
  23    1223 "traffic_calming"
  24    3548 "tourism"
  25    1687 "historic"
  26    1839 "note"
  27    5635 "is_in"
  28      56 "name:pl"
  29   67680 "place"
  30     713 "population"
  31     101 "noexit"
  32     535 "access"
  33      89 "name:hr"
  34    9357 "name:ru"
  35      12 "name:uk"
  36     639 "aeroway"
  37     279 "closest_town"
  38     911 "ele"
  39     114 "iata"
  40     203 "icao"
  41      27 "name_1"
  42    3824 "operator"
  43    1947 "type"
  44      58 "capital"
  45    5617 "int_name"
  46      64 "is_in:continent"
  47    4898 "name:be"
  48      16 "name:cs"
  49     573 "name:de"
  50       7 "name:el"
  51      17 "name:es"
  52      19 "name:eu"
  53       6 "name:fa"
  54      12 "name:he"
  55      12 "name:hu"
  56       6 "name:is"
  57      17 "name:lv"
  58      14 "name:nl"
  59      80 "name:sk"
  60      74 "name:sl"
  61       3 "nat_name"
  62       2 "old_name:be"
  63   25542 "addr:country"
  64   23734 "addr:district"
  65   25985 "addr:postcode"
  66   25065 "addr:region"
  67   24692 "cladr:code"
  68   24830 "cladr:name"
  69   24815 "cladr:suffix"
  70      15 "name:sv"
  71      13 "is_in:city"
  72    1182 "is_in:country"
  73      33 "name:lt"
  74     143 "website"
  75       2 "alt_name:fi"
  76       4 "name:se"
  77    1797 "cladr:note"
  78       1 "name:krl"
  79      27 "comment"
  80     258 "area"
  81      34 "boundary"
  82       1 "game:patrizer2:bier"
  83       1 "game:patrizer2:eisenerz"
  84       1 "game:patrizer2:felle"
  85       1 "game:patrizer2:fleisch"
  86       1 "game:patrizer2:holz"
  87       1 "game:patrizer2:honig"
  88       1 "game:patrizer2:leder"
  89       1 "game:patrizer2:pech"
  90       1 "game:patrizer2:ziegel"
  91   34927 "amenity"
  92      13 "name:et"
  93       9 "name:la"
  94     202 "is_in:country_code"
  95       7 "name:pt"
  96       3 "old_name:de"
  97      43 "postal_code"
  98      19 "alternate_name"
  99    1387 "is_in:county"
 100    1384 "is_in:municipality"
 101      12 "old_name:en"
 102       1 "old_name:pl"
 103     185 "network"
 104     560 "description"
 105      86 "admin_level"
 106       4 "address:a3"
 107       4 "address:type"
 108       2 "alt_name:vi"
 109      13 "name:da"
 110      10 "name:it"
 111       6 "name:vi"
 112       3 "official_name:ru"
 113       1 "watch:Aleksandr_Dezhin"
 114      26 "place_name"
 115       2 "alt_name:sl"
 116       1 "old_name:sk"
 117      10 "name:chm"
 118      13 "name:eo"
 119      16 "name:fr"
 120      12 "name:no"
 121       4 "name:udm"
 122       1 "wikipedia:de"
 123       3 "watch:Aleksandr Dezhin"
 124       1 "alt_name:sk"
 125       6 "name:tat"
 126       3 "name:ba"
 127       2 "wikipedia:sl"
 128       4 "name:mn"
 129       1 "island"
 130    1112 "denomination"
 131    1489 "religion"
 132       4 "name:yi"
 133       8 "gns:ufi"
 134     277 "url"
 135       1 "freight"
 136       4 "official_name:en"
 137    1380 "is_in:province"
 138     427 "source:population"
 139    1096 "teryt:rm"
 140    1098 "teryt:simc"
 141    1096 "teryt:stan_na"
 142    1103 "teryt:terc"
 143     680 "teryt:updated_by"
 144       3 "old_name:"
 145    1659 "ref"
 146    4006 "addr:city"
 147       6 "is_capital"
 148    3737 "addr:housenumber"
 149    4131 "addr:street"
 150       4 "mooring"
 151     540 "leisure"
 152     370 "sport"
 153       1 "name:ab"
 154       9 "name:ka"
 155      23 "is_in:state"
 156       8 "alt_name:en"
 157   10503 "shop"
 158     331 "fee"
 159     513 "parking"
 160     277 "dispensing"
 161       1 "AND_nodes"
 162     451 "landuse"
 163    1308 "man_made"
 164     935 "opening_hours"
 165    4706 "natural"
 166       4 "divider"
 167      29 "junction"
 168      13 "addr:streetnumber"
 169       3 "name_old"
 170     183 "station"
 171     185 "transport"
 172     143 "tunnel"
 173     314 "waterway"
 174      38 "abandoned"
 175       1 "is_in:fi"
 176    1356 "shelter"
 177       9 "emergency"
 178      16 "official_name"
 179       2 "addr:suburb"
 180    1397 "building"
 181       4 "name:cv"
 182      15 "name:ja"
 183       5 "name:ko"
 184      25 "name:zh"
 185       4 "name:af"
 186       6 "name:ar"
 187       8 "name:ca"
 188       6 "name:id"
 189       4 "name:lb"
 190       2 "name:ms"
 191       3 "name:nn"
 192       2 "name:oc"
 193       7 "name:ro"
 194       2 "name:scn"
 195       4 "name:sr"
 196       5 "name:tr"
 197       3 "name:bg"
 198       2 "name:pam"
 199   12874 "power"
 200      18 "power_source"
 201       8 "name_2"
 202      78 "loc_name"
 203     236 "maxspeed"
 204       2 "name:csb"
 205       2 "name:cu"
 206       1 "name:cz"
 207       2 "name:io"
 208       6 "name:kv"
 209       2 "name:os"
 210       5 "name:sah"
 211       2 "name:tl"
 212       2 "name:war"
 213      55 "addr:housename"
 214     461 "fuel:diesel"
 215     396 "fuel:octane_91"
 216     206 "fuel:octane_95"
 217      63 "fuel:octane_98"
 218       1 "name:mis"
 219      13 "geomorphology"
 220       4 "name:ce"
 221       1 "name:jp"
 222       8 "construction"
 223       2 "is_in:krai"
 224     772 "atm"
 225      27 "source:name"
 226      12 "wheelchair"
 227     245 "fuel:lpg"
 228       1 "name_old:be"
 229       2 "name:ua"
 230       1 "inat_name"
 231      14 "city_served"
 232       5 "gns:ADM1"
 233       5 "gns:DSG"
 234       5 "gns:UFI"
 235       5 "gns:UNI"
 236       9 "name:zh_pinyin"
 237      19 "status"
 238      29 "fuel:cng"
 239       1 "oldname"
 240     132 "service"
 241      44 "fuel:octane_80"
 242       4 "toll"
 243       3 "capital_city"
 244       3 "country_code_fips"
 245       3 "country_code_iso3166_1_alpha_2"
 246       2 "geonames:id"
 247       1 "name:als"
 248       1 "name:am"
 249       1 "name:an"
 250       1 "name:ang"
 251       1 "name:arc"
 252       1 "name:ast"
 253       3 "name:az"
 254       1 "name:bat-smg"
 255       1 "name:bcl"
 256       1 "name:bn"
 257       1 "name:bpy"
 258       3 "name:br"
 259       1 "name:bs"
 260       1 "name:bxr"
 261       1 "name:ceb"
 262       1 "name:chr"
 263       1 "name:crh"
 264       3 "name:cy"
 265       1 "name:de_CH"
 266       1 "name:diq"
 267       1 "name:dsb"
 268       1 "name:dv"
 269       1 "name:dz"
 270      14 "name:ee"
 271       1 "name:fiu-vro"
 272       1 "name:fo"
 273       1 "name:frp"
 274       3 "name:fy"
 275       3 "name:ga"
 276       3 "name:gd"
 277       1 "name:gl"
 278       1 "name:gn"
 279       1 "name:gv"
 280       1 "name:hak"
 281       3 "name:haw"
 282       1 "name:hi"
 283       1 "name:hif"
 284       1 "name:hsb"
 285       1 "name:ht"
 286       2 "name:hy"
 287       1 "name:ia"
 288       1 "name:ie"
 289       1 "name:ilo"
 290       1 "name:jbo"
 291       1 "name:jv"
 292       1 "name:kg"
 293       4 "name:kk"
 294       1 "name:kn"
 295       1 "name:ku"
 296       1 "name:kw"
 297       1 "name:ky"
 298       3 "name:li"
 299       1 "name:lij"
 300       1 "name:ln"
 301       1 "name:mk"
 302       1 "name:ml"
 303       1 "name:mr"
 304       1 "name:mt"
 305       1 "name:na"
 306       1 "name:nah"
 307       1 "name:nds"
 308       1 "name:nds-nl"
 309       1 "name:ne"
 310       1 "name:new"
 311       1 "name:nov"
 312       1 "name:pih"
 313       1 "name:pms"
 314       1 "name:pnb"
 315       1 "name:ps"
 316       1 "name:qu"
 317       1 "name:rm"
 318       1 "name:rmy"
 319       1 "name:roa-rup"
 320       1 "name:sa"
 321       1 "name:sco"
 322       1 "name:sh"
 323       1 "name:simple"
 324       1 "name:sq"
 325       1 "name:sw"
 326       1 "name:szl"
 327       1 "name:ta"
 328       1 "name:te"
 329       1 "name:tg"
 330       3 "name:th"
 331       1 "name:tk"
 332       1 "name:tpi"
 333       3 "name:tt"
 334       1 "name:ug"
 335       1 "name:ur"
 336       1 "name:uz"
 337       1 "name:vec"
 338       1 "name:vo"
 339       1 "name:wo"
 340       1 "name:wuu"
 341       1 "name:xal"
 342       1 "name:zh-min-nan"
 343       1 "name:zh-yue"
 344       3 "official_name:be"
 345       2 "official_name:br"
 346       3 "official_name:el"
 347       3 "official_name:es"
 348       3 "official_name:et"
 349       3 "official_name:id"
 350       3 "official_name:lt"
 351       2 "official_name:lv"
 352       3 "official_name:pl"
 353       2 "official_name:pt"
 354       2 "official_name:sk"
 355       3 "official_name:sv"
 356       3 "official_name:vi"
 357       2 "watch:hakan"
 358      37 "supervised"
 359       1 "software"
 360       7 "restriction"
 361      17 "direction"
 362      77 "moor"
 363       6 "seamark"
 364      26 "food"
 365       2 "denomination:ru"
 366     549 "cuisine"
 367       4 "description:be"
 368     148 "bridge"
 369      87 "fuel:octane_92"
 370      52 "military"
 371       2 "OKATO"
 372     144 "attribution"
 373     144 "koatuu"
 374       1 "denomination:fi"
 375       2 "kadastr:ru"
 376       3 "name:su"
 377     503 "phone"
 378       1 "source:highway"
 379       4 "oneway"
 380     140 "address:postindex"
 381       5 "cargo"
 382      33 "vehicle"
 383      13 "route"
 384       1 "name:sms"
 385       1 "old_name:fi"
 386      43 "aerialway"
 387       1 "name_engl"
 388       2 "point"
 389       1 "place_numbers"
 390      19 "wikipedia:ru"
 391       4 "alternate_name:en"
 392      13 "uic_ref"
 393     111 "garmin:extnode"
 394     101 "information"
 395      14 "fuel:propane"
 396       7 "floor"
 397       1 "old_name:ru"
 398      29 "last_eruption"
 399       2 "ont_name"
 400       5 "bus_routes"
 401     106 "capacity"
 402       1 "name_3"
 403       2 "is_in:country_ru"
 404      53 "internet_access"
 405      68 "tower:type"
 406      50 "FIXME"
 407       4 "addr:state"
 408       3 "place:en"
 409       2 "is_in:town"
 410       3 "date"
 411       1 "abbr_name"
 412      33 "garmin_type"
 413       1 "peak"
 414       4 "fuel:HGV_diesel"
 415       1 "drivein"
 416       4 "lock"
 417       1 "covered"
 418       1 "fuel:gasoline"
 419       6 "waste"
 420       1 "moped"
 421       2 "religion:ru"
 422       7 "charge"
 423      71 "payment:telephone_cards"
 424      17 "addr:full"
 425       1 "name:in"
 426       1 "ent_name"
 427     197 "route_ref"
 428      43 "key"
 429       1 "private"
 430       8 "building_entrance:auto_open"
 431      16 "gns:dsg"
 432      16 "gns:uni"
 433       2 "name_alt"
 434       1 "name_old:ru"
 435      13 "border_type"
 436      10 "fuel:biogas"
 437      21 "disabled_spaces"
 438      17 "address"
 439       1 "warehouse2"
 440       1 "boat"
 441       6 "goods"
 442       1 "motorboat"
 443      10 "psv"
 444       7 "noname"
 445      11 "payment:coins"
 446       7 "payment:notes"
 447       1 "vending"
 448       5 "alt_name:ru"
 449       5 "description:ru"
 450      77 "location"
 451       1 "currency"
 452       1 "postcode"
 453       1 "description:pl"
 454      10 "castle_type"
 455      10 "ruins"
 456       2 "loc_name:ru"
 457      35 "traffic_sign:forward"
 458       2 "bus"
 459       9 "motor_vehicle"
 460      18 "traffic_sign:backward"
 461      60 "image"
 462      17 "_name"
 463      18 "building:levels"
 464      13 "piste:type"
 465       2 "addr:building"
 466       2 "addr:floor"
 467      20 "country"
 468     150 "telephone"
 469      25 "notes:official"
 470      25 "source:fi"
 471      25 "source:no"
 472       6 "iso_3166_2"
 473       4 "is_in:sea"
 474       1 "unesco_world_heritage_site"
 475      41 "stars"
 476       1 "is:country_code"
 477       2 "is_in:ocean"
 478       1 "name:tyv"
 479       6 "is_in:mountain_range"
 480       1 "books"
 481       1 "polulation"
 482       1 "name:EN"
 483     109 "label"
 484      26 "fireplace"
 485       2 "adm2"
 486       1 "old"
 487       1 "name:mo"
 488       1 "source:old_name"
 489       2 "name:mhr"
 490       5 "lanes"
 491      40 "mountain_pass"
 492       3 "fuel:disel"
 493      33 "brand"
 494       5 "email"
 495       6 "fax"
 496      27 "public_transport"
 497      26 "subway"
 498       8 "wifi"
 499       4 "okato:rule"
 500       5 "depth"
 501      31 "material"
 502      16 "fuel:octane_76"
 503       1 "value"
 504       1 "artist_name"
 505      12 "artwork_type"
 506       2 "vechicle"
 507     339 "bench"
 508       7 "contact:email"
 509       6 "fuel:octane"
 510      11 "addr:phone"
 511       5 "recycling:cans"
 512       6 "recycling:glass"
 513       5 "recycling:paper"
 514       3 "recycling:scrap_metal"
 515       1 "hsv"
 516       1 "name:mrj"
 517       5 "car"
 518       7 "disused"
 519       1 "name:trans"
 520       1 "truck"
 521      80 "wpt_description"
 522      99 "wpt_symbol"
 523      17 "kiosk"
 524       1 "voltage"
 525      14 "bunker_type"
 526       1 "wikipedia:etn"
 527       3 "payment:electronic_purses"
 528       8 "wood"
 529       2 "addr:interpolation"
 530      21 "name_int"
 531       2 "site"
 532       1 "index"
 533       1 "school"
 534       2 "name:local"
 535       4 "local_name"
 536       1 "traffic"
 537       1 "historical"
 538       2 "traffic_signals"
 539      15 "quality"
 540       1 "official_name:fr"
 541       1 "official_name:it"
 542       1 "wikipedia:fr"
 543       2 "name:by"
 544       1 "official_name:af"
 545       1 "official_name:ca"
 546       1 "official_name:lb"
 547       1 "official_name:sl"
 548      51 "number"
 549       7 "contact:phone"
 550     168 "surface"
 551       1 "name:old"
 552      39 "height"
 553      37 "name:botanical"
 554       1 "tower"
 555       7 "bus_stop:side"
 556    1407 "species"
 557       1 "wikipedia:lt"
 558       5 "living_street"
 559       2 "openfire"
 560       2 "tents"
 561       1 "type:fi"
 562       1 "fuel:propan"
 563       3 "hour_off"
 564       3 "hour_on"
 565       3 "address:country"
 566       1 "x-point-id"
 567       1 "open_hours"
 568       3 "so"
 569       1 "incline"
 570      10 "transport stop"
 571       3 "operator:ru"
 572       1 "fuel:methanol"
 573       3 "narrow"
 574       3 "piste:difficulty"
 575       1 "omkum:code"
 576       1 "dogs"
 577      28 "trolley_wire"
 578       1 "wikipedia:pl"
 579       8 "source:url"
 580       1 "fenced"
 581       1 "passengers"
 582       1 "note:route"
 583      11 "office"
 584       2 "room"
 585       1 "poi"
 586       1 "description:en"
 587      38 "tactile_paving"
 588       3 "full_name"
 589       1 "priority"
 590       2 "operator:en"
 591       3 "lat"
 592       3 "lon"
 593      98 "source_ref"
 594       9 "capacity:disabled"
 595       4 "capacity:parent"
 596       5 "capacity:women"
 597      40 "park_ride"
 598       4 "recycling:clothes"
 599       1 "name_en"
 600       1 "fiel:lpg"
 601       1 "drinking_water"
 602      91 "heating"
 603      92 "toilets"
 604      11 "description:fi"
 605       1 "garmin:extnodge"
 606       1 "_сladr:code"
 607       1 "recycling:glass_bottles"
 608     297 "Время"
 609       3 "passing_places"
 610       1 "closed"
 611       1 "reconstruction"
 612       1 "game"
 613       2 "level"
 614       5 "traffic_signals:sound"
 615       1 "сladr:note"
 616       1 "building:use"
 617       2 "maxheight"
 618       3 "fuel"
 619       3 "zoo"
 620      21 "colour"
 621       1 "name:int"
 622       2 "route_ref:trolleybus"
 623     162 "smoothness"
 624      25 "lit"
 625       1 "zip"
 626       1 "seamark:light:1"
 627       1 "seamark:light:2"
 628       1 "seamark:light:3"
 629       1 "seamark:light:4"
 630       1 "seamark:light:character"
 631       2 "drinkable"
 632       1 "pump"
 633       1 "bank"
 634       3 "undefined"
 635       2 "map_type"
 636       1 "Участковый"
 637       1 "gate:open"
 638       1 "Гагарина"
 639       1 "tel"
 640       1 "man_mand"
 641       2 "function"
 642       1 "female"
 643       1 "male"
 644       1 "power_rating"
 645       3 "resource"
 646       3 "recycling:batteries"
 647     595 "addr:settlement"
 648       3 "adm_name"
 649       1 "note:ru"
 650       1 "
name"
 651       1 "name:be-tarask"
 652       2 "mtb:description"
 653       1 "name_loc"
 654       1 "phone2"
 655       1 "phone3"
 656       3 "e-mail"
 657      32 "bus_ruz_net_id"
 658       1 "alt_name:chm"
 659       2 "marked_trail_yellow"
 660      15 "aera"
 661       3 "marked_trail_black"
 662       1 "marked_trail_red"
 663       1 "marked_trail_green"
 664       1 "gate"
 665       1 "communications_transponder:service"
 666       1 "tower:construction"
 667       3 "is_in:region"
 668      17 "backrest"
 669     134 "sourcedb:id"
 670       9 "sourcedb:type"
 671       6 "landsat:id"
 672       1 "pedestrian"
 673       6 "display"
 674       6 "support"
 675       6 "visibility"
 676       9 "branch"
 677       1 "maxspeed:practical"
 678       2 "denominatons"
 679       1 "sorting_name"
 680       1 "diplomatic"
 681       7 "target"
 682       1 "is_in:okrug"
 683       1 "subsea"
 684       1 "notes"
 685       1 "levels"
 686       1 "node"
 687       2 "маршруты"
 688       3 "note2"
 689       1 "Bogoyavleniye"
 690       2 "fuel:e10"
 691       3 "fuel:e85"
 692       1 "Лесоарк"
 693       1 "№"
 694       2 "Автобусы"
 695       2 "Маршрутки"
 696       2 "Тралейбусы"
 697       1 "name2"
 698       2 "schelter"
 699       2 "примечание"
 700       8 "board_type"
 701       3 "guide"
 702       3 "website_description:faq"
 703       3 "website:faq"
 704       2 "Picture"
 705       1 "denjmination"
 706       1 "custom"
 707       1 "Custom code"
 708       2 "is_in:district"
 709       1 "denomination_"
 710       1 "name_"
 711       1 "name:en_"
 712       1 "religion_"
 713       1 "bus_road"
 714       2 "fuel:octane_93"
 715       1 "cladr:namt"
 716       1 "addr:"
 717       1 "restruktion"
 718       2 "turning_point"
 719       1 "дом 59"
 720       2 "mam_made"
 721       1 "addr:сountry"
 722       1 "addr:ru"
 723       1 "shop:ru"
 724       2 "whitewater"
 725       1 "hiking"
 726       1 "map_size"
 727       2 "Школа ДОСААФ"
 728       1 "power_sourse"
 729       1 "отделение милиции Хабаровск-2"
 730       8 "verified"
 731       8 "www"
 732       1 "harbour"
 733       1 "harbour:category"
 734       1 "harbour:entrance:LAT"
 735       1 "harbour:entrance:LON"
 736       1 "harbour:name"
 737       1 "harbour:namenational"
 738       1 "harbour:phone"
 739       1 "harbour:size"
 740       1 "harbour:web"
 741       1 "crane:mobile"
 742       2 "thermometer"
 743       1 "addr:suffix"
 744       1 "game:patrizier2:eisenerz"
 745       1 "game:patrizier2:felle"
 746       1 "game:patrizier2:fisch"
 747       1 "game:patrizier2:getreide"
 748       1 "game:patrizier2:hanf"
 749       1 "game:patrizier2:holz"
 750       1 "game:patrizier2:honig"
 751       1 "game:patrizier2:wolle"
 752       2 "Summer residences"
 753       1 "reklama"
 754       1 "reklama_type"
 755       1 "
website"
 756       1 "alt"
 757       3 "backerst"
 758       2 "water"
 759       1 "wate"
 760       1 "cafe"
 761       1 "naturism"
 762       1 "Калi ласка"
 763       1 "internet_acess"
 764       1 "sportbar"
 765       1 "opening"
 766      14 "muuseum_id"
 767       1 "recreation:health"
 768       2 "code"
 769       2 "frequency"
 770       7 "barier"
 771       1 "name:short"
 772       8 "speedlimit"
 773       1 "EHAK:countycode"
 774       1 "note:ee"
 775       1 "free"
 776       1 "gateway"

Offline

#2 2010-05-13 16:48:23

KekcuHa
Member
From: Moscow
Registered: 2008-05-26
Posts: 607
Website

Re: Теги: стандартизация и исправление ошибок.

andriano, тут как недавно трудно выясняли: в российской части ОСМ всё делается "фо фан", написанное в вики абсолютно ничего не значит, массовые правки приравниваются в вандализму, а так же что порядка тут никогда не будет.

По теме:
Ошибочно написание тегов еще можно исправить, но что делать с некорректными применением тегов? Тут без безоговорочного принятия стандартов не обойтись.

Offline

#3 2010-05-13 16:57:23

liosha
Member
From: Moscow
Registered: 2008-03-04
Posts: 8,446
Website

Re: Теги: стандартизация и исправление ошибок.

KekcuHa, не поверишь, но нормы есть всегда и везде.
Они сами собой как-то возникают и устанавливаются.
И даже когда они не записаны в вики, и даже когда они "фо фан".

Offline

#4 2010-05-13 17:26:10

KekcuHa
Member
From: Moscow
Registered: 2008-05-26
Posts: 607
Website

Re: Теги: стандартизация и исправление ошибок.

liosha wrote:

KekcuHa, не поверишь...

Не поверю.
Проверял лично, стандартов в данных нет ни в чем.

Offline

#5 2010-05-13 17:49:39

liosha
Member
From: Moscow
Registered: 2008-03-04
Posts: 8,446
Website

Re: Теги: стандартизация и исправление ошибок.

Если бы их не было, было бы не 10% "белого шума", а 100%  smile
Сам посмотри первый пост и сравни количество общепринятых тегов с количеством левых.

Offline

#6 2010-05-13 17:56:00

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: Теги: стандартизация и исправление ошибок.

Вот и интересно, что делать с этими "левыми" тегами?
Стоит их тем или иным путем пытаться исправлять или нет?
Стоит ли пытаться создать какой-либо справочный материал, в котором бы были исключительно "правильные" теги?
Если "да", то нужен ли он в открытом доступе?
Нужна ли автоматизированная правка баз OSM для приведения новых (а на первом этапе - и старых) правок в соответствии с этим справочным материалом?

Offline

#7 2010-05-13 18:00:43

Aleksandr Dezhin
Member
From: Msk
Registered: 2008-05-25
Posts: 2,109
Website

Re: Теги: стандартизация и исправление ошибок.

andriano wrote:

Нужна ли автоматизированная правка баз OSM для приведения новых (а на первом этапе - и старых) правок в соответствии с этим справочным материалом?

Конечно нет! Максимум что можно, так это опечатки править. Но это вроде уже делают давно.


[ Проверка границ и НП | Дампы | Валидатор рек | Кое-что ещё ]
- Нет! Не надо пытаться. Делай. Или не делай. Не надо пытаться. (c) Йода

Offline

#8 2010-05-13 18:01:52

liosha
Member
From: Moscow
Registered: 2008-03-04
Posts: 8,446
Website

Re: Теги: стандартизация и исправление ошибок.

Явные ошибки стоит исправлять, остальные имхо лучше не трогать.
Справочный материал уже есть - Map Features

Offline

#9 2010-05-13 18:10:00

KekcuHa
Member
From: Moscow
Registered: 2008-05-26
Posts: 607
Website

Re: Теги: стандартизация и исправление ошибок.

Мне не понятно такая любовь к разброду и шатанию.
Объясните, чего я не понимаю?

Offline

#10 2010-05-13 18:11:28

liosha
Member
From: Moscow
Registered: 2008-03-04
Posts: 8,446
Website

Re: Теги: стандартизация и исправление ошибок.

KekcuHa, какого конкретно стандарта не хватает-то?
Стандарта на что?

Offline

#11 2010-05-13 18:23:57

KekcuHa
Member
From: Moscow
Registered: 2008-05-26
Posts: 607
Website

Re: Теги: стандартизация и исправление ошибок.

Только одного - стандарта на качество хранимых и вносимых данных.

Offline

#12 2010-05-13 18:27:55

Sergey Astakhov
Member
From: St.Petersburg, Russia
Registered: 2009-11-13
Posts: 5,596

Re: Теги: стандартизация и исправление ошибок.

liosha wrote:

остальные имхо лучше не трогать.

+1
А если есть подозрение на то, что автор просто не знает как обозначать правильно - написать ему как это делать правильно.
Если человек адекватный - он примет к сведению. Путь это более медленный способ, зато более перспективный и дружественный.

Offline

#13 2010-05-13 18:32:16

Sergey Astakhov
Member
From: St.Petersburg, Russia
Registered: 2009-11-13
Posts: 5,596

Re: Теги: стандартизация и исправление ошибок.

KekcuHa wrote:

Только одного - стандарта на качество хранимых и вносимых данных.

Это возможно только при централизованой организации. Там можно железной рукой загонять в светлое будущее. В децентрализованой OSM это невозможно - разбегутся.

Offline

#14 2010-05-13 18:33:38

liosha
Member
From: Moscow
Registered: 2008-03-04
Posts: 8,446
Website

Re: Теги: стандартизация и исправление ошибок.

KekcuHa wrote:

Только одного - стандарта на качество хранимых и вносимых данных.

А как ты его себе представляешь??

Offline

#15 2010-05-13 19:30:47

coolkaas
Member
From: RU, Penza
Registered: 2009-05-28
Posts: 2,290

Re: Теги: стандартизация и исправление ошибок.

Military-то всего 52 штуки на '3.5 гб'. А шуму, шуму-то было smile
По теме: пользователи-новички просто не знают, как правильно присваивать теги объектам. Один раз объясняешь, всё становится понятно. Люди ХОТЯТ вносить данные, но не знают как.
Им можно послать письма от робота, который будет всё это разгребать.
Разгребать лучше руками, программой править только самые явные ошибки - фактически, описки. ЯВНО распознанные описки.
Править всё автоматом слишком боязно.

Offline

#16 2010-05-13 19:39:40

AkMeR
Member
From: Samara
Registered: 2008-02-27
Posts: 1,158

Re: Теги: стандартизация и исправление ошибок.

KekcuHa wrote:

Только одного - стандарта на качество хранимых и вносимых данных.

Осталось только привести твоё определение "качества", а то недосказанность получается...

Offline

#17 2010-05-14 04:51:07

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: Теги: стандартизация и исправление ошибок.

liosha wrote:

Явные ошибки стоит исправлять, остальные имхо лучше не трогать.

Хотелось бы еще иметь формальный алгоритм, позволяющий отличить первое от второго. wink

Справочный материал уже есть - Map Features

Интересно, и как же этот справочный материал может быть использован ботом для пакетной правки "явных ошибок"?
Собственно, тот XML, который я разместил в первом посте, получен автоматом именно из Map Features, но если приглядеться повнимательнее, там нужна довольно существенная правка руками.
Не говоря уже о том, что, например, даже такой набивший оскомину тег "landuse=military" там попросту не отражен.

Offline

#18 2010-05-14 05:05:51

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: Теги: стандартизация и исправление ошибок.

Aleksandr Dezhin wrote:

Конечно нет! Максимум что можно, так это опечатки править. Но это вроде уже делают давно.

Если это уже давно делается, откуда тогда опечатки?
Кстати, в каких из приведенных ниже случаев опечатки, а в каких нет? (hint: в 615 строке в теге содержатся "лишние" символы, которые при просмотре в режиме utf8 на экране не отображаются - такие случаи тоже бывают)

  78       1 "name:krl"
  82       1 "game:patrizer2:bier"
  83       1 "game:patrizer2:eisenerz"
  84       1 "game:patrizer2:felle"
 102       1 "old_name:pl"
 129       1 "island"
 161       1 "AND_nodes"
 230       1 "inat_name"
 239       1 "oldname"
 378       1 "source:highway"
 387       1 "name_engl"
 399       2 "ont_name"
 402       1 "name_3"
 411       1 "abbr_name"
 426       1 "ent_name"
 429       1 "private"
 434       1 "name_old:ru"
 440       1 "boat"
 451       1 "currency"
 452       1 "postcode"
 480       1 "books"
 481       1 "polulation"
 533       1 "school"
 566       1 "x-point-id"
 567       1 "open_hours"
 576       1 "dogs"
 585       1 "poi"
 606       1 "_сladr:code"
 610       1 "closed"
 612       1 "game"
 615       1 "сladr:note"
 625       1 "zip"
 639       1 "tel"
 642       1 "female"
 643       1 "male"
 650       1 "
name"
 692       1 "Лесоарк"
 693       1 "№"
 710       1 "name_"
 715       1 "cladr:namt"
 717       1 "restruktion"
 719       1 "дом 59"
 729       1 "отделение милиции Хабаровск-2"

Offline

#19 2010-05-14 05:48:21

Aleksandr Dezhin
Member
From: Msk
Registered: 2008-05-25
Posts: 2,109
Website

Re: Теги: стандартизация и исправление ошибок.

ну вот например опечатка - polulation. andriano, а какой смысл массово исправлять одиночные опечатки? то есть это дело конечно хорошее, но КПД у него очень низкий будет.


[ Проверка границ и НП | Дампы | Валидатор рек | Кое-что ещё ]
- Нет! Не надо пытаться. Делай. Или не делай. Не надо пытаться. (c) Йода

Offline

#20 2010-05-14 06:30:27

dkiselev
Member
Registered: 2010-02-09
Posts: 3,363

Re: Теги: стандартизация и исправление ошибок.

Опечатки - можно просто считать разность между тегами из map features и тегами на карте, если разность меньше 2 - скорее всего это опечатка. Кирилические тэги - скорее всего опечатка. Таковые можно наверное и автоматом править.

Редкие теги, которые встречаются 1-2 раза на карте - тут уж скорее писать автору.

А повышать качество коллективного продукта надо двумя путями:
1. Толковое описание в вики. С примерами и туториалами.
2. Стимуляция - расставь релейшены так то - получишь роутинг в таких то навигаторах. Расставь теги так-то получишь нормальное отображение в рендере.

В общем я за пряники а не за кнуты smile


mail: dkiselev@osm.me      skype: dmitry.v.kiselev
Open Street Maps are supreme! Exterminate all map forms! Exterminate! Exterminate!

Offline

#21 2010-05-14 10:40:02

andriano
Member
Registered: 2009-06-15
Posts: 1,667

Re: Теги: стандартизация и исправление ошибок.

coolkaas wrote:

Military-то всего 52 штуки на '3.5 гб'. А шуму, шуму-то было smile

Слишком оптимистичное заявление.
Во-первых, я не упомянул, но оанализ касался ТОЛЬКО nodes, при этом ways и relations попросту не учитывались.
Но самое главное, military - это в данном случае key, огда как нормальное применение этого атрибута должно быть val. (а val я и не пытался обрабатывать по понятным причинам)
Другими словами, те 52 вхождения military - это только явные ошибки.

По теме: пользователи-новички просто не знают, как правильно присваивать теги объектам. Один раз объясняешь, всё становится понятно. Люди ХОТЯТ вносить данные, но не знают как.
Им можно послать письма от робота, который будет всё это разгребать.
Разгребать лучше руками, программой править только самые явные ошибки - фактически, описки. ЯВНО распознанные описки.
Править всё автоматом слишком боязно.

Ну, когда КАЖДОМУ новичку нужно один раз объяснить. А потом оказывается, что и не один... надобность в автомате, который бы проверял корректность ввода, мне кажется, достаточно насущна.
Ведь все "нестандартные" теги - это просто информационный мусор, т.к. любой перекодировщик (а без перекодирования использовать данные OSM ни в одной конкретной программе невозможно) все равно это выкинет.

Offline

#22 2010-05-14 10:45:07

liosha
Member
From: Moscow
Registered: 2008-03-04
Posts: 8,446
Website

Re: Теги: стандартизация и исправление ошибок.

andriano, military в качестве ключа вполне допустимо: http://wiki.openstreetmap.org/wiki/Key:military

И не надо считать чужие теги мусором.
Any tags you like - один из принципов OSM
Хотя против правки очевидных вещей, типа engl_name на name:en или tel на phone вряд ли кто-то будет возражать.

Offline

#23 2010-05-14 10:45:33

Sergey Astakhov
Member
From: St.Petersburg, Russia
Registered: 2009-11-13
Posts: 5,596

Re: Теги: стандартизация и исправление ошибок.

andriano wrote:

Но самое главное, military - это в данном случае key, огда как нормальное применение этого атрибута должно быть val. (а val я и не пытался обрабатывать по понятным причинам)
Другими словами, те 52 вхождения military - это только явные ошибки.

Почему ошибки? http://wiki.openstreetmap.org/wiki/RU:Key:military

Offline

#24 2010-05-14 11:51:35

wowik
Member
From: Zelenograd
Registered: 2009-09-29
Posts: 8,324

Re: Теги: стандартизация и исправление ошибок.

Эх! Еще бы редакторы более дружелюбные для чайников!
С пресетами того, что правильно.

Чайник куда идет первым делом?
В полтлач. А там пресеты скудные. Без лазанья в вики ничего не разметишь толком. Упомнить как что называется и с чем сочетается невозможно, да и долго ручками-то вбивать. Правда я уже привык. Но это дело двух-трех месяцев.
А за это время ерунды нагородил-то: ого-го!.

Last edited by wowik (2010-05-14 11:51:49)

Offline

#25 2010-05-14 12:41:57

dedNikifor
Member
From: Свердловская обл.
Registered: 2009-09-11
Posts: 3,414

Re: Теги: стандартизация и исправление ошибок.

на самом деле "правильные" презеты в джосме на практике оказываются офигенно НЕинформативными без чтения вики.

поэтому, лучше юзать потлач+вики, чем джосм+чей-то_не всегда верный_перевод_тегов


Графическая (в виде карты с точками опасных объектов) база спидкамов для разных навигационных программ. Подложка OSM присутствует

Offline

Board footer

Powered by FluxBB