You are not logged in.

Announcement

*** NOTICE: forum.openstreetmap.org is being retired. Please request a category for your community in the new ones as soon as possible using this process, which will allow you to propose your community moderators.
Please create new topics on the new site at community.openstreetmap.org. We expect the migration of data will take a few weeks, you can follow its progress here.***

#1 2021-11-11 11:07:10

GerdP
Member
Registered: 2015-12-18
Posts: 1,972

Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Moin,

Entschuldigt bitte meine laienhafte Ausdrucksweise:
Es gibt anscheinend in Utf8 verschiedene Möglichkeiten einen Umlaut wie ü darzustellen.
In diesem Zusammenhang ist mir z.B. https://www.osm.org/node/1534403755 aufgefallen.

Das ü in diesem Namen ist anders kodiert als das ü, das ich mit meiner Tastatur produziere. Sprich, im Hex Editor sieht der Name anders aus.

Mir ist das aufgefallen, weil das Programm mkgmap (Garmin Karten) mit dem Zeichen nichts anfangen kann und ein "u?" daraus macht.

Was ist da passiert? Kann/sollte man das in OSM korrigieren?
Edit: genauer gesagt, mkgmap hat Probleme mit dem Namen, wenn die Garmin Karte z.B. die code-page 1252 verwenden soll.

Last edited by GerdP (2021-11-11 11:15:54)

Offline

#2 2021-11-11 11:21:05

SimonPoole
Member
Registered: 2010-03-14
Posts: 2,195

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Grundsätzlich gibt's relativ viele UTF Zeichen die zueinander sehr ähnlich aussehe, siehe http://www.unicode.org/Public/security/ … sables.txt aber in diesem Fall hat sich anscheinend jemand einfach sein ü zusammengebastelt: https://www.fontspace.com/unicode/analy … hscHN0ZWR0

Korrigieren: IMHO ja.

Last edited by SimonPoole (2021-11-11 11:23:41)

Offline

#3 2021-11-11 11:29:26

mmd
Member
Registered: 2010-11-06
Posts: 2,150

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Es gibt global 46 Nodes mit diesem "ü": https://overpass-turbo.eu/s/1cV1

(seit dem letzten Thread zur global Suche ist diese Art von Query jetzt auch deutlich flotter mit 6s)

Last edited by mmd (2021-11-11 11:32:20)

Offline

#4 2021-11-11 11:31:17

SimonPoole
Member
Registered: 2010-03-14
Posts: 2,195

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

mmd wrote:

Es gibt global 46 Nodes mit diesem "ü": https://overpass-turbo.eu/s/1cV1

Ist ja auch nicht "falsch" sondern nur "unüblich", längerfristig sollten die Tools natürlich damit umgehen können.

Last edited by SimonPoole (2021-11-11 11:31:39)

Offline

#5 2021-11-11 11:35:13

FraukeLeo
Member
Registered: 2020-08-03
Posts: 881

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Yep, das ist ein normales u mit nachträglich draufgesetzten Pünktchen. Vermutlich von keiner Suchfunktion als ü zu finden.

Offline

#6 2021-11-11 11:39:45

FraukeLeo
Member
Registered: 2020-08-03
Posts: 881

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

mmd wrote:

Es gibt global 46 Nodes mit diesem "ü": https://overpass-turbo.eu/s/1cV1

... davon allein zehn in Klein Twülpstedt big_smile

Offline

#7 2021-11-11 11:40:32

GerdP
Member
Registered: 2015-12-18
Posts: 1,972

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Nö, JOSM findet beide Schreibweisen von Twülpstedt, wenn ich mit "selbsteingegebenem" Namen suche. Das ist ja gerade das verwirrende. Nach Unicode Logik mag das aber richtig sein.

Offline

#8 2021-11-11 11:41:32

Wulf4096
Member
From: Hamburg
Registered: 2018-10-23
Posts: 1,159

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

$ curl -s https://api.openstreetmap.org/api/0.6/node/1534403755.json | jq -r .elements[0].tags.name | utf
    4b Lu K LATIN CAPITAL LETTER K
    6c Ll l LATIN SMALL LETTER L
    65 Ll e LATIN SMALL LETTER E
    69 Ll i LATIN SMALL LETTER I
    6e Ll n LATIN SMALL LETTER N
    20 Zs   SPACE
    54 Lu T LATIN CAPITAL LETTER T
    77 Ll w LATIN SMALL LETTER W
    75 Ll u LATIN SMALL LETTER U
   308 Mn ̈ COMBINING DIAERESIS
    6c Ll l LATIN SMALL LETTER L
    70 Ll p LATIN SMALL LETTER P
    73 Ll s LATIN SMALL LETTER S
    74 Ll t LATIN SMALL LETTER T
    65 Ll e LATIN SMALL LETTER E
    64 Ll d LATIN SMALL LETTER D
    74 Ll t LATIN SMALL LETTER T
    2c Po , COMMA
    20 Zs   SPACE
    46 Lu F LATIN CAPITAL LETTER F
    72 Ll r LATIN SMALL LETTER R
    69 Ll i LATIN SMALL LETTER I
    65 Ll e LATIN SMALL LETTER E
    64 Ll d LATIN SMALL LETTER D
    68 Ll h LATIN SMALL LETTER H
    6f Ll o LATIN SMALL LETTER O
    66 Ll f LATIN SMALL LETTER F
     a Cc 

Hier nochmal der interessante Teil:

    75 Ll u LATIN SMALL LETTER U
   308 Mn ̈ COMBINING DIAERESIS

Was ist da passiert? Kann/sollte man das in OSM korrigieren?

Wie das passiert ist, weiß ich nicht. Was: Siehe https://de.wikipedia.org/wiki/Kombinierendes_Zeichen
Meiner Meinung nach sollte das korrigiert werden. Idealerweise kommt Software damit zwar klar, aber ich würde nicht davon ausgehen. Außerdem ist's hässlich.

Offline

#9 2021-11-11 12:05:01

FraukeLeo
Member
Registered: 2020-08-03
Posts: 881

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

GerdP wrote:

Nö, JOSM findet beide Schreibweisen von Twülpstedt, wenn ich mit "selbsteingegebenem" Namen suche. Das ist ja gerade das verwirrende. Nach Unicode Logik mag das aber richtig sein.

OK, dann rudere ich mal zurück. Aber:

SimonPoole wrote:

Ist ja auch nicht "falsch" sondern nur "unüblich"

Jein. "nicht falsch" ist es bei den meisten anderen kombinierenden Zeichen (Beispiel: a und  ̃ ist gleichwertig zu ã), aber das gilt nicht für die Diärese. Die sieht zwar genauso aus wie Umlautpünktchen, ist aber funktional etwas vollkommen anderes. Die Diärese ändert nicht die Aussprache eines Vokals, sondern trennt zwei Vokale voneinander (Beispiel: der Name Noël). Damit ist ein ü nicht gleichwertig zu einem u mit Diärese.

Also ist diese Schreibweise des ü auch in Unicode-Logik falsch. Warum, sollte einem OSM-Mapper unmittelbar einleuchten: Im Schriftbild sieht es gleichwertig aus, aber ein Screenreader bekommt Schluckauf, weil er die Diärese als abgesetzten Vokal interpretieren muss. Der muss dann Tw-Ulpstedt oder so was lesen. Auch hier wird nicht für den Renderer gearbeitet big_smile

Offline

#10 2021-11-11 12:42:53

MitteloberrheinischerWaldameisenschreck
Member
Registered: 2017-05-16
Posts: 534

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Das Unicode-Konsortium hat anfangs viele Kombinationen aus Akzent o.ä. und Grundbuchstaben oder auch Kombinationen aus zwei Buchstaben einen eigenen Unicode-Punkt spendiert für das fertig zusammengesetzte Zeiten. Irgendwann wurde es dem Unicode-K. aber zu viel, so dass einige exotische Sprachen mit seltenen Kombinationen ihre akzentuierten Buchstaben nur mit kombinierendem Zeichen bekommen können ...
Kombinierendes Zeichen ist nicht nur die Diärese, sondern auch ein Trema/Umlautpunkte/..., Unicode unterscheidet da nicht.
Die deutschen Pünktchen entstanden übrigens aus einem hochgestellten e: Aͤ/aͤ, erst später haben sich die e's, die in Sütterlin wie zwei Striche aussehen, zu zwei Strichen bzw. Punkten abgeschliffen ... Insofern sind unsere Pünktchen nix anderes wie andere (kombinierende) Akzente und es gilt Simons "Ist ja auch nicht "falsch" sondern nur "unüblich"" voll und ganz.
Wer die Diäresis ubedingt vom Trema unterscheiden will/muss, muss zusätzlich zum CGJ greifen

Offline

#11 2021-11-11 12:44:03

SimonPoole
Member
Registered: 2010-03-14
Posts: 2,195

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Wulf4096 wrote:

Hier nochmal der interessante Teil:

    75 Ll u LATIN SMALL LETTER U
   308 Mn ̈ COMBINING DIAERESIS

Siehe 2. Beitrag in diesem Thread https://forum.openstreetmap.org/viewtop … 27#p846427

Last edited by SimonPoole (2021-11-11 13:48:31)

Offline

#12 2021-11-12 11:53:31

GerdP
Member
Registered: 2015-12-18
Posts: 1,972

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

Wenn ich das richtig sehe, dann sollten zumindest in D alle Tag-Werte, die so ein COMBINING DIAERESIS enthalten, genauer angeschaut werden. Kann man da nicht einen Bot einsezen? Zumindest im Zusammenhang mit A,O,U,a,o oder u könnten diese dann automatisiert zu Ä,Ö,Ü,ä,ö oder ü konvertiert werden.
Ich werde mal schauen, warum der entsprechende Java code in mkgmap das nicht somacht wie erwartet.

Offline

#13 2021-11-12 12:12:29

mmd
Member
Registered: 2010-11-06
Posts: 2,150

Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen

GerdP wrote:

Wenn ich das richtig sehe, dann sollten zumindest in D alle Tag-Werte, die so ein COMBINING DIAERESIS enthalten, genauer angeschaut werden.

Ich denke, das kann man noch zu Fuss machen, dafür braucht es keinen Bot: https://overpass-turbo.eu/s/1cXa
Global nur 105 Nodes...

Offline

Board footer

Powered by FluxBB