You are not logged in.
- Topics: Active | Unanswered
Announcement
Please create new topics on the new site at community.openstreetmap.org. We expect the migration of data will take a few weeks, you can follow its progress here.***
#1 2021-11-11 11:07:10
- GerdP
- Member
- Registered: 2015-12-18
- Posts: 1,972
Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Moin,
Entschuldigt bitte meine laienhafte Ausdrucksweise:
Es gibt anscheinend in Utf8 verschiedene Möglichkeiten einen Umlaut wie ü darzustellen.
In diesem Zusammenhang ist mir z.B. https://www.osm.org/node/1534403755 aufgefallen.
Das ü in diesem Namen ist anders kodiert als das ü, das ich mit meiner Tastatur produziere. Sprich, im Hex Editor sieht der Name anders aus.
Mir ist das aufgefallen, weil das Programm mkgmap (Garmin Karten) mit dem Zeichen nichts anfangen kann und ein "u?" daraus macht.
Was ist da passiert? Kann/sollte man das in OSM korrigieren?
Edit: genauer gesagt, mkgmap hat Probleme mit dem Namen, wenn die Garmin Karte z.B. die code-page 1252 verwenden soll.
Last edited by GerdP (2021-11-11 11:15:54)
Offline
#2 2021-11-11 11:21:05
- SimonPoole
- Member
- Registered: 2010-03-14
- Posts: 2,195
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Grundsätzlich gibt's relativ viele UTF Zeichen die zueinander sehr ähnlich aussehe, siehe http://www.unicode.org/Public/security/ … sables.txt aber in diesem Fall hat sich anscheinend jemand einfach sein ü zusammengebastelt: https://www.fontspace.com/unicode/analy … hscHN0ZWR0
Korrigieren: IMHO ja.
Last edited by SimonPoole (2021-11-11 11:23:41)
Offline
#3 2021-11-11 11:29:26
- mmd
- Member
- Registered: 2010-11-06
- Posts: 2,150
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Es gibt global 46 Nodes mit diesem "ü": https://overpass-turbo.eu/s/1cV1
(seit dem letzten Thread zur global Suche ist diese Art von Query jetzt auch deutlich flotter mit 6s)
Last edited by mmd (2021-11-11 11:32:20)
Offline
#4 2021-11-11 11:31:17
- SimonPoole
- Member
- Registered: 2010-03-14
- Posts: 2,195
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Es gibt global 46 Nodes mit diesem "ü": https://overpass-turbo.eu/s/1cV1
Ist ja auch nicht "falsch" sondern nur "unüblich", längerfristig sollten die Tools natürlich damit umgehen können.
Last edited by SimonPoole (2021-11-11 11:31:39)
Offline
#5 2021-11-11 11:35:13
- FraukeLeo
- Member
- Registered: 2020-08-03
- Posts: 881
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Yep, das ist ein normales u mit nachträglich draufgesetzten Pünktchen. Vermutlich von keiner Suchfunktion als ü zu finden.
Offline
#6 2021-11-11 11:39:45
- FraukeLeo
- Member
- Registered: 2020-08-03
- Posts: 881
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Es gibt global 46 Nodes mit diesem "ü": https://overpass-turbo.eu/s/1cV1
... davon allein zehn in Klein Twülpstedt ![]()
Offline
#7 2021-11-11 11:40:32
- GerdP
- Member
- Registered: 2015-12-18
- Posts: 1,972
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Nö, JOSM findet beide Schreibweisen von Twülpstedt, wenn ich mit "selbsteingegebenem" Namen suche. Das ist ja gerade das verwirrende. Nach Unicode Logik mag das aber richtig sein.
Offline
#8 2021-11-11 11:41:32
- Wulf4096
- Member
- From: Hamburg
- Registered: 2018-10-23
- Posts: 1,159
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
$ curl -s https://api.openstreetmap.org/api/0.6/node/1534403755.json | jq -r .elements[0].tags.name | utf
4b Lu K LATIN CAPITAL LETTER K
6c Ll l LATIN SMALL LETTER L
65 Ll e LATIN SMALL LETTER E
69 Ll i LATIN SMALL LETTER I
6e Ll n LATIN SMALL LETTER N
20 Zs SPACE
54 Lu T LATIN CAPITAL LETTER T
77 Ll w LATIN SMALL LETTER W
75 Ll u LATIN SMALL LETTER U
308 Mn ̈ COMBINING DIAERESIS
6c Ll l LATIN SMALL LETTER L
70 Ll p LATIN SMALL LETTER P
73 Ll s LATIN SMALL LETTER S
74 Ll t LATIN SMALL LETTER T
65 Ll e LATIN SMALL LETTER E
64 Ll d LATIN SMALL LETTER D
74 Ll t LATIN SMALL LETTER T
2c Po , COMMA
20 Zs SPACE
46 Lu F LATIN CAPITAL LETTER F
72 Ll r LATIN SMALL LETTER R
69 Ll i LATIN SMALL LETTER I
65 Ll e LATIN SMALL LETTER E
64 Ll d LATIN SMALL LETTER D
68 Ll h LATIN SMALL LETTER H
6f Ll o LATIN SMALL LETTER O
66 Ll f LATIN SMALL LETTER F
a Cc Hier nochmal der interessante Teil:
75 Ll u LATIN SMALL LETTER U
308 Mn ̈ COMBINING DIAERESISWas ist da passiert? Kann/sollte man das in OSM korrigieren?
Wie das passiert ist, weiß ich nicht. Was: Siehe https://de.wikipedia.org/wiki/Kombinierendes_Zeichen
Meiner Meinung nach sollte das korrigiert werden. Idealerweise kommt Software damit zwar klar, aber ich würde nicht davon ausgehen. Außerdem ist's hässlich.
Offline
#9 2021-11-11 12:05:01
- FraukeLeo
- Member
- Registered: 2020-08-03
- Posts: 881
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Nö, JOSM findet beide Schreibweisen von Twülpstedt, wenn ich mit "selbsteingegebenem" Namen suche. Das ist ja gerade das verwirrende. Nach Unicode Logik mag das aber richtig sein.
OK, dann rudere ich mal zurück. Aber:
Ist ja auch nicht "falsch" sondern nur "unüblich"
Jein. "nicht falsch" ist es bei den meisten anderen kombinierenden Zeichen (Beispiel: a und ̃ ist gleichwertig zu ã), aber das gilt nicht für die Diärese. Die sieht zwar genauso aus wie Umlautpünktchen, ist aber funktional etwas vollkommen anderes. Die Diärese ändert nicht die Aussprache eines Vokals, sondern trennt zwei Vokale voneinander (Beispiel: der Name Noël). Damit ist ein ü nicht gleichwertig zu einem u mit Diärese.
Also ist diese Schreibweise des ü auch in Unicode-Logik falsch. Warum, sollte einem OSM-Mapper unmittelbar einleuchten: Im Schriftbild sieht es gleichwertig aus, aber ein Screenreader bekommt Schluckauf, weil er die Diärese als abgesetzten Vokal interpretieren muss. Der muss dann Tw-Ulpstedt oder so was lesen. Auch hier wird nicht für den Renderer gearbeitet ![]()
Offline
#10 2021-11-11 12:42:53
- MitteloberrheinischerWaldameisenschreck
- Member

- Registered: 2017-05-16
- Posts: 534
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Das Unicode-Konsortium hat anfangs viele Kombinationen aus Akzent o.ä. und Grundbuchstaben oder auch Kombinationen aus zwei Buchstaben einen eigenen Unicode-Punkt spendiert für das fertig zusammengesetzte Zeiten. Irgendwann wurde es dem Unicode-K. aber zu viel, so dass einige exotische Sprachen mit seltenen Kombinationen ihre akzentuierten Buchstaben nur mit kombinierendem Zeichen bekommen können ...
Kombinierendes Zeichen ist nicht nur die Diärese, sondern auch ein Trema/Umlautpunkte/..., Unicode unterscheidet da nicht.
Die deutschen Pünktchen entstanden übrigens aus einem hochgestellten e: Aͤ/aͤ, erst später haben sich die e's, die in Sütterlin wie zwei Striche aussehen, zu zwei Strichen bzw. Punkten abgeschliffen ... Insofern sind unsere Pünktchen nix anderes wie andere (kombinierende) Akzente und es gilt Simons "Ist ja auch nicht "falsch" sondern nur "unüblich"" voll und ganz.
Wer die Diäresis ubedingt vom Trema unterscheiden will/muss, muss zusätzlich zum CGJ greifen
Offline
#11 2021-11-11 12:44:03
- SimonPoole
- Member
- Registered: 2010-03-14
- Posts: 2,195
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Hier nochmal der interessante Teil:
75 Ll u LATIN SMALL LETTER U 308 Mn ̈ COMBINING DIAERESIS
Siehe 2. Beitrag in diesem Thread https://forum.openstreetmap.org/viewtop … 27#p846427
Last edited by SimonPoole (2021-11-11 13:48:31)
Offline
#12 2021-11-12 11:53:31
- GerdP
- Member
- Registered: 2015-12-18
- Posts: 1,972
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Wenn ich das richtig sehe, dann sollten zumindest in D alle Tag-Werte, die so ein COMBINING DIAERESIS enthalten, genauer angeschaut werden. Kann man da nicht einen Bot einsezen? Zumindest im Zusammenhang mit A,O,U,a,o oder u könnten diese dann automatisiert zu Ä,Ö,Ü,ä,ö oder ü konvertiert werden.
Ich werde mal schauen, warum der entsprechende Java code in mkgmap das nicht somacht wie erwartet.
Offline
#13 2021-11-12 12:12:29
- mmd
- Member
- Registered: 2010-11-06
- Posts: 2,150
Re: Klein Twülpstedt/ Seltsame Umlaute in manchen Namen
Wenn ich das richtig sehe, dann sollten zumindest in D alle Tag-Werte, die so ein COMBINING DIAERESIS enthalten, genauer angeschaut werden.
Ich denke, das kann man noch zu Fuss machen, dafür braucht es keinen Bot: https://overpass-turbo.eu/s/1cXa
Global nur 105 Nodes...
Offline