VBB Daten unter CC-Lizenz

Hallo,
weil das im Wochennotiz-Thread neben Pakistan etwas untergetaucht ist, hier nochmal die Frage:

Der VBB hat ja nun seine Daten frei zugänglich gemacht. (http://daten.berlin.de/datensaetze/vbb-fahrplan2012) Leider nur unter CC-Lizenz. Damit dürfte der Import von Haltestellen eher schwer werden oder? Ich meine, gerade in irgendwelchen Dörfern fehlen sicher noch die eine oder andere Bushalte, von Linien-Relationen zu schweigen. Inwieweit das automatisiert möglich ist, weiß ich nicht, da ja wiederum andere Haltestellen schon existieren, zum Teil sogar exakter (hier in der Gegend gibt es zB einen Fall, wo die Haltestellen für die jeweilige Fahrtrichtung an unterschiedlichen Stellen liegen, das berücksichtigen die Daten des VBB nicht.).

Aber generell ist der Import so nicht möglich, oder? Hat jemand einen Kontakt zum VBB, der das klären könnte?

Gruß S-Man

Als Lizenz ist “Creative Commons Namensnennung”, also CC BY angegeben. Da ist immer die Frage, mit welcher Form der Namensnennung der Lizenzgeber einverstanden ist. Dieser Interpretationsspielraum und die praktischen Schwierigkeiten bei der Namensnennung zählen ja zu den Gründen, warum die CC-Lizenzen als für OSM ungeeignet angesehen werden und OSM mit großem Aufwand zur ODbL gewechselt ist.

Einfach mal beim VBB nachfragen: wird es als ausreichend angesehen, wenn bei einer Übernahme in OSM die Quelle etwa nur im Änderungssatzkommentar genannt wird? Das wäre ja kein Hindernis. Oder muß die Quelle als source-Tag an jedem Haltestellenknoten hängen? Das wäre zwar lästig, aber prinzipiell auch machbar. Problem: source-Tags können gelöscht werden (sollten aber zumindest in der Historie erhalten bleiben).
Wenn der VBB aber in jedem Endprodukt (Slippymap, Printprodukt, Garmin-Karte, …) genannt werden will, kommt ein (Teil-)Import natürlich nicht in Frage.

Moin,

das ist doch nur CC-BY und nicht CC-BY-SA. Also rein mit dem Punkt und dazuschreiben als Kommentar: Kommt von VBB.

LG,

-moenk

Im Prinzip gebe ich moenk Recht. Das SA würde für mich auch den Unterschied machen… Aber ich schau mal, ob ich da eine Kompetenz-Person an die Strippe bekomme :slight_smile:

Hallo S-Man

Die Daten sind ja CC-BY, also erfordern nur die Namensnennung. Das ist erst mal möglich. Man sollte jedoch im Vorfeld abklären, in welcher Form die Namensnennung gewünscht wird.

Insgesamt ist ein Import eine aufwändige Sache.

  • Die allgemeinen Import-Richtlinien sind einzuhalten.
  • Der Abgleich zwischen den Daten des Verkehrsverbundes und den
    bereits in OSM enthaltenen Haltestellen und Routen ist nicht trivial.

Um nicht in Details zu ertrinken, schau dir mal an, wie der Abgleich zwischen den VRS- und den OSM-Daten durchgeführt wurde. Siehe die Seite zum VRS Haltestellenimport

Edbert (EvanE)

So, habe mal eine E-Mail an die angegebene Kontaktadresse geschrieben. Je nach Antwort kann man sich dann an die Details setzen.

Moin,

was sollen wir überhaupt damit? Berlin ist bestens erfasst, alle Bushaltestellen sauber auf beiden Seiten, die Daten der VBB haben nur grob lagerichtig einen Punkt für alles zusammen, egal ob Bus oder Bahn, siehe hier:

LG,

-moenk

Ja, solange es um Berlin geht, gebe ich dir Recht. Aber schau mal über die Grenzen hinweg. Schon mal im Osten von Brandenburg unterwegs gewesen und auf einen Bus gewartet? :wink: Es gibt etliche kleine Bushalten, die (nach Stichproben) im VBB-Datensatz vorhanden sind, von Orten wo maximal eine Hauptstraße gemappt ist. Von Buslinienrelationen will ich gar nicht anfangen :smiley:

Hier mal die Realität der “bestens”-Erfassung:

Naja, meist sind die Haltestellen vollständig, manchmal fehlen aber teilweise auch noch Busteige, so werden z.B. die scheinbar unwichtigen und getrennten Stops/Plattformen mancher Endhaltestellen nicht erfaßt. Damit muß man dann im Zweifelsdfall dann nachsehen, was an Linien so an welchem Busteig ankommt.

Bei großen Sammelhaltestellen, wie z.B auch dein Beispiel Feuerbachstraße, fehlt quasi immer die Gesamthaltestellenrelation (die kann man ja erst mal erstellen), geschweige ist die dann auch in den Linien eingebunden. Außerdem sind sehr viele Haltestellen noch nicht auf das neue Schema umgestellt. Wegen der Linieneinbindung sollte man noch eine Korrekturproposal erstellen, das die Zuordnung Haltepunkte zu Plattform macht, weil dadurch wurd so macnhes einfacher, weil man z.B. nicht mehr die Verkehrsmittelarten mit an die Haltepunkte taggen muß.

Man kann sich jetzt wunderbar darüber beschweren, dass die Daten nur Bereichsscharf sind. Man kann aber auch konstruktiv denken und zwei Fliegen mit einer Klappe schlagen. Nämlich endlich mal die ganze Linien und Linienvarianten einlesen und einen möglichen Abgleich zwischen den Daten und den in OSM vorhandenen Daten schaffen, bzw. sogar eindeutige Schlüssel vergeben.
In dem hier erwähnten Datensatz steckt nur eine von drei möglichen Nummern drin. Aber so könnte man einen ganz wesentlichen Beitrag dazu leisten die Daten auch in Zukunft fast automatisch abzugleichen. Damit hätte dann auch der VBB den Vorteil der lagegenaueren Haltestellen. Bisher werden dei Fußwege in OSM nämlich an Hand dieses ungenauen Bereiches geroutet. Das ist für den Fahrgast mehr als ärgerlich, wenn er eben gerade nicht weiß wo er einsteigen muss oder aussteigt.

Hallo zusammen,

die Daten gibt es schon etwas länger zur Verfügung und sie sind glaube ich gedacht um das damit zu experimentieren.
Es geht wohl um ein Event am 29.11.12 in Berlin
http://appsandthecity.net/

@S-Man42
Ich muß dich leider enttäuschen es ist nicht der komplette Satz der Haltestellen in BB. Ich habe die Haltestelle aus dem GTFS-Format exportiert und sie in eine
JOSM lesbare Form gewandelt (Name der Haltestelle und Koordinaten).
Teilweise weichen die Haltstelle von der Position in den Luftbildern oder OSM ab und manchmal z.B. in Cottbus gibt es nur einige wenige Halltstellen.
Berlin dagegen auf den ersten Blick komplett. Die Abweichungen kann man schon sehr schön auf der Webseite des VBB sehen.

Evtl. kommt hier nochmal der komplette Satz der Haltstellen bzw. der komplette Fahrplan als GTFS Format.
Wenn das passiert das ist es aus meiner Sicht auch nicht mehr notwendig Linien in OSM abzubilden. Es würde reichen die Haltstellen einzutragen.
Denn Linien, Abfahrtzeiten, Fahrplänen usw.wird durch das GTFS Format abgebildet bzw. dafür wurde es ja geschaffen.
Wenn dieses Format dann extern durch die Verkehrsunternehmen gepflegt wird und sie es regelmäßig bereitstellen dann bräuchte man in OSM diese Dinge auch nicht mehr pflegen. Jemand der dann Anwendungen schaffen will nimmt sich die GTFS-Daten und die Halltestellen aus der OSM.

Wer Interesse hat dem kann ich die Datei gern schicken aber mit dem Hinweis die Informationen nicht einfach in OSM zu importieren.

vg Andreas

Diese Ansicht halte ich für einen Trugschluss. Schon allein weil es pro Haltestelle im VBB nur einen Punkt gibt. Das liegt aber auch daran, dass der VBB diese Daten oft gar nicht anders vorliegen hat. HAFASdaten sind eben in allererster Linie für Fahrplanauskünfte und zur Verbindungssuche gedacht und dort reicht es wenn die Daten bereichsscharf sind und entsprechende Umsteigezeiten definiert sind. Dazu gibt es ja eine Extraliste.
Daher halte ich es sehrwohl für geboten die Linienrouten den richtigen Haltestellen respektive Stoppunkten zuzuordnen. Nicht zu letzt weil sonst Berlin Brandenburg ein weißer Fleck in der in der sonst bunten OSM Welt werden würde. Viele andere Länder haben solche Daten einfach gar nicht.

Automatisch sollten die Daten auf keinen Fall eingelesen/ importiert werden. Denn ich habe mir mal im Süden von Brandenburg einige Haltestellen angeschaut und da liegen zum Teil mehrere hundert Meter zwischen dem was real ist und dem was im Datensatz enthalten ist. Es gibt aber eben auch Haltestellen die nur weniger Meter daneben liegen.

Auch das wir danach die Linien nicht mehr in OSM aufnehmen müssen sehe ich nicht so. Denn das GTFS Format enthält zwar alle Stationen und auch wie sie untereinander angefahren werden. Aber welche Wege dahin benutzt werden ist dort nicht enthalten. Das kann aber speziell im Bus Umfeld doch mal ein anderer sein als der direkte zwischen zwei Haltestellen. So das wir weiterhin die Linien und die dazugehörigen Wege brauchen.

Hallo Andreas

Sind den die Linien Straßen-genau erfasst oder wie so oft nur als Abfolge von Haltestellen?
Wie so oft stecken die Probleme in den Details. Für Zeittabellen reichen die Haltestellen (inkl. der Abfolge). Für die echte Fahrstrecke braucht man auch die Straßen zwischen den Haltestellen.

Edbert (EvanE)

Ich sehe die (Haupt-)Entwicklungsarbeit darin ein verfahren zu finden wie man die verschiedenen Daten dauerhaft zu einander bringen kann. Sprich das man die Linienrouten in OSM mit jenen im GTFS Datensatz in Übereinstimmung bringen kann. Dann ist es auch möglich den Zugmonitor nach zu bauen und an größeren Knoten die richtigen Haltestellenmasten zu wählen.
Wie die Daten unaufbereitet aussehen, kann man sich jederzeit beim VBB ansehen, wenn man sich den Fahrtverlauf eines Busses anschaut. Die Verbindungen haben leider nichts mit den Straßen darunter zu tun.
Außerdem kann man wie bei den Straßenlisten auch einen Vollständigkeitsabgleich machen. Sind alle Haltestellen wenigstens einmal vorhanden. Schon das ist ein großer Gewinn. Auch würden mit einem regelmäßigem Fahrplanabgleich endlich die Linienänderungen der letzten Jahre auffallen. Diese sind nämlich nicht alle in OSM eingepflegt. Auch nicht in Berlin! Sogar neue Haltestellen wachsen nicht automatisch.

Ja, da sind keine Infos zum geographischen Linenverlauf der Linien drin, das einzige, was dort mit Ortsbezug drin ist, sind die Knoten der Haltestellen. Weil das so ist, ist auch eine extra Erfassung Umsteigezeiten nötig. Und ob bei großen Haltestellen ein einzelner Punkt in der Landschaft die Realität gut wiedergibt, ist ja auch nicht gesagt.

Die Datenzuordnung sollte auch nicht das Problem sein, vorrausgesetzt, man bringt das public_transport-Schema in Ordnung, und klar ist das auch Entwicklungsarbeit. In den HAFAS-Daten sind ja die Linenverläufe drin, da kann man per Koordinate (Umkreissuche nach Haltestellen) und/oder fehlertoleranten Namenssuche die Haltestellen in dem gesuchten Bereich finden, dann werden dort an allen stop_positions die Linen auf die gesuchte Richtung überprüft, weil das die nächste Haltestelle ist, weiß man ja auch.

Aber so eine Verlinkung sollte doch einfach möglich sein. Die Route hat eine “eindeutige ID” über network=VBB und ref=.

Vorsichtig! Wie lange ist die ID gleich? So lange der Fahrplan gilt. In diesem Fall bis zum Jannuar 2013. Das ist genau das gleiche Problem wie wenn wir einfach die nodeID aus OSM einem Haltestellenbereich zu ordnen. Irgendwann kommt jemand der meint den Knoten löschen zu müssen und 5 m links einen neuen zu setzen. Oder er macht aus dem Knoten einen Bahnsteig und aus dem Bahnsteig eine Fläche und schon ist deine Mühevolle Zuordnung einfach für die Katz.
Wie sehr unterscheiden sich die Routen voneinander? Schaut man sich Hafas Rohdaten an, so sind routen eine Mischung aus Fahrzeit und Haltestellenfolge und Takt. Das heißt die gleiche Haltestellenfolge steckt mitunter in dutzenden Routen.

Das ist etwas anderes. aighes meinte (so ich es korrekt interpretiere), dass die “eindeutige ID” aus network und ref besteht, was z.B. die Overpass-API gut umbauen kann.

Auch zum Fahrplanwechsel ändert sich höchstens eine ID im Fahrplan-Datensatz, aber mEn sollte auch da zur Identifikation die Liniennummer ausreichen. Wenn es bei einer Linie OSM-relevante Änderungen (z.B. andere Streckenführung) gibt, wäre eine darauf basierende Auskunft in der Übergangszeit natürlich möglicherweise inkorrekt, was man aber auch lösen könnte.

Ich hoffe, ich habe euch nicht zu sehr falsch verstanden :wink:

mfg~ray

ich weiß nicht ob er das so meinte. Aber es gibt einfach Linien die auf unterschiedlichen Wegen verkehren und dennoch die gleiche Liniennummer im gleichen “network” tragen.

Als Beispiel lass dir einfach den Fahrplan für die 838 auf vbb.de erstellen. Da findest du Fahrten über mildenberg und über Burgwall. genauso wie Fahrten nur über mildenberg oder nur über Burgwall oder über keine der beiden Haltestellen. Alle diese Varianten heißen VBB 838 und sind sogar vom gleichen Betreiber.