Transporte público em Porto Alegre

Atualizei a lista de tarefas:
http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Brazil/RS/Porto_Alegre/Status#TO-DO

Infelizmente o tamanho do projeto na para de crescer!

Seria bom criar tarefas simples que pudessem ser adotadas por contribuidores mais casuais.

Eu comecei a fazer essa importação do IBGE: http://wiki.openstreetmap.org/wiki/Import/Catalogue/Brazil_IBGE_Subnormal_Agglomerates

E a equipe de importação de dados me pediu para parar o processo e obter uma cópia da licença dos dados. Não consegui essa cópia, nem mesmo nos dados dessas importações. Ali há cópias de comunicações, que foi tudo que eu consegui também, e repassei para a lista com uma tradução para o inglês. Ainda assim, o texto é muito informal pra ser considerado como tendo solidez jurídica.

Desde então eu sempre tento conseguir a informação jurídica desde o começo. Justamente por causa da burocracia e da demora, acho que o melhor é levar ela em paralelo com as questões técnicas. Nesse caso, acho que deveríamos perguntar para a PMPA se podemos copiar os dados.

O que acontece: vai que lá pela metade descobrimos que a informação não pode ser usada para fins comerciais. (Veja o caso da base de CEP dos Correios, é vendida e tem copyright, não é domínio público.) Se isso acontecer, perdemos tempo, e teremos que reverter as alterações, o que significa que qualquer outra contribuição feita sobre os dados nesse meio tempo também são perdidos. Ou seja, é importate ter certeza.

Mas podemos falar com o Hasenack ou o Weber para conseguir alguma informação adiantada então. Você conhece eles pessoalmente?

Eu tive aula com o Hasenack dez anos atras; nao acho q ele se lembraria de mim. A minha expectativa com relacao ao governo eh bem pessimista. Nao acho que vamos conseguir uma licenca aberta. A minha unica experanca eh quando o governo eh forcado, como p.ex. LAI ou quando ha financiamento via Banco Mundial e ha uma clausula exigindo dados abertos. Pior do que incompetente, governo brasileiro tende a ser obstrucionista tb.

Direcionei aqui: https://groups.google.com/forum/#!topic/lista-inda-gt3/i0-tciCcVe8

Pensei que a importação dos números das casas seria fácil, daí fiz um pré-limpeza dos dados da numeração das casas pra importação (seguindo o validador do JOSM), mas me enganei e vou precisar fazer mais antes de deixar pronto pra um script que gere os interpoladores (há praças misturadas com as ruas, e também algo que eu acho que são linhas diretrizes, que não devem ser importadas nem consideradas na numeração, há vias sem dados e também há vias que não batem com a imagem do Bing). Então assim, vou continuar com a importação das rotas de ônibus e das paradas e fazer o dos números de casas mais perto do fim de semana.

Li a discussao:
<http://lists.openstreetmap.org/pipermail/imports/2013-July/001988.html>
e concluo que a comunicacao escrita emitida IBGE serve para o OSM como licenciamento aceitavel dos dados, nao?

Concordo, claro.

É importante que a comunicação com o governo seja direcionada para evitar respostas evasivas.
Por exemplo, perguntar assim:
*
Acredito que os dados X produzidos pelo órgão Y sejam de domínio público.
Normalmente é assim para dados que o governo produz.
Caso os dados X sejam uma exceção, favor notificar-me
dos termos de restrição do seu uso e redistribuição.
*
Também vou começar usar esse sistema para documentar as solicitações: <http://www.queremossaber.org.br/>

Quem bom que as mensagens dessa lista ficam publicadas (vou até copiar o link no artigo do wiki), assim acho que tem algum valor jurídico sim. O ideal seria usar o próprio jargão jurídico, mas tanto assim eu não espero conseguir.

Ainda não sei se funciona bem, descobri isto hoje: http://www.acessoainformacao.gov.br/sistema/

Eu tenho solicitado as informações parecido com o que você propôs, sempre perguntando se os dados são de domínio público (pra tentar conseguir uma resposta clara do tipo “sim” ou “não”) e sendo gentil para estimular a cooperação (ainda que demorada).

Talvez vc queira botar uma lenha na fogeira la:

https://groups.google.com/d/msg/thackday/hQ-LB65xhDY/wC7foijZFm4J

Contar da sua experiencia com o OSM vs. IBGE e tal…

Abc,
-F.

Postei! :smiley:

Só pra constar, se o site da EPTC está mesmo mais atualizado que o do PoaTransporte, então as seguintes mudanças aconteceram:

Linha 4732 (PoaTransporte) substituída pela 4733
Linha 4922 pela 492
Linha 476 pela 4763

Parecem ter sido mudanças da empresa responsável por operar a linha. Vou tentar o contato com uma amiga que já trabalhou na EPTC pra confirmar. Esse delay é bem provável. Tem uma linha (a 173) cuja rota eu conheço bem e que mudou há um certo tempo (por causa das obras na Padre Cacique) e ela ainda está com o traçado antigo (passando pelo trajeto em obras) no PoaTransporte.

Depois de ver o caos que é o registro de nomes de linhas da EPTC, decidi fazer uma revisão do formato do nome das linhas de ônibus. Conversei com algumas pessoas e parece que o formato geral tende a ser este:

partida_aproximada_1 - partida_aproximada_2 (via_1 / via_2 /…) / chegada_aproximada_1 - chegada_aproximada_2 [dias]

Traduzindo:

  • “A - B” significa “linha vai para A, mais especificamente para B perto de A”
  • “A (B / C)” significa “linha vai para A passando por B e C no meio do caminho”
  • “A [domingos, feriados]” significa “linha A aos domingos e feriados”

O registro da EPTC quebra essa regra algumas vezes (marca com “/” lugares que não são destinos finais, muda a ordem das coisas). Isso acontece com mais frequência nas linhas não radiais (A’s, T’s, D’s, etc.). Pra esclarecer mais do que confundir, tentei aproximar o máximo possível desse formato sem mudar a ordem das palavras; é bem provável que a ordem seja a mesma nos letreiros dos ônibus, embora em algumas linhas que eu conheço melhor eu já sei que não é igual. Terminado isso vou pedir pra amigos revisarem. O ideal mesmo seria dar o nome que aparece no letreiro.

Se você quiser acompanhar o status da revisão (comecei ela ontem à noite): https://docs.google.com/spreadsheet/ccc?key=0Aut_CDnmHfE7dDQ2SWc0STdlV29VUW1PWFlfZ0xEY3c#gid=0

Dei permissão para deixar comentários na própria planilha, mas pode fazer aqui também. Ah, e comecei de trás pra frente (foi a ordem com que o JOSM carregou os arquivos :P).

Faltou acrescentar a coluna com as rotas. Vou revisar no final, mas tive a impressão de que esse formato não se aplica tão bem a rotas que são circulares.

Será q vai dar muito trabalho atualizar o OSM qnd a EPTC atualizar o PoaTransporte?

Se você puder listar algumas tarefas atômicas – não no sentido de explosivas, mas de serem auto-contidas. Confesso que atualmente não sei nem por onde começar… Desde coisas mais braçais, do tipo conversão em planilha, até mais complexas, como JSON.

Valeu.
-Felipe.

Praticamente terminei a revisão dos nomes, se você quiser dar uma olhada, questionar, opinar, passar para outras pessoas, fique à vontade (quanto mais gente dando opinião, melhor). Pretendo fazer uma última revisão ainda mais tarde.

O trabalho é bastante complexo. Eu comecei a pensar em como poderia quebrar em operações atômicas (mas não explosivas :P) que eu pudesse delegar (a você ou a outras pessoas também) mas no fim acho bem difícil fazer isso, o processo é todo intrincado. Na tentativa de entender como eu faria isso, eu desenhei um workflow quebrando as tarefas e os produtos intermediários: http://i.imgur.com/bm9Sdw9.png

Hoje eu comecei o balão “quebras manuais”. Praticamente tudo aí até os balões “script” é melhor ficar comigo porque eu já fiz scripts que lêem essas fontes de dados (é só adaptar para cada caso, o mais difícil é interpretar os dados da fonte e isso eles já fazem). Eu já tinha os scripts há alguns meses, só não tinha mergulhado no processo porque ainda não conhecia a conflação.

Eu poderia talvez dividir os arquivos .osm que eu gerei com você ou com mais pessoas, mas mesmo isso não é tão eficiente, o mais rápido é fazer todas as quebras (nas ruas e nas rotas) de uma vez só, visualizando todas as rotas sobrepostas, e daí é melhor que uma pessoa só faça. Eu queria tentar fazer com apenas 3 changesets: um para as quebas das ruas, outro para as relações das rotas, e um último para as paradas. Assim fica muito fácil reverter se for necessário.

Algo que poderia ser visto em paralelo é a configuração do servidor OTP (deve ter bastante configuração para ler). Você poderia tentar instalar ele no seu computador. Teria que ser num sistema Linux porque esse será o ambiente em qualquer web hosting que conseguirmos depois. Eu tinha olhado um serviço dedicado da Bluehost, e o ambiente deles seria um CentOS, então um provável atalho pra fazer testes seria instalar um CentOS numa VM, e daí instalar o OTP no CentOS, e daí jogar no OTP os arquivos que eu estou gerando. Quando chegasse a hora de colocar no ar, bastaria repetir os mesmos passos no web host que contratarmos.

Links pra baixar o CentOS via Torrent:
http://mirror.centos.org/centos/6.4/isos/i386/CentOS-6.4-i386-bin-DVD1to2.torrent
http://mirror.centos.org/centos/6.4/isos/x86_64/CentOS-6.4-x86_64-bin-DVD1to2.torrent

Poderíamos tentar também conseguir um ambiente pro OTP nos servidores de alguma universidade (UFRGS ou PUC ou Unisinos), ou até com a Prefeitura. O único problema é que, quando foge do controle de alguém da comunidade, a comunidade perde o poder de fazer correções e manter o serviço atualizado, que é o principal poder do crowdsourcing.

Ah, lembrei que você mencionou o OSM2GTFS. De repente você podia testar a ferramenta em outra cidade que já tenha as rotas e as paradas mapa, só pra saber como ela funciona e como podemos usá-la.

  • descobri a Open Source Routing Machine (OSRM, <http://wiki.openstreetmap.org/wiki/OSRM>) e confirmei com o pessoal do TransportesPublicos.pt que “o OSRM procura simplesmente o caminho mais curto, o OTP tem em conta a especificidade dos transportes públicos. Isto é, o caminho percorrido por um autocarro não é necessariamente o mais curto entre dois pontos, existem horários que devem ser cumpridos e diversos modos de transporte que só se podem combinar em pontos específicos (paragens/estações) etc.”

  • atualizei a lista de tarefas, adicionando links para as possibilidades de ferramentas para ajudar na automatizacao (osm2gtfs, etc.) tb separei a tarefa de numeracao das vias; tb tentei incorporar as info q estavam no teu diagrama; veja o resultado em <http://wiki.openstreetmap.org/w/index.php?title=Talk%3AWikiProject_Brazil%2FRS%2FPorto_Alegre%2FStatus&diff=927302&oldid=925703>

  • sobre a importacao das rotas, nao ficou claro se vc esta usando o PoaTransporte/JSON ou os itinerarios da EPTC em texto puro – ou ambos?

  • baixei o OTP.

Estou usando ambos PoaTransporte e EPTC. A EPTC fornece os dados em arquivos HTML, eu converto para texto puro para poder trabalhar os dados mais facilmente nos scripts.

Os dados do PoaTransporte não incluem a informação da empresa responsável (que serve para preenche a tag “operator” na relação da rota com, por exemplo, “STS” ou “Carris”) e a informação da direção da rota é indicada num sufixo do código da linha (algo que não existe no registro da EPTC). Por exemplo, a linha 127-2 do PoaTransporte é a linha 127 da EPTC no sentido Bairro > Centro. O problema é que só o “-2” não significa muita coisa, em várias linhas ele significaria Bairro > Terminal ao invés de Bairro > Centro e num caso particular ele significa Sul > Norte, em outras várias linhas ele nem sequer existe (só o “-1”), que pode ser ainda mais coisas (é usado, por exemplo, para as linhas circulares). Acho isso uma complicação desnecessária, mas já que eles decidiram fazer assim, no mínimo podiam ter incorporado a direção textual num campo extra no JSON, mas não fizeram.

Muito interessantes os links que você colocou na lista de tarefas. Vou olhar eles um por um assim que terminar de importar as rotas.

Decidi dar uma olhada se eu estava fazendo tudo segundo os padrões adotados por outros países, e daí acabei fazendo uma última alteração. Eu estava preenchendo os campos “from” e “to” com as direções “centro”, “bairro” ou “terminal” de acordo com a informação no início dos itinerários da EPTC, mas em todos os outros países essa informação sempre é o nome de um terminal ou de uma estação. A EPTC tem essa informação no início e no final de cada itinerário (embora poucas pessoas a usem), então para seguir o padrão decidi usá-la e daí colocar a direção (centro/bairro, bairro/centro, etc.) no campo “description”.

Uma coisa que você pode fazer é criar uma página do wiki específica para o transporte em Porto Alegre (sugiro esta: http://wiki.openstreetmap.org/wiki/WikiProject_Brazil/RS/Porto_Alegre/Transporte)) baseando-se no modelo de outras cidades (http://wiki.openstreetmap.org/wiki/Buses#Buses_by_city). Analisei algumas e me parece que na Suíça eles seguiram bem o padrão do wiki (http://wiki.openstreetmap.org/wiki/Proposed_features/Public_Transport) enquanto que em outros lugares há variações (algumas ruins, como o uso do caractere Unicode “→” na França e na Itália) e coisas que nunca ganharam popularidade (como a tag “line” na Alemanha). Estou me espelhando mais no modelo Suíço por causa disso. Para o wiki, me parece que tanto a cidade de Zurich (mais organizada) quanto a de Buenos Aires (mais fácil de manter) estão bem estruturadas, seriam bons pontos de partida.

Você pode também já criar uma subpágina (sugiro http://wiki.openstreetmap.org/wiki/WikiProject_Brazil/RS/Porto_Alegre/Transporte/Atualizacoes)) para que eu possa escrever um roteiro de como atualizar esses dados (rotas, paradas, feeds GTFS, etc.) quando a informação na EPTC e no PoaTransporte muda. Se quiser pode preencher alguma coisa como as suas principais dúvidas (coisas do tipo “como detectar alterações”, “o que fazer quando muda o terminal de uma rota”, “o que fazer quando a rota muda de código”, etc.). Se possível, também colocar links para todas essas páginas na página principal (http://wiki.openstreetmap.org/wiki/WikiProject_Brazil/RS/Porto_Alegre).

Brasilia esta usando (parcialmente) o OSM para transporte publico:

<http://www.sistemas.dftrans.df.gov.br/horarios/src/mapas/index>

Parcialmente pq parece q o OSM so serve de pano de fundo.
Pesquisei as relacoes com o JOSM e so encontro linhas de metro:
http://wiki.openstreetmap.org/wiki/Bras%C3%ADlia_Metro

Parece que as linhas de onibus estao em arquivos externos:
http://www.sistemas.dftrans.df.gov.br/horarios/src/extras/mapa.js

-F.

Opa, nao tinha recebido notificacao dessa msg. Vou mexer nisso no final de semana.