Transporte público em Porto Alegre

Algumas informacoes:

http://www.nctr.usf.edu/wp-content/uploads/2011/06/77926.pdf:
ADDRESS RANGE AND LOCATION FILE: OSM users document address ranges for roads [10, pp. 86‐87] by recording an address at each end of a road segment and then indicating that address values between the endpoints are to be interpolated along the road. Tags used for addressing begin with the prefix addr:, as in
addr:housenumber=
.*

E isso tambem:
http://www.ecologia.ufrgs.br/labgeo/arquivos/downloads/dados/Diagnostico_Ambiental_POA/cd/Conteudo_do_Cd.pdf
Eixos de ruas do município de Porto Alegre, contendo os logradouros registrados nos mapas 1:15.000, 1: 10.000, 1:5.000 ou 1:1.000 e/ou cadastrados no CDL - Cadastro de Denominação de Logradouro.

http://www.ecologia.ufrgs.br/labgeo/arquivos/downloads/dados/Diagnostico_Ambiental_POA/cd/Base_cartografica_UTM_SAD69/eixos_ruas__UTM_SAD.zip
*Shape file eixos_ruas.shp (eixos de ruas do município de Porto Alegre, fornecidos pela prefeitura)

  • Smf_i_i: campo numérico contendo a numeração inicial do lado ímpar de cada segmento de eixo de rua
  • Smf_i_f: campo numérico contendo a numeraçào final do lado ímpar de cada segmento de eixo de rua
  • Smf_p_i: campo numérico contendo a numeração inicial do lado par de cada segmento de eixo de rua
  • Smf_p_f: campo numérico contendo a numeração final do lado par de cada segmento de eixo de rua
  • Categoria: campo do tipo texto (string) contendo a categoria de cada eixo de rua
  • Preposicao: campo do tipo texto (string) contendo a preposição que fica entre a categoria e o nome de cada eixo de rua
  • Nome: campo do tipo texto (string) contendo o nome de cada eixo de rua
  • Avreviat: campo do tipo texto (string) contendo uma abreviatura de cada eixo de rua
  • Cep: campo numérico contendo o CEP de cada trecho de eixo de rua
  • Grupo_cep: campo numérico contendo o grupo de CEP de cada trecho de eixo de rua*

Dava para comecar a usar essa versao para testar, e depois pedir uma versao atualizada para a Procempa, para so entao fazer a importacao.

Como sera que esses dados alteram a lista de tarefas?

Exato. Infelizmente aqui não se tem o mesmo costume na Argentina (que também tem mapas com números de casa faltando ou errados). Lá eles geralmente se referem ao cruzamento de duas ruas, não ao endereço. (Se for pensar a fundo, é bem mais fácil e rápido lembrar de um lugar assim do que com número de endereço.)

Eu já coloquei a numeração em três lugares: Avenida Guaíba (é um caso excepcional, com numeração maluca), a Avenida Otto Niemeyer (meu primeiro laboratório) e a Avenida Bastian. Nessa última, fiz com inspeção (caminhando) registrando os números e a posição com o GPS do celular. Não é difícil. Estou pra fazer o upload das 2 ruas paralelas, que eu coletei numa caminhada de menos de 1 hora. Acho que pode-se fazer 1 bairro inteiro em 4 horas. Eu faria, se não estivesse agora envolvido com essa questão do transporte. Indo de carro e de dupla (um motorista e um anotando os números), dá pra fazer até mais (só é necessário parar em cada esquina e gastar com a gasolina).

Mas pode ser que tudo isso seja em vão e que a PROCEMPA ou a Prefeitura já tenha essa informação, fácil ou razoavelmente fácil de importar. Talvez eles tenham de forma textual (por exemplo, entre as ruas A e B na rua C a numeração vai de X a Y do lado esquerdo e de W a Z do lado direito). Se conseguirmos um contato por lá, poderíamos pensar numa importação disso também e o problema estaria resolvido.

Cara, que fantástico isso! Estou num conflito agora: importo primeiro as rotas e as paradas ou os números das casas? Ambos demandam um certo tempo, mas o da numeração das casas pode ser automatizado.

Mandei um e-mail pro Instituto de Geologia perguntando se esses dados têm licença de uso ou copyright e, se tiverem, se podemos conseguir uma autorização para publicá-los através do OSM. Acredito que temos sim, mas é bom verificar.

Na UFRGS so tem Inst. Geociencias, Depto. de Geologia. Mas aquele trabalho foi feito no Inst. Biociencias, Centro de Ecologia, Laboratorio de Geoprocessamento. Veja contatos em http://www.ecologia.ufrgs.br/labgeo/index.php?option=com_content&view=article&id=9&Itemid=12. Nao adianta contatar burocratas na secretaria ou diretoria, melhor falar com alguem que entende do assunto, como o Hasenack ou o Weber.

Mas no PDF de documentacao dos dados esta dito que: Eixos de ruas: Material original cedido em meio digital pela Prefeitura Municipal de Porto Alegre, através da Procempa. Entao a UFRGS nao pode responder pelos dados produzidos pela PMPA.

Sugiro a gente se preocupar com a parte tecnica em paralelo a essa questao juridica, pois ela pode demorar. Supondo conseguirmos copia atualizada desses dados de eixo numerados das vias atraves da Lei de Acesso a Informacao, nao sei se essa lei poe restricoes no uso ou repasse das informacoes acessadas. Teria que perguntar em grupos de discussao especificos. P.ex., as bases do IBGE vem sendo importadas no OSM, veja esforcos semelhantes em http://wiki.openstreetmap.org/wiki/WikiProject_Brazil/Importa%C3%A7%C3%B5es e http://wiki.openstreetmap.org/wiki/WikiProject_Brazil/Importa%C3%A7%C3%B5es/Prefeituras.

Atualizei a lista de tarefas:
http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Brazil/RS/Porto_Alegre/Status#TO-DO

Infelizmente o tamanho do projeto na para de crescer!

Seria bom criar tarefas simples que pudessem ser adotadas por contribuidores mais casuais.

Eu comecei a fazer essa importação do IBGE: http://wiki.openstreetmap.org/wiki/Import/Catalogue/Brazil_IBGE_Subnormal_Agglomerates

E a equipe de importação de dados me pediu para parar o processo e obter uma cópia da licença dos dados. Não consegui essa cópia, nem mesmo nos dados dessas importações. Ali há cópias de comunicações, que foi tudo que eu consegui também, e repassei para a lista com uma tradução para o inglês. Ainda assim, o texto é muito informal pra ser considerado como tendo solidez jurídica.

Desde então eu sempre tento conseguir a informação jurídica desde o começo. Justamente por causa da burocracia e da demora, acho que o melhor é levar ela em paralelo com as questões técnicas. Nesse caso, acho que deveríamos perguntar para a PMPA se podemos copiar os dados.

O que acontece: vai que lá pela metade descobrimos que a informação não pode ser usada para fins comerciais. (Veja o caso da base de CEP dos Correios, é vendida e tem copyright, não é domínio público.) Se isso acontecer, perdemos tempo, e teremos que reverter as alterações, o que significa que qualquer outra contribuição feita sobre os dados nesse meio tempo também são perdidos. Ou seja, é importate ter certeza.

Mas podemos falar com o Hasenack ou o Weber para conseguir alguma informação adiantada então. Você conhece eles pessoalmente?

Eu tive aula com o Hasenack dez anos atras; nao acho q ele se lembraria de mim. A minha expectativa com relacao ao governo eh bem pessimista. Nao acho que vamos conseguir uma licenca aberta. A minha unica experanca eh quando o governo eh forcado, como p.ex. LAI ou quando ha financiamento via Banco Mundial e ha uma clausula exigindo dados abertos. Pior do que incompetente, governo brasileiro tende a ser obstrucionista tb.

Direcionei aqui: https://groups.google.com/forum/#!topic/lista-inda-gt3/i0-tciCcVe8

Pensei que a importação dos números das casas seria fácil, daí fiz um pré-limpeza dos dados da numeração das casas pra importação (seguindo o validador do JOSM), mas me enganei e vou precisar fazer mais antes de deixar pronto pra um script que gere os interpoladores (há praças misturadas com as ruas, e também algo que eu acho que são linhas diretrizes, que não devem ser importadas nem consideradas na numeração, há vias sem dados e também há vias que não batem com a imagem do Bing). Então assim, vou continuar com a importação das rotas de ônibus e das paradas e fazer o dos números de casas mais perto do fim de semana.

Li a discussao:
<http://lists.openstreetmap.org/pipermail/imports/2013-July/001988.html>
e concluo que a comunicacao escrita emitida IBGE serve para o OSM como licenciamento aceitavel dos dados, nao?

Concordo, claro.

É importante que a comunicação com o governo seja direcionada para evitar respostas evasivas.
Por exemplo, perguntar assim:
*
Acredito que os dados X produzidos pelo órgão Y sejam de domínio público.
Normalmente é assim para dados que o governo produz.
Caso os dados X sejam uma exceção, favor notificar-me
dos termos de restrição do seu uso e redistribuição.
*
Também vou começar usar esse sistema para documentar as solicitações: <http://www.queremossaber.org.br/>

Quem bom que as mensagens dessa lista ficam publicadas (vou até copiar o link no artigo do wiki), assim acho que tem algum valor jurídico sim. O ideal seria usar o próprio jargão jurídico, mas tanto assim eu não espero conseguir.

Ainda não sei se funciona bem, descobri isto hoje: http://www.acessoainformacao.gov.br/sistema/

Eu tenho solicitado as informações parecido com o que você propôs, sempre perguntando se os dados são de domínio público (pra tentar conseguir uma resposta clara do tipo “sim” ou “não”) e sendo gentil para estimular a cooperação (ainda que demorada).

Talvez vc queira botar uma lenha na fogeira la:

https://groups.google.com/d/msg/thackday/hQ-LB65xhDY/wC7foijZFm4J

Contar da sua experiencia com o OSM vs. IBGE e tal…

Abc,
-F.

Postei! :smiley:

Só pra constar, se o site da EPTC está mesmo mais atualizado que o do PoaTransporte, então as seguintes mudanças aconteceram:

Linha 4732 (PoaTransporte) substituída pela 4733
Linha 4922 pela 492
Linha 476 pela 4763

Parecem ter sido mudanças da empresa responsável por operar a linha. Vou tentar o contato com uma amiga que já trabalhou na EPTC pra confirmar. Esse delay é bem provável. Tem uma linha (a 173) cuja rota eu conheço bem e que mudou há um certo tempo (por causa das obras na Padre Cacique) e ela ainda está com o traçado antigo (passando pelo trajeto em obras) no PoaTransporte.

Depois de ver o caos que é o registro de nomes de linhas da EPTC, decidi fazer uma revisão do formato do nome das linhas de ônibus. Conversei com algumas pessoas e parece que o formato geral tende a ser este:

partida_aproximada_1 - partida_aproximada_2 (via_1 / via_2 /…) / chegada_aproximada_1 - chegada_aproximada_2 [dias]

Traduzindo:

  • “A - B” significa “linha vai para A, mais especificamente para B perto de A”
  • “A (B / C)” significa “linha vai para A passando por B e C no meio do caminho”
  • “A [domingos, feriados]” significa “linha A aos domingos e feriados”

O registro da EPTC quebra essa regra algumas vezes (marca com “/” lugares que não são destinos finais, muda a ordem das coisas). Isso acontece com mais frequência nas linhas não radiais (A’s, T’s, D’s, etc.). Pra esclarecer mais do que confundir, tentei aproximar o máximo possível desse formato sem mudar a ordem das palavras; é bem provável que a ordem seja a mesma nos letreiros dos ônibus, embora em algumas linhas que eu conheço melhor eu já sei que não é igual. Terminado isso vou pedir pra amigos revisarem. O ideal mesmo seria dar o nome que aparece no letreiro.

Se você quiser acompanhar o status da revisão (comecei ela ontem à noite): https://docs.google.com/spreadsheet/ccc?key=0Aut_CDnmHfE7dDQ2SWc0STdlV29VUW1PWFlfZ0xEY3c#gid=0

Dei permissão para deixar comentários na própria planilha, mas pode fazer aqui também. Ah, e comecei de trás pra frente (foi a ordem com que o JOSM carregou os arquivos :P).

Faltou acrescentar a coluna com as rotas. Vou revisar no final, mas tive a impressão de que esse formato não se aplica tão bem a rotas que são circulares.

Será q vai dar muito trabalho atualizar o OSM qnd a EPTC atualizar o PoaTransporte?

Se você puder listar algumas tarefas atômicas – não no sentido de explosivas, mas de serem auto-contidas. Confesso que atualmente não sei nem por onde começar… Desde coisas mais braçais, do tipo conversão em planilha, até mais complexas, como JSON.

Valeu.
-Felipe.

Praticamente terminei a revisão dos nomes, se você quiser dar uma olhada, questionar, opinar, passar para outras pessoas, fique à vontade (quanto mais gente dando opinião, melhor). Pretendo fazer uma última revisão ainda mais tarde.

O trabalho é bastante complexo. Eu comecei a pensar em como poderia quebrar em operações atômicas (mas não explosivas :P) que eu pudesse delegar (a você ou a outras pessoas também) mas no fim acho bem difícil fazer isso, o processo é todo intrincado. Na tentativa de entender como eu faria isso, eu desenhei um workflow quebrando as tarefas e os produtos intermediários: http://i.imgur.com/bm9Sdw9.png

Hoje eu comecei o balão “quebras manuais”. Praticamente tudo aí até os balões “script” é melhor ficar comigo porque eu já fiz scripts que lêem essas fontes de dados (é só adaptar para cada caso, o mais difícil é interpretar os dados da fonte e isso eles já fazem). Eu já tinha os scripts há alguns meses, só não tinha mergulhado no processo porque ainda não conhecia a conflação.

Eu poderia talvez dividir os arquivos .osm que eu gerei com você ou com mais pessoas, mas mesmo isso não é tão eficiente, o mais rápido é fazer todas as quebras (nas ruas e nas rotas) de uma vez só, visualizando todas as rotas sobrepostas, e daí é melhor que uma pessoa só faça. Eu queria tentar fazer com apenas 3 changesets: um para as quebas das ruas, outro para as relações das rotas, e um último para as paradas. Assim fica muito fácil reverter se for necessário.

Algo que poderia ser visto em paralelo é a configuração do servidor OTP (deve ter bastante configuração para ler). Você poderia tentar instalar ele no seu computador. Teria que ser num sistema Linux porque esse será o ambiente em qualquer web hosting que conseguirmos depois. Eu tinha olhado um serviço dedicado da Bluehost, e o ambiente deles seria um CentOS, então um provável atalho pra fazer testes seria instalar um CentOS numa VM, e daí instalar o OTP no CentOS, e daí jogar no OTP os arquivos que eu estou gerando. Quando chegasse a hora de colocar no ar, bastaria repetir os mesmos passos no web host que contratarmos.

Links pra baixar o CentOS via Torrent:
http://mirror.centos.org/centos/6.4/isos/i386/CentOS-6.4-i386-bin-DVD1to2.torrent
http://mirror.centos.org/centos/6.4/isos/x86_64/CentOS-6.4-x86_64-bin-DVD1to2.torrent

Poderíamos tentar também conseguir um ambiente pro OTP nos servidores de alguma universidade (UFRGS ou PUC ou Unisinos), ou até com a Prefeitura. O único problema é que, quando foge do controle de alguém da comunidade, a comunidade perde o poder de fazer correções e manter o serviço atualizado, que é o principal poder do crowdsourcing.

Ah, lembrei que você mencionou o OSM2GTFS. De repente você podia testar a ferramenta em outra cidade que já tenha as rotas e as paradas mapa, só pra saber como ela funciona e como podemos usá-la.