Olá, bom dia Fernando!! Tudo bem meu caro?
Então vou tentar te explicar aqui:
Sou Engenheiro de Transportes (Mobilidade Urbana) e trabalhamos com uma base de bilhetagem eletrônica muito grande e por agora decidimos aplicar uns conceitos da área com ajuda desses dados incluindo também dados de GPS (cartão e dos ônibus).
Comecei a estudar o PY mas assim, ainda estou no inicio do inicio, mas a cada dia vou tentando estudar um pouco (já sei mandar printar na tela: "hello world", HAHAHAHHAHAHAH). Quero estudar para poder usar nessa área de DADOS.
Geralmente quando vamos fazer um planejamento e/ou estudo para Transporte Público temos que realizar algumas pesquisas em campo: Pesquisa de Origem e Destino do Usuário e Pesquisa Sobe/Desce (onde o usuário embarca e desembarca) além de outras é claro. Mas vamos falar dessas duas.
Como temos dados de Bilhetagem Eletrônica e dados de posicionamento (tanto do carro quanto do usuário que usa cartão >>> isso se o validador {instrumento que você encosta o cartão para validar a passagem} estiver com GPS ligado) fizemos meio que uma rotina no excel para esse tipo de trabalho: Origem/Destino e Sobe/Desce. Mas aí temos algumas limitações quanto ao uso do excel: tamanho do banco de dados, fórmulas e afins.
Aí estávamos pensando em fazer uma rotina ou algo nesse sentido para tornar nosso trabalho o mais automatizado possível, pois assim prevemos que com o tempo podemos conseguir gerar indicadores em real time para nossos estudos.
BASICAMENTE PARA ESTUDO DE SOBE/DESCE (mais complexo que o ORIGEM/DESTINO):
1. Pegamos a base de dados de transação de uma linha qualquer de um dia em específico;
2. Dados BASE CARRO: Linha; Número Linha; Código da Linha; Numero Carro; Numero do Cartao Usuário; Data Transação; Hora Transação (HH:MM); Latitude; Longitude; (
aqui entendemos o comportamento da linha em estudo)
3. Dados BASE CARTÃO USUÁRIO:
Número do Cartão Usuário (histórico do dia); Data Transação; Hora Transação (HH:MM); Latitude (
qndo possivel); Longitude
(
qndo possivel); Linhas Usadas; Números das Linhas Usadas; Códigos das Linhas Usadas; Números do Carros Usados (
aqui entendemos o comportamento do usuário)4. Criamos um Código em Comum para ambos os dados: NUMERO CARRO + HORA TRANSAÇÃO + DATA TRANSAÇÃO. Assim conseguimos obter os LAT e LONG dos usuários que não foram georreferenciados;
5. Voltamos para BASE CARRO, separamos as viagens de ida e volta da linha no dia inteiro (ou período que queremos estudar).
6. Conseguimos atribuir qual viagem o usuário está naquela linha.
7. Na BASE CARTAO USUÁRIO vamos trabalhar só com quem tem mais de 2 transações/dia (par ida/volta).
8. Marcamos esse usuário na BASE CARRO (usuário que nos permite analisar comportamento de onde subiu e onde desceu).
9. Jogamos essa nova base para ferramenta de geoprocessamento para fazer análise espacial (aqui conseguimos gerar uma rotina dentro do software que possibilitou fazer isso de forma automatizada).
10. Temos novamente uma outra base de dados de comportamento da linha e comportamento do usuário.
11. Extraímos essa nova base. Analisamos as viagens que nos interessam.
12. Elaboramos uma planilha para soltar indicadores.
13. Obtenção de indicadores.
Basicamente é esse o trabalho que desenvolvemos.
Podemos falar que temos 2 partes: análise dos dados e análise espacial.
A parte de dados já foi desenvolvida no excel mas acho que conseguimos melhorar com PY ou R. COM CERTEZA.
A parte de análise espacial já está mais desenvolvida, acho que chegamos no que queremos, MAS podemos tentar integrar tudo: DADOS E ESPACIAL. Hoje feito de forma separada.
Fernando nao sei se deu pra entender, mas basicamente esse é o estudo que fazemos.
Qualquer coisa deixo meu contato ai: 21 98100 0797.
Tem tambem um site para entender melhor o que fazemos:
É um trabalho desenvolvido na Argentina, mas semelhante ao que fazemos por aqui.
Do mais Fernando é isso dai.