Nossa, Lucas, excelente esse projeto do GitHub das linhas, eu andava me perguntando se "caberia" upar arquivos de dados para o projeto "TarifaPoa", mas agora certamente apareceu um GitHub bem mais focado em mastigação nérdica dos dados tabulares da EPTC e da Prefeitura.
Em especial achei excelente ter se dedicado em escrever um readme bonitinho, deixando tudo muito claro. Vou examinar os arquivos com certeza.
No site TarifaPoa, acabei por sorte encontrando uns "backdoors" que talvez te interessem. Posto eles para que tu possa incluir no projeto, caso tenha interesse:
URL para um JSON com as linhas:
http://www.poatransporte.com.br/php/facades/process.php?a=nc&p=%&t=o URL para um JSON com todas as paradas:
http://www.poatransporte.com.br/php/facades/process.php?a=tp&p=-31,-52,-28,-50 URL para um JSON com os dados geográficos (coordenadas) de uma linha (exemplo, linha com código 123456):
http://www.poatransporte.com.br/php/facades/process.php?a=il&p=123456 (Às vezes me pergundo se a gente pedisse um dump do banco de dados da EPTC, se eles não dariam pra nós "na boa", embora por outro lado seja divertido esse jogo de scraping...)
Vamos falando
Helton