Detta inlägg är gammalt och kan innehålla inaktuell information.

Tabeller till Norge

Hej

Jag sitter på Norsk Reiseinformasjon i Oslo, vi gör exakt samma saker som ni, fast för Norge. Jag försöker använda mig av sweden.zip för att importera de tidtabeller som passerar gränsen mellan Norge och Sverige. Har dock inte lyckats lista ut vilket route_id jag ska importera.

Främst behöver jag ID för tågen Oslo-Stockholm, Narvikståget och Trondheim-Sundsvall. Värmlandstrafikens tåg får jag via NSB men kan gärna få ett ID där också så jag kan jämföra data.
På bussfronten är det Swebus Oslo-Stockholm och Oslo-Göteborg-Köpenhamn, GoByBus Oslo-Göteborg-Köpenhamn och Västtrafiks linje 111 Halden-Strömstad.

Vi hade tidigare ett par bussar till Bodø, men dom verkar ha lagts ner. Lite osäker på om det är nåt annat som passerar gränsen än dom jag redan nämnt.

Flygtrafiken får vi från flygbolagen så den är inte aktuell här.

Hade varit behjälpligt om ni kunde ge mig en lista på vilka route_id jag behöver se på, eller peka mig till en översikt på vad som är vad.

Ser dessutom att ni har ganska kort giltighet på era data. Laddade hem förra veckan och det va bara giltigt till 14/6 (20140414,20140614) om jag har förstått calendar.txt riktigt. Är det alltid så kort giltighet?

mvh Johan

Kommentarer

  • Hej Johan!
    Ett sätt att få ut denna data är att köra lite grep-kommando.
    Det är dock en ganska stor inlärningströskel om man inte är bekant med kommandorader, men kopiera och klistra in borde fungera.

    Här är kommando som kan köras på linux, eller i Cygwin som går att installera på Windows-datorer. (Troligen går det även att få kommandona att lira på Mac) Kommandot är testat Cygwin.

    Följande kommando ger dig listan med alla route_id som trafikerar norska hållplatser:

    egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt | awk -F, '{print ""$1""}' | sort | uniq

    Kör jag kommandot i en mapp med sweden.zip från 2014-04-22 uppackad får jag följande route_id:

    269_91_BLT_273
    279_4111_BLT_262
    315_70_J_314
    315_J_314
    327_BXBN
    328_BXBN
    690_820_BXBN
    690_888_BXBN
    694_JRE_74
    74_BIC
    74_J
    74_JIC
    74_JICN
    74_JNT
    74_JRE
    76_J_74

    Lite förklaringar till kommandot (Dessa kommando kan köras separat):

    Plocka ut en lista med alla rader på norska hållplatser i stops.txt. (Regexpen ^76[^,]+ matchar norska som börjar på 76)

    egrep "^76[^,]+" -o stops.txt

    Resultat:
    7601214
    7601215
    7601213
    7601210
    ...osv

    Skapa en lista med regexp för att använda i stop_times.txt utifrån urvalet av hållplatser.

    egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}'

    Resultat:
    ^[^,]+,[^,]+,[^,]+,7601214,
    ^[^,]+,[^,]+,[^,]+,7601215,
    ^[^,]+,[^,]+,[^,]+,7601213,
    ^[^,]+,[^,]+,[^,]+,7601210,
    ...osv

    Ger oss listan med alla stop_times på norska hållplatser.

    egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt

    Resultat:
    53223931,12:40:00,12:40:00,7602402,1,,,,
    53223931,13:08:00,13:08:00,7602405,2,,,1,
    53223931,13:22:00,13:22:00,7602406,3,,,1,
    53223932,37:39:00,37:40:00,7602405,25,,,,
    ...osv

    Ger oss regexp av förra resultat som kan användas på trips.txt

    egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}'

    Resultat:
    ^[^,]+,[^,]+,53223931,
    ^[^,]+,[^,]+,53223931,
    ^[^,]+,[^,]+,53223931,
    ^[^,]+,[^,]+,53223932,

    Plocka ut de unika resultaten.

    egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq

    Resultat:
    ^[^,]+,[^,]+,53223931,
    ^[^,]+,[^,]+,53223932,
    ^[^,]+,[^,]+,53628031,
    ^[^,]+,[^,]+,53628034,
    ^[^,]+,[^,]+,53628480,
    ^[^,]+,[^,]+,53628481,
    ^[^,]+,[^,]+,53632487,
    ^[^,]+,[^,]+,53632497,
    ^[^,]+,[^,]+,53632516,
    ^[^,]+,[^,]+,53633234,

    Ger oss alla rader i trips.txt som har stop_times på norska hållplatser.

    egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt

    Resultat:
    74_J,4,53223931,Luleå Centralstation,93,,,
    74_JICN,5,53223932,Narvik stn,94,,,
    74_J,5,62483281,Narvik stn,94,,,
    74_JICN,4,53628031,Stockholm Centralstation,93,,,
    ...osv

    Plocka bara ut route_id.

    egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt | awk -F, '{print ""$1""}'

    Resultat:
    74_J
    74_JICN
    74_J
    74_JICN
    ...osv

    Slutligen ge oss bara unika sorterade resultat med "sort | uniq":

    egrep "$(egrep "$(egrep "^76[^,]+" -o stops.txt | awk -F, '{print "^[^,]+,[^,]+,[^,]+,"$1","}')" stop_times.txt | awk -F, '{print "^[^,]+,[^,]+,"$1","}' | sort | uniq)" trips.txt | awk -F, '{print ""$1""}' | sort | uniq

    Resultat:
    269_91_BLT_273
    279_4111_BLT_262
    315_70_J_314
    315_J_314
    327_BXBN
    328_BXBN
    690_820_BXBN
    690_888_BXBN
    694_JRE_74
    74_BIC
    74_J
    74_JIC
    74_JICN
    74_JNT
    74_JRE
    76_J_74

    / Lars Löfquist

    Team Trafiklab
  • Angående giltighetstiden så kommer det ut en ny version i slutet av denna vecka, eller början på nästa som gäller över sommaren.

    / Lars Löfquist

    Team Trafiklab
  • Och på filen som släpptes idag (2014-05-02) finns det en buss-linje till. Här är hela listan:

    269_91_BLT_273
    279_4111_BLT_262
    315_70_J_314
    315_J_314
    327_BXBN
    328_BXBN
    690_820_BXBN
    690_822_BXBN
    690_888_BXBN
    694_JRE_74
    74_BIC
    74_J
    74_JIC
    74_JICN
    74_JNT
    74_JRE
    76_J_74

    /Lars Löfquist

    Team Trafiklab
  • Vi håller på och testar import av tabellerna. Än så länge ligger problemen i vår ände, men vi återkommer om vi har några frågor på ert innehåll. Tack för uppdateringen om nya tabellen.

  • Hej igen.

    Varför använder ni inte direction_id?

  • Hej!

    Det används inte för att vi inte har den informationen på det sättet i vårt data.

    /Martin

    Team Trafiklab

Kommentera eller skriv ett nytt inlägg

Ditt namn och inlägg kan ses av alla. Din e-post visas aldrig publikt.