Bertel Lund Hansen skrev:
>> De er nu ikke opdateret i tre fulde døgn.
>
> Det passer ikke. Der har været nye sider hver eneste dag.
Det er korrekt at fra ca. kl. 13:30 i dag, er der indløbet nye sider,
men ellers har jeg ikke set nye sider på S114-149,151-178 siden lørdag
ved frokosttid. Det er tre fulde døgn.
> Har du en cache der ikke er opdateret?
Nej, hverken w3m eller python cacher websider, men selv om de gjorde,
ville det ikke have haft nogen indflydelse, da DR selv angiver at
siderne højst skal caches i 2 minutter (nuvel, 119 sekunder):
X-Cacheable: YES:default_ttl=119.000
Cache-Control: max-age=119
Jeg har endda prøvet at hente siderne fra maskiner der står i Frankfurt,
London og Paris – med samme resultat.
> Tjek evt. via min ttv-søgeside.
Det gjorde jeg skam i formiddags: Der var ikke én eneste træffer på
søgetermen “27.”, som der ville have været hvis nyhederne eller sporten
var blevet opdateret i søndags.
Hvis DR virkelig opdaterer deres sider, kan jeg nu kun foretille mig at
det er deres CDN (IP
104.121.238.17: Akamai Technologies), der har en
LRU-cache for min region og som har “tænkt“ at “Nåh, han bliver ved med
at hente de samme sider – vi gi'r ham sgu' bare en af de gamle“, ellers
har jeg ingen forklaring.
Nu forsøger jeg at hente siderne som
https://www.dr.dk/cgi-bin/fttx1.exe/$SIDE?uuid=$UUID
hvor $SIDE er det sidenummer jeg gerne vil se og $UUID er en UUID v4, så
må jeg se om det er nok til at narre Akamai.
(Det hjælper i øvrigt heller ikke at bruge den forespørgselsmetode med
‘?request=$SIDE’, du benytter – dér har jeg osse været.)
--
🐸 Klaus Alexander Seistrup