Till senaste kommentaren

Problem med rssflödet - dubbla avsnitt av poddar

Det strular med rssflödet, tex. Spanarna: http://api.sr.se/api/rss/pod/4007

Då jag sen en tid tillbaka fått dubbla artiklar; min gissning när ni byter namn på avsnitt, men denna vecka kom inget avsnitt alls..? 🙁

Bifogar ett exempel.



/ Mikael

Mikael Rapportera olämpligt innehåll

Kommentarer

  • Hej!

    Jag såg själv att avsnittet saknades som podd nu i helgen, men ser att redaktionen nu har rättat till detta, så snart bör alla poddtjänster ha uppdaterats.

    Beträffande att ett namnbyte från vår sida leder till att du får dubbla avsnitt höll jag på att svara att ytterligare en lyssnare rapporterat in samma fel, men ser nu att denna lyssnare är du själv:
    https://kundo.se/org/teknisk-support/d/rss-flode-visar-dubbla-avsnitt/

    Du är alltså fortfarande ensam om att ha rapporterat in det felet, så det kan vara något problem i hur just din podd-app hanterar förändringar. Det försöker vi förstås hjälpa dig att felsöka, så berätta vad det är för podd-tjänst du använder!
    Annika Webbmaster
  • Jag har noterat samma beteende med dubbla avsnitt. Titeln på den första versionen brukar vara namnen på veckans spanare medan den andra versionen refererar till innehållet i spaningarna. Kanske är det så att vissa klienter inser att det är dubbletter och inte visar dubbla avsnitt?
    Jonatan Skogsfors
  • En ändring av titeln ska inte få podd-klienten att ladda om ljudfilen på nytt. Om ljudfilen av någon anledning behöver bytas ut, är det inte titeln som ändras, utan ett fält som kallas "guid". Varje episod ska ha ett unikt värde där.
    Kanske är det så att vissa klienter inser att det är dubbletter och inte visar dubbla avsnitt?
    Ja, men inte "vissa" (hoppas jag innerligt) utan de allra flesta. Att det är "samma episod, trots nytt namn" är alltså det förväntade beteendet och så fungerar det i de podd-appar jag hunnit kika på.

    Att det inte fungerar hos er, tyder det på att era klienter av något skäl inte följer standarden för hur poddflöden ska hanteras och det behöver vi förstå bättre.

    Vad har du för klient?
    Annika Webbmaster
  • Personligen använder jag Pocket Casts (det ser ut som att Mikael använder någon annan klient). Jag misstänker att problemet inte ligger i själva klienten utan att det blir en konflikt när er feed cachas centralt hos Pocket Casts. Jag har inte stött på detta beteende på någon annan podd än just Spanarna men jag misstänker att det inte är särskilt vanligt att just titlar ändras i efterhand.

    Vad gäller standarder: I RSS 2.0-specifikationen är "title" obligatorisk och "guid" optional. För guid anges att "When present, an aggregator may choose to use this string to determine if an item is new." Jag kan förstå om en tjänst som vill vara så generell som möjligt väljer att använda förlita sig på "title" som nyckel. Utöver Apples riktlinjer har jag inte stött på någon allmän standard för just podcasts.

    För mig är det inte ett särskilt stort problem men jag hoppas att feedbacken kan komma er till nytta så att ni åtminstone vet att det händer konsekvent hos en del av era användare.
    Jonatan Skogsfors
  • Problemet är även rapporterat till min poddspelare här; https://github.com/AntennaPod/AntennaPod/issues/3275

    Med referenser till andra poddar.

    Där påstås det att guid redan används, så vitt jag förstår.
    Mikael
  • För mig är det inte ett särskilt stort problem men jag hoppas att feedbacken kan komma er till nytta så att ni åtminstone vet att det händer konsekvent hos en del av era användare.
    Det uppskattas verkligen!
    Vad gäller standarder: I RSS 2.0-specifikationen är "title" obligatorisk och "guid" optional. För guid anges att "When present, an aggregator may choose to use this string to determine if an item is new." Jag kan förstå om en tjänst som vill vara så generell som möjligt väljer att använda förlita sig på "title" som nyckel.
    Jag som svarar i forumet är en länk mellan lyssnare och utvecklare av våra webbtjänster. En "generalist" som, när jag förstått att det är ett problem, ser till att det når fram till rätt kolleger. Att jag trodde att det var standard att förlita sig på "guid-elementet" är min kunskapslucka och speglar inte kunskapen hos de kolleger som arbetar mer direkt med hur våra poddflöden fungerar på olika plattformar.
    Problemet är även rapporterat till min poddspelare här; https://github.com/AntennaPod/AntennaPod/issues/3275

    Med referenser till andra poddar.

    Där påstås det att guid redan används, så vitt jag förstår.
    Bra med så tydlig dokumentation!

    Både AntennaPod och Pocket Casts är seriösa och välfungerande podd-klienter. Vi behöver självfallet förstå vad som kan förbättras för att minska risken för dubbletter, oavsett om det främst är en teknisk förändring som behövs (där vi på något vis kan göra så att rubriken uppdateras utan att det tolkas som ett nytt avsnitt) eller om det är ett ofrånkomligt problem som vi får lösa redaktionellt (hjälpa Spanarna att bli mer återhållsamma med att ändra titlar på avsnitt).

    Tack för att ni hjälpt mig att förstå problemet!
    Annika Webbmaster
  • Hej!

    Jag har nyligen fått kontakt med supporten på Pocket Casts som felsöker detta (och den lyssnare som rapporterat in felet till dem är just du, Jonatan) och dels har en lyssnare med appen Podcast Republic, Erik här, rapporterat in samma fel:
    Samma avsnitt igen!

    Eftersom tre välfungerande podcast-appar visar samma problem med just våra poddflöden, behöver vi förstås se över vad som egentligen händer när en redaktion uppdaterar avsnittsinformation.

    Jag vet inte om det måste vara själva titeln som uppdateras eller om det räcker med att redaktionen rättar ett stavfel i texten, men försöker ta reda på vilka uppdateringar vi har gjort. Erik har givit mig exempel på ett avsnitt från i våras av Dystopia som kom ut igen nyligen - och jag ser att redaktionen har gjort en uppdatering av avsnittet i fråga den 10 december, så jag hoppas att de minns vad som ändrades.

    Ge gärna färska exempel som ni har sett - i synnerhet om det inte verkar vara ny titel!

    Mikael:
    Kvarstår felet i Antenna? Jag, och de utvecklare som arbetar med vårt API, ska förstås åter läsa igenom vad det står på den github-länk du skickade med.

    Jonatan:
    Att felet kvarstår i Pocket Cast utgår jag från, i och med att du har varit i kontakt med dem relativt nyligen, Jonatan. Om de har kommit med förslag på någon work around för hur du inte ska behöva se dubbletterna som kan vara relevant även på andra plattformar, får du förstås gärna tipsa om det!

    Hur som helst har vi satt denna boll i rullning igen och hoppas att vi kommer lite längre än senast denna gång!
    Annika Webbmaster
  • Mikael:
    Problemet med AntennaPod ser ut att vara löst sedan version 2.4 som kom i somras:
    Some episodes appear twice in feed (github.com)

    Har du fått dubbla avsnitt därefter?
    Annika Webbmaster
  • Hej,

    Kul att höra att ni har ett öga på detta. 😀

    Senast i November fick jag dubbletter, se skärmdump. 15:e okt. verkar ha samma titel, men ändå skapa dubblett.

    Kontrollerade att jag har 2.4.0 också.

    / Mikael
    Mikael
  • Äsch, jag som precis skrev till Cara, Happiness Engineer at Automattic (supporten för Pocket casts) att AntennaPod verkar ha löst problemet och bad dem snegla på den pull request som gällde detta!

    Vi har regelbundna möten med API-teamet, och vid nästa möte ber jag dem se över hur vi hanterar förändringar, för det kan absolut finnas något vi förändrat som gör att vi inte hanterar "guid-fältet" korrekt.

    Om jag förstår det jag läste på Github korrekt, men jag är inte utvecklare, utan mer av "happiness engineer", borde dock även avsnitt som saknar guid-info fångas upp när titel och avsnittets längd är exakt densamma - vilket den ju verkar ha varit i det avsnitt av Spanarna som du fick dubbelt.

    Men det kanske endast gäller om guid saknas? Om vi felaktigt uppdaterar guid-fältet när ett avsnitt sparas om, så att det faktiskt rent tekniskt upplevs som ett nytt avsnitt, är det ju en annan sak. Men då borde å andra sidan långt fler lyssnare ha rapporterat in liknande problem, tycker jag. Även om det är en typ av fel man inte rapporterar in första eller ens tionde gången det sker, borde fler lyssnare reagera.

    Mystiskt! Och oavsett vilket så är vi förstås glada över att ni har uppmärksammat oss på problemet.
    Annika Webbmaster
  • *Skriver här så jag får uppdatering från detta flöde, är helt ok med att det jag skrev imorse länkas hit som avslut*
    Erik
  • Bra. Vi felsöker effektivare om vi samlar alla iakttagelser på ett ställe.

    Jag stänger din förra tråd om samma fel, som vi nu alltså sett i tre olika podcast-appar, AntennaPod, Pocketcast och Podcast Republic:
    Samma avsnitt igen!

    (Därmed är det sannolikt att felet ligger på vår sida, snarare än i apparna.)
    Annika Webbmaster
  • Pass på, informationen i senaste P3 Musikdokumentär är lite knapphändig, kan komma att ändras, ser bara en publicering just nu.

    "P3 Musikdokumentär 2021-12-26 kl. 17.30
    P3 Musikdokumentär
    Duration: 1:08:29
    Published: Tue, 21 Dec 2021 04:30:00 GMT
    Episode: https://sverigesradio.se/avsnitt/1864901

    Media: https://sverigesradio.se/topsy/ljudfil/itunes/8137106.mp3

    Podcast: https://www.podcastrepublic.net/podcast/1359695913

    Det här är berättelsen om bandet med de stora drömmarna och vägen till den absoluta världstoppen. <br/><br/>

    Subscribe to this podcast: https://api.sr.se/api/rss/pod/itunes/25943

    ----
    Sent from Podcast Republic 21.12.16R
    https://play.google.com/store/apps/details?id=com.itunestoppodcastplayer.app"
    Erik
  • ...och där är Titel korrigerad och jag har dubbla.

    Roxette - den svenska framgångssagan
    P3 Musikdokumentär
    Duration: 1:08:29
    Published: Tue, 21 Dec 2021 04:30:00 GMT
    Episode: https://sverigesradio.se/avsnitt/1864901

    Media: https://sverigesradio.se/topsy/ljudfil/itunes/8137708.mp3

    Podcast: https://www.podcastrepublic.net/podcast/1359695913

    Det här är berättelsen om bandet med de stora drömmarna och vägen till den absoluta världstoppen. <br/><br/> Det är den 12 januari 1989. Roxettes manager Marie Dimberg står vid sidan av en öde väg ute...

    Subscribe to this podcast: https://api.sr.se/api/rss/pod/itunes/25943

    ----
    Sent from Podcast Republic 21.12.16R
    https://play.google.com/store/apps/details?id=com.itunestoppodcastplayer.app
    Erik
  • 08:05
    Pass på, informationen i senaste P3 Musikdokumentär är lite knapphändig, kan komma att ändras, ser bara en publicering just nu.
    /.../
    13:00
    ...och där är Titel korrigerad och jag har dubbla.
    Tack för denna dokumentation.

    Som ni kanske anar är den här typen av "icke akuta fel" inget vi tagit tag i under julen, men efter helgerna ska jag be kloka kolleger att ta reda på om vi har trasslat till det med "guid-taggen", globally unique identifier, avsnittets "identitetshandling" som ska hänga med även om t ex titeln byts ut.
    Annika Webbmaster
  • Nu har jag gjort en egen liten undersökning. Jag sparade ner xml-flödet precis efter att Spanarna publicerades och sedan igen en halvtimme senare.

    Som väntat är fält för titel och beskrivning uppdaterade. Men dessutom är fältet guid uppdaterat.

    Version 1:
    <guid isPermaLink="false">rss:sr.se/pod/spanarna_agnes_lidbeck_per_naroskin_oc_20220121_1606076144.mp3</guid>

    Version 2:
    <guid isPermaLink="false">rss:sr.se/pod/spanarna_maja_aase_se_upp_for_kniven_20220121_1619466740.mp3</guid>

    Med andra ord: SR säger att det inte är att betrakta som samma avsnitt. Om en spelare redan har laddat ner avsnittet och sedan ser uppdateringen i flödet är det då ganska rimligt att de behandlar det som ett nytt avsnitt även om ljudfilen är identisk.
    Jonatan Skofgsfors
  • Tack, då är det ju helt bekräftat. Vi gör, som jag misstänkt sedan vi började titta på detta igen i december, fel.

    Jag har ännu inte återkopplat detta till utvecklarna på grund av jul, sjukdom och att de har haft en del "specialaktiviteter" som har gjort att vi på supporten endast har stört dem om lyssningskritiska buggar - men jag lovar att ta tag i detta i början av nästa vecka.

    Vi gör fel, det behöver vi alltså ändra.

    Trevlig helg och tack igen!
    Annika Webbmaster
  • Toppen, har fått några dubbelavsnitt under julhelgerna också, flera av vinterpraten från P1 bl.a. Mikael Niemi har jag x3, där är det lite olika längd på dem också, inte jämfört deras innehåll men de är ju samma avsnitt så borde ersatts inte dubblerats. Kändes nästan sneaky för statistiken över poddar i landet när jag såg det första gångerna, man ser ju nedladdningar extrrnt, inte lyssningar. Känns väldigt väl mottaget när man rapporterar ett sånt här "sk*tfel"! Lycka till!
    Erik
  • Jag har nu, äntligen, rullat bollen vidare till utvecklarna. Hur de sedan prioriterar att lösa felet, vet jag inte än, men jag återkopplar när jag vet mer.
    Kändes nästan sneaky för statistiken över poddar i landet när jag såg det första gångerna, man ser ju nedladdningar extrrnt, inte lyssningar.
    Bra reflexion! Ur ett "Sveriges Radio-perspektiv", där ni som lyssnar med den här typen av appar är få i förhållande till lyssnarna som använder våra egna plattformar och exempelvis Spotify, kanske det inte spelar så stor roll, men om man bryter ned statistiken mer och tittar på programnivå, kan det uppstå skillnader som faktiskt snedvrider våra analyser, i och med att vissa program mer eller mindre som regel putsar på rubriker och beskrivningar i efterhand.

    Jag varskor våra analytiker och Ludde, vår "poddkoordinator", så att de är medvetna om denna felkälla.

    Tack för detta inspel.
    Annika Webbmaster
  • Hej,
    vill bara säga att även jag har samma "problem", framför allt Spanarna.

    Använder PocketCast.

    Har dock inte fört statistik för detta, men kan göra det om det underlättar.


    Fia
  • Tack Fia (som jag känner privat)!
    Har dock inte fört statistik för detta, men kan göra det om det underlättar.
    Det behövs inte, för nu vet vi vad vi gör fel och vi vet även vad vi ska göra för att det ska bli rätt. Felet är viktigt att åtgärda, men inte så akut att vi släpper allt och rättar till det.

    Våra poddar hämtar sin GUID-parameter (alltså avsnittens unika ID) på fel sätt. Och här tänkte jag att det kan vara intressant att få veta hur det kommer sig att vi gör fel.

    Till att börja med har vi haft en GUID som har varit baserat på filnamnet, alltså namnet på mp3-filen, med den rimliga utgångspunkten att filnamnet är konstant. Detta i sig är dock fel, för om vi har problem med en ljudfil och byter ut den, ska det fortfarande räknas som samma avsnitt, inte ett nytt.

    Så har vi gjort länge, sedan maj 2018, men i och med att ljudfiler sällan byts ut, har detta fel gått under allas radar – tills vi gjorde en annan förändring och ni började få problem allt oftare ...

    Vi byggde ett system för hur filerna publiceras, och de program som använder detta system får filnamn som bygger på avsnittens titel - och ändras om titeln ändras. Även detta är bra tänkt. Om ett program publicerar avsnitt där ett personnamn är felstavat i titeln, eller där rubriken inte stämmer med innehållet, ska det felet inte kvarstå i filens namn när vi ändrat i texten.

    Att filerna byter namn när vi ändrar en rubrik är i sig inget problem (och den modellen tror jag att vi behåller) - men eftersom vi i grunden har det där första felet, där GUID-parametern baseras på filnamnet, gav detta nya system, där filnamn förändras ofta, problem. För program som Spanarna blir det helt enkelt nästan alltid dubbletter, eftersom podden först publiceras med ett arbetsnamn så snabbt redaktionen hinner lägga ut den, och redaktionen därefter lägger ned omsorg på att titeln ska beskriva innehållet, inte bara räkna upp namnen på de medverkande.

    Bytet till detta system har skett lite successivt. Om det hade gått från nära noll dubbletter (de poddar där ljudfilen faktiskt hade bytts ut) till det antal vi nu har över en natt, hade säkert fler lyssnare rapporterat in det. (Dessutom har en del plattformar filtrerat bort dubbletterna, trots att vi påstått med GUID-parametern att det varit unika avsnitt, så det är endast vissa podcast-klienter som drabbats.) Därmed dröjde det tills vi insåg att felet ligger hos oss själva!

    Så stort tack till er som har reagerat och förlåt för att det tog sådan tid att ta problemet på allvar. Extra tack till Erik, som fick mig att kontakta analysavdelningen. De vill verkligen inte utgå från statistik som baseras på att vi skickat ut samma podd flera gånger och ser nu över hur detta fel påverkat våra analyser över tid!

    Jag återkommer och berättar hur det går.
    Annika Webbmaster
  • Det gick bra en månad 😉
    Erik
  • Felet från vår sida är ännu inte löst.

    Jag vet inte om detta är enda förklaringen, men de kolleger som arbetar med API:t har haft fullt upp den senaste tiden. Kriget i Ukraina har gjort att nyhetsredaktionernas behov av att kunna publicera snabbt och att kunna "paketera innehåll" på lite olika vis har prioriterats högst och andra förbättringar har prioriterats ned.

    Vi på supporten ser över igen så att detta inte har ramlat mellan stolarna.

    Tack för påminnelsen!
    Annika Webbmaster
  • Spanarna har fungerat i sen i höstas, för er information. 😀

    AntennaPod 2.4.2

    Mikael
  • Tack.
    Annika Webbmaster
  • Hej
    Jag använder android-appen Podcast Republic och får också ofta upp flera instanser av samma avsnitt (med olika namn) från sr. Jag prenumererar på 50+ podcasts och har bara noterat det för poddar från sr. Har rekord nu med 4 av samma avsnitt av senaste Kinapodden från igår. Det är inget jättebroblem, så jag förstår att det inte har högsta prio att lösa. Jag ser även att Podcast Republic redan har nämnts i tråden, så det är mest för att det nu är ett av de värre fallen, och kanske värt att titta på som exempel om ni felsöker.


    M
  • Tack M!

    Vi behöver inte felsöka, utan lösa felet. Det ligger helt på vår sida och vi vet vad det är vi behöver förändra, men vi har inte hunnit lösa det.

    Varför vi inte löst det ännu, trots att vi nu vetat om vad vi behöver göra sedan i vintras, kanske intresserar några av er (även om det inte har med felet i sig att göra egentligen).

    Vi har bedömt att detta problem är viktigt att lösa, men inte akut. Och då halkar det ned i prioriteringen när det dyker upp sådant som är akut. Den senaste tiden har vi av juridiska skäl (och för att det är bra för lyssnarna!) behövt lägga utvecklarnas tid på att förändra hur vi hanterar kakor och webbplatsdata. Det är samma team av utvecklare som arbetar med både sajten och vilken den information om som skickas med i ett poddflöde.

    Den nya kak-hanteringen aktiverades i onsdags, och jag hoppas verkligen att det innebär att vi nu kan prioritera upp att få rätsida på poddarna.
    Annika Webbmaster

Kommentera eller skriv ett nytt inlägg

Ditt namn och inlägg kan ses av alla. Din e-post visas aldrig publikt.