WikiData klassificering av innehåll

Hej, har ni följt upp frågan om klassificering av data och länkad data för WikiData? Det låter intressant att kunna koppla ihop innehåll på SR med andra tjänster som Riksdagen eller EU-institutioner.

https://groups.google.com/g/sr-api/c/DnHlf1zc6yY

https://phabricator.wikimedia.org/T235527#5626665

Kommentarer

  • Hej, någon har arkiverat det här inlägget utan att besvara det? Innebär det någon form av bordläggning?

    Ni har väl arkivfolk på Sveriges Radio som borde vara intresserade av den här typen av frågeställningar.

  • Jag hade arkiverat det, eftersom jag trodde att vi redan hade ett "grund-ärende" i supportforumet från Magnus Sälgö själv om WikiData. Jag vill undvika den fragmentisering det blir med dubbletter, i synnerhet av så specifika trådar.

    Arkivering betyder inte att trådar lämnas obesvarade, bara att de inte exponeras i forumet (och exponeras mindre i externa sökmotorer). Hittills idag har jag exempelvis skrivit 48 svar (detta oräknat) fördelat på 21 trådar. Majoriteten av svaren har varit i arkiverade trådar.

    Jag hade fel. Det var ju inte två ärenden om det i samma forum. Magnus original-fråga ligger i API-forumet. Av-arkiverar denna tråd.

    Själva frågan i sig och vem (vilket utvecklings-team) hos oss som kan bör få del av den, har jag inte tagit ställning till än, men att klassificera och märka upp vårt innehåll är absolut en fråga som berör många av de saker vi arbetar med (röststyrning, tillgänglighet, sökbarhet ...)
    Annika Webbmaster
  • Ok, jag förstår. Jag undrade eftersom jag inte sett något svar på API-forumet.
  • Jag fick ett bra tips på nyckelpersoner som arbetar med klassificering av innehåll hos oss, och har bollat detta vidare till dem.

    De hade inte nåtts av Magnus Sälgös inlägg i API-forumet. Jag hör med med mina kolleger om vi bör skapa bättre rutiner för uppföljning där, eller om det det är bättre att stänga ned forumet och styra över den typen av frågor till det forum vi nu befinner oss i.

    Tack för att du hjälpte oss att ta tag i både den enskilda frågan om WikiData och hur vi vill bli kontaktade!
    Annika Webbmaster
  • Något nytt med detta

    *ex. Tommy Engstrand som är samma som Wikidata https://www.wikidata.org/wiki/Q5712850 dvs. vi har unikt id för honom.
    * SR borde ha "samma som" för alla sina personer , ämnen och samma som Wikidata se https://www.youtube.com/watch?v=m_9_23jXPoE
     

    Detta är inte klassisk klassificering av innehåll utan det är så här moderna organisationer som Google, Airbnb, Über.... jobbar,,, Hör gärna av er så kan vi visa er....

  • Hej igen Magnus!

    Vi har inte tappat bort din fråga helt, även om jag förmodar att det kan verka så ...

    Jag tänker se till att den här bollen kommer i rullning igen, och nu rullas till någon som har möjlighet att gå vidare med frågan (eller svara tydligt att vi ännu inte har den möjligheten).

    Om du redan har varit i kontakt med någon av mina kolleger, så får du gärna berätta det!
    Annika Webbmaster
  • Hej

    Nix inte med sr men vi är i kontakt med massa andra. Hör gärna av er hur ni tänker [bortredigerat telefonnummer]

    * svt har jag pratat med och hade gjort massa jobb med deras SVT Öppen kanal MEN dom flyttade den till SVT play och där har man ingen klassificering etc,. lite sorgligt se https://phabricator.wikimedia.org/T225394

    Annars håller jag nu på med forskare som jobbar med Riksdagstrycket bakåt i tiden
    * deras GITHUB https://github.com/welfare-state-analytics/riksdagen-corpus
    * min GITHUB https://github.com/salgo60/Wikidata_riksdagen-corpus

    det jag skulle vilja se är mer kopplingar mellan
    * allt från Riksdagsdebatterna och era nyhetsinslag via gemensamma ämnen
    * att program som Släktband kopplas till ämnen som finns i WIkidata
    * att orter ni pratar om blir enkla att hitta eftersom ni har samma som Wikidata osv...


  • Hej igen!

    Jag försöker alltid ta bort telefonnummer och e-postadresser från forumet, och gör så även med dig, men numret har jag kvar (dolt).

    Jag ser att Yle, våra finska kolleger, var inne på ämnet Wikidata redan för flera år sedan:
    https://wikimedia.fi/2016/04/15/yle-3-wikidata/

    Vet du om de har upprätthållit detta konsekvent sedan dess? I så fall kan det vara väldigt intressant för oss att prata med dem om deras erfarenheter!
    Annika Webbmaster
  • Yle: Jag tror dom gör det dom har en egenskap i Wikidata se https://www.wikidata.org/wiki/Property:P8309?uselang=sv finns en äldre artikel https://wikimedia.fi/2016/04/15/yle-3-wikidata/

    Andra Nyhetsrelaterade egenskaper i Wikidata
    * https://w.wiki/4eGV

    Det som kommer mer och mer är att kanske maskininlärning kan användas till att klassificera program/artiklar.... jag har lekt lite med https://en.wikipedia.org/wiki/GPT-3

    När jag 2019 träffade Riksdagen pratade dom om Eurovoc en EU tesaurus men har inte hört något mer. Jag skulle vilja att Pariprogram klassificerades och att den som skriver en motion berättar hur denna motion kan kopplas till ett partiprogram etc...
    * https://op.europa.eu/en/web/eu-vocabularies
    * https://phabricator.wikimedia.org/T235527#5615454

    Även kopplingar till hållbarhetsmålen vore intressant. Hittade detta men inte sett att någon använder det
    https://sustainabledevelopment.un.org/LinkedSDGs/about



    Ps. mitt nummer finns överallt på nätet jag blir bara glad om någon ringer...;-)
  • Hej,
    Vi taggar forsättningsvis våra innehåll med Wikidata på Yle. Och Wikidata utesluter inte heller automatisk klassificering: https://yle.fi/aihe/a/20-10001817

    Hör av er ifall ni har frågor kring det hela.

    Med vänliga hälsningar,
    Mikael
    mikael.hindsberg@yle.fi
  • Tack!

    Jag har nu bett vår utvecklingschef Camilla Jettman om hjälp att "hitta rätt i organisationen" och återkommer.
    Annika Webbmaster
  • Video om "Introduction to Annif and automated subject indexing"
    https://www.youtube.com/watch?v=L4H1R8N3yrw


    Hlsn
    Magnus Sälgö
    https://www.linkedin.com/in/magnus-s%C3%A4lg%C3%B6-148890

  • Tack!
    Annika Webbmaster
  • Här kan ni testa
    https://annif.org/


  • Så bra!
    Annika Webbmaster
  • Nu har jag pratat med "rätt kollega". Han visste redan att Yle använder sig av WikiData och berättade att även vi på Sveriges Radio har "experimenterat lite" med det då och då och att det absolut är intressant.

    Han var dock väldigt tydlig med att det inte är något som vi har konkreta planer på att implementera, men att det kan bli aktuellt om vi ser ett användningsområde som försvarar de kostnader det trots allt medför att införa det. Han bad mig även att tipsa att par kolleger om denna tråd så att de kan nå er (Magnus och Mikael) vid eventuella frågor eller vid framtida behov.

    Mitt mål med att skaka liv i den här tråden igen är därmed uppfyllt:
    Jag tänker se till att den här bollen kommer i rullning igen, och nu rullas till någon som har möjlighet att gå vidare med frågan (eller svara tydligt att vi ännu inte har den möjligheten).
    Jag har fått ett tydligt svar om att vi inte har möjlighet att gå vidare med detta just nu, och känner mig trygg i att mina kolleger vet hur de kan ta reda på mer om de behöver.

    Tack för det!
    Annika Webbmaster
  • Tackar

Kommentera eller skriv ett nytt inlägg

Ditt namn och inlägg kan ses av alla. Din e-post visas aldrig publikt.