WikiData klassificering av innehåll
Hej, har ni följt upp frågan om klassificering av data och länkad data för WikiData? Det låter intressant att kunna koppla ihop innehåll på SR med andra tjänster som Riksdagen eller EU-institutioner.
https://groups.google.com/g/sr-api/c/DnHlf1zc6yY
https://phabricator.wikimedia.org/T235527#5626665
https://groups.google.com/g/sr-api/c/DnHlf1zc6yY
https://phabricator.wikimedia.org/T235527#5626665
Följ inlägget
0
följare
Ni har väl arkivfolk på Sveriges Radio som borde vara intresserade av den här typen av frågeställningar.
Arkivering betyder inte att trådar lämnas obesvarade, bara att de inte exponeras i forumet (och exponeras mindre i externa sökmotorer). Hittills idag har jag exempelvis skrivit 48 svar (detta oräknat) fördelat på 21 trådar. Majoriteten av svaren har varit i arkiverade trådar.
Jag hade fel. Det var ju inte två ärenden om det i samma forum. Magnus original-fråga ligger i API-forumet. Av-arkiverar denna tråd.
Själva frågan i sig och vem (vilket utvecklings-team) hos oss som kan bör få del av den, har jag inte tagit ställning till än, men att klassificera och märka upp vårt innehåll är absolut en fråga som berör många av de saker vi arbetar med (röststyrning, tillgänglighet, sökbarhet ...)
De hade inte nåtts av Magnus Sälgös inlägg i API-forumet. Jag hör med med mina kolleger om vi bör skapa bättre rutiner för uppföljning där, eller om det det är bättre att stänga ned forumet och styra över den typen av frågor till det forum vi nu befinner oss i.
Tack för att du hjälpte oss att ta tag i både den enskilda frågan om WikiData och hur vi vill bli kontaktade!
Något nytt med detta
*ex. Tommy Engstrand som är samma som Wikidata https://www.wikidata.org/wiki/Q5712850 dvs. vi har unikt id för honom.
* SR borde ha "samma som" för alla sina personer , ämnen och samma som Wikidata se https://www.youtube.com/watch?v=m_9_23jXPoE
Detta är inte klassisk klassificering av innehåll utan det är så här moderna organisationer som Google, Airbnb, Über.... jobbar,,, Hör gärna av er så kan vi visa er....
Vi har inte tappat bort din fråga helt, även om jag förmodar att det kan verka så ...
Jag tänker se till att den här bollen kommer i rullning igen, och nu rullas till någon som har möjlighet att gå vidare med frågan (eller svara tydligt att vi ännu inte har den möjligheten).
Om du redan har varit i kontakt med någon av mina kolleger, så får du gärna berätta det!
Nix inte med sr men vi är i kontakt med massa andra. Hör gärna av er hur ni tänker [bortredigerat telefonnummer]
* svt har jag pratat med och hade gjort massa jobb med deras SVT Öppen kanal MEN dom flyttade den till SVT play och där har man ingen klassificering etc,. lite sorgligt se https://phabricator.wikimedia.org/T225394
Annars håller jag nu på med forskare som jobbar med Riksdagstrycket bakåt i tiden
* deras GITHUB https://github.com/welfare-state-analytics/riksdagen-corpus
* min GITHUB https://github.com/salgo60/Wikidata_riksdagen-corpus
det jag skulle vilja se är mer kopplingar mellan
* allt från Riksdagsdebatterna och era nyhetsinslag via gemensamma ämnen
* att program som Släktband kopplas till ämnen som finns i WIkidata
* att orter ni pratar om blir enkla att hitta eftersom ni har samma som Wikidata osv...
Jag försöker alltid ta bort telefonnummer och e-postadresser från forumet, och gör så även med dig, men numret har jag kvar (dolt).
Jag ser att Yle, våra finska kolleger, var inne på ämnet Wikidata redan för flera år sedan:
https://wikimedia.fi/2016/04/15/yle-3-wikidata/
Vet du om de har upprätthållit detta konsekvent sedan dess? I så fall kan det vara väldigt intressant för oss att prata med dem om deras erfarenheter!
Andra Nyhetsrelaterade egenskaper i Wikidata
* https://w.wiki/4eGV
Det som kommer mer och mer är att kanske maskininlärning kan användas till att klassificera program/artiklar.... jag har lekt lite med https://en.wikipedia.org/wiki/GPT-3
När jag 2019 träffade Riksdagen pratade dom om Eurovoc en EU tesaurus men har inte hört något mer. Jag skulle vilja att Pariprogram klassificerades och att den som skriver en motion berättar hur denna motion kan kopplas till ett partiprogram etc...
* https://op.europa.eu/en/web/eu-vocabularies
* https://phabricator.wikimedia.org/T235527#5615454
Även kopplingar till hållbarhetsmålen vore intressant. Hittade detta men inte sett att någon använder det
https://sustainabledevelopment.un.org/LinkedSDGs/about
Ps. mitt nummer finns överallt på nätet jag blir bara glad om någon ringer...;-)
Vi taggar forsättningsvis våra innehåll med Wikidata på Yle. Och Wikidata utesluter inte heller automatisk klassificering: https://yle.fi/aihe/a/20-10001817
Hör av er ifall ni har frågor kring det hela.
Med vänliga hälsningar,
Mikael
mikael.hindsberg@yle.fi
Jag har nu bett vår utvecklingschef Camilla Jettman om hjälp att "hitta rätt i organisationen" och återkommer.
Video om "Introduction to Annif and automated subject indexing"
https://www.youtube.com/watch?v=L4H1R8N3yrw
Hlsn
Magnus Sälgö
https://www.linkedin.com/in/magnus-s%C3%A4lg%C3%B6-148890
Här kan ni testa


https://annif.org/
Han var dock väldigt tydlig med att det inte är något som vi har konkreta planer på att implementera, men att det kan bli aktuellt om vi ser ett användningsområde som försvarar de kostnader det trots allt medför att införa det. Han bad mig även att tipsa att par kolleger om denna tråd så att de kan nå er (Magnus och Mikael) vid eventuella frågor eller vid framtida behov.
Mitt mål med att skaka liv i den här tråden igen är därmed uppfyllt: Jag har fått ett tydligt svar om att vi inte har möjlighet att gå vidare med detta just nu, och känner mig trygg i att mina kolleger vet hur de kan ta reda på mer om de behöver.
Tack för det!