Magnus Sälgö. (2024). salgo60/HISCOKoder: HISCOkoder för svenskt kulturarv (HISCOkoder). Zenodo. https://doi.org/10.5281/zenodo.11183897
Kan vi Digitalt koppla ihop historiska yrken i Sverige "same as"? Och enkelt hitta i alla databaser alla personer/beskrivningar av exempelvis isutkörare (ett av Sveriges vanligaste yrken)...Känns som en lågt hängande frukt... utmaningen är nog att börja jobba ihop och ha publika backlogs och föra en dialog på exempelvis GITHUB ....
Projekt SWEPOP har skapat Principles of Coding Swedish Historic Occupations tanken är att se om vi kan föra över det till Wikidata och se om andra aktörer rör sig åt samma håll då det gäller att digitalisera datat och röra sig mot HISCO istället för textsträngar.
Tanken
- starta dela planer --> diskussion eller issues kan fungera som en start eller varför inte Clubhouse - linked data needs linked people
- starta fundera på olikheter mellan olika yrken i maskinläsbar form
- att bara ha textsträngar blir lätt som att ange en textsträng Stockholm och sedan låta läsaren gissa om det är
- beskriv hur det implementeras av olika institutioner jmf hur Wikidata idag använder ShEx för att beskriva olika informationsmängder se exempel E134 Riksdagsman, E283 Svensk församling, E260 Fredmans epistel, E250 svensk kommun, E271 offentlig konst Umeå, E99 staty
- kan Wikidata vara en enabler?
- Min feedback från LD4 är att aktörer som Stanford University Libraries, USA:s kongressbibliotek, Columbia University, Harvard Library gör detta se deras senaste konferans LD4 schedule / Youtube lista "2021 LD4 Conference Videos" där jag pratade om publika identifierare i svenska boken Bautil från 1750 artikel/video
- vad behövs i Wikidata för att vi skall starta i Sverige!!! Vilka är intresserade och vilka byggstenar har ni?
- API ex. SKBL
- dokumentation ex. SWEPOP
- att skapa en mer avancerad modell för yrken och kopplingen till person se JSON filen från SKBL mer beskriven nedan där man anger när en person jobbar med ett visst yrke och var....
- att ha en modell för vilka egenskaper som behövs för att beskriva ett yrke se Wikidata spretiga försök med
- ?!?!?
Status vad vi ser
- Mats Hayen har ett projekt Tidigmoderna konkurser! som har HISCOkoder se "Titelklassificering"
- Swepop - swedpop.se...
- HISCO codes and description Version: June 28, 2021
- ...
- Alvin Wikidata P6821 har > 34 500 personer, platser ... kopplade till Wikidata
- yrken i WD för i personer kopplade till Alvin
- samma fråga men visa om Wikidata har en bild eller bildkatalog
- samma fråga men yrken som saknar bild i Wikidata
- samma fråga men där yrkena också har en artikel på svenska wikipedia / engelska / tyska / kinesiska / saknar svensk Wikipedia artikel
- vilka egenskaper har dessa yrken i Wikidata idag (behövs nog en hel del jobb för att få ordning på detta)
- av typ Authority control properties
- alla externa egenskaper
- alla Wikidata egenskaperna / samma som bubble chart
- vilka egenskaper har dessa yrken i Wikidata idag (behövs nog en hel del jobb för att få ordning på detta)
- Notebook kör igenom alla poster i Wikidata kopplade till Uppsala universitetsbibliotek Alvin plattform > 28000 kopplingar där vi försöker identifiera yrkena i html sidan hos Alvin se även T225522
- csv fil > 3000 yrken
- csv fil > 3000 yrken
- Arken Wikidata P8899 har > 3 390 personer kopplade till Wikidata
- yrken i Wikidata för personer kopplade till Arken/lista
- har lite struktur men inga kopplingar HISCOkoder finns ett schema ej åtkomligt https://arken.kb.se/Actor-occupations
- exempel
- SKOS Diplomater
- finns stöd för flerspråkighet
- SKOS Författare
- SKOS filmproducenter
- finns stöd BT (Broader term), NT (Narrow term)
- har även udda term skos:note för koppling https://id.kb.se/term/sao/Diplomater borde vara samma som
- SKOS Diplomater
- exempel
- Notebook webscrapar Arken efter yrken / csv - alla
- Digitaltmuseum Wikidata P7847 - P7846 används för bilder - P1248 har > 18000 kopplingar till Wikidata
- har dataset Life roles (KulturIT AS [no]) - Notebook / csv
- yrken i Wikidata för personer i kulturnav P1248 - P1248
- kulturnav.org: August Strindberg vars RDF har Liferole som pekar på ex. JSON författare som
- har exactMatch
- har mads:see sv:Wikipedia författare
- Historiska museet Wikidata P9495 har > 3 360 personer kopplade till Wikidata
- yrken i Wikidata för personer kopplade till Historiska museer
- planer finns se tweet "Vi har interna identifierare för yrken och möjligheten finns att koppla dessa till externa, och lägga ut yrkena som egna poster på vårt onlinesök"
- se Historiska museet yrken #6
- Kungliga biblioteket - LIBRISXL verkar ha hasOccupation med label utan språktag och utan koppling HISCOkod se August Strindberg - yrken i WD för dessa personer - yrken i Wikidata för personer kopplade till KB
- Levande musikarv Wikidata P4607 - har > 6000 personer/verk kopplade till Wikidata
- Litteraturbanken Wikidata P5101 - har > 2800 personer kopplade till Wikidata
- yrken i Wikidata för personer kopplade till Litteraturbanken
- här har vi kopplat böcker som Bellman var där. En vägvisare till Bellmansmiljöer (1997) till Wikidata se karta/graf och Runstenar till böcker hos Litteraturbanken se karta se längre artikel om dataroundtripping
- Riksarkivet SBL Wikidata P3217 - har > 7000 personer/släkter kopplade till Wikidata
- yrken i Wikidata för personer kopplade till SBL
- har yrken men ingen koppling till HISCO koder länk
- se csv fil och Notebook
- jämförelse yrken hos SKBL och SBL - Notebook / csv fil
- både SBL och SKBL identifierar yrken med textsträngar vilket gör detta lite ohanterligt och hobbymässigt
- yrken bör ha unika persistenta identifierare och en kunskapsgraf där egenskaper beskriver yrket och har samma som ex. HISCOkoder
- 2024-06 släpps ett nytt dataset med SBL som strings se |#53 SBL dataset släpps 2024 Strings not Things](salgo60/Svenskaforsamlingar#53))
- Stadens ansikte ingen koppling idag till Wikidata
- se försök att öppna en dialog T268374
- Svenskt Kvinnobiografiskt lexikon Wikidata P4963 - har > 1900 personer... kopplade till Wikidata
- yrken i Wikidata för personer kopplade till SKBL motsv. partitillhörighet
- har vissa yrken som nyckelord
- se csv fil och Notebook
- JSON strukturerad data --> yrken SKBLyrken_valuecount.csv/csv per person och Notebook JSON
- SKBL har ex. Kerstin Anneka Anderson svenska engelska json där yrket i JSON har struktur
- occupation
- description
- detail - borde vara Linked data för kopplingar till arbegtsgivare etc...
- from
- comment / date - borde vara maskinläsbara datum, tidsperioder
- place
- är med koordinat och text sträng ej Linked data
- to
- type kan vara Yrke / Ideellt arbete
- occupation
- SKBL har ex. Kerstin Anneka Anderson svenska engelska json där yrket i JSON har struktur
- video hur vi kopplar till en:wikipedia med mallar och ser json i SKBL
- exempel
- ISCO–08 "International Standard Classification of Occupations Structure, group definitions and correspondence tables"
- SCB har SSYK koder för "moderna" yrken
- diskussion jobtech SSYK egenskap i Wikidata
- Wikidata egenskap P8654 se även task "SSYK 2012"
- min tro är att dessa koder inte är funktionella för en datadriven arbetsmarknad ett nytt initiativ har startats upp se sr.se tyvärr svårt att förstå vad de gör och har för leverabler
- historiska yrken
- projekt Wikidata:WikiProject Occupations and professions
- om Wikidata / "Making feedback loops work for Wikidata" / Wikidata:Mismatch Finder
- Svenska egenskaper i Wikidata
- Saknas idag en egenskap för HISCOkoder - Q5629694
Intressant i denna ekvation där vi ovan ser hur svenska kulturinstitutioner lyckas trassla till något så trivialt som historiska yrken är hur mycket kopplingar en global databas som Wikidata innehåller till andra extern egenskaper ( se senaste skapade WD egenskaper > 9000, externa > 6300) men även antal språk som stöds där svenska databaser oftast antar att dom bara skall leverera på svenska.
- Alvin har ofta en rad om personen med namnet och yrket, i Engelsk Wikipedia finns det 31799 artiklar om personer i Alvin... Varför länkar inte Alvin? det finns artiklar på 301 språk för personer kopplade till Alvin, lista med personer med flest Wikipedia artiklar, list med personer kopplade till Alvin men inte har en artikel på svenska Wikipedia men på annat språk = 9500...
- Personer kopplade till Alvin > 34 500 personer, platser ... --> men dessa personer i Wikidata har kopplingar till 1300 externa egenskaper osv... det är ett enormt jobb att hålla detta vid liv och för att jobba med data skall man ha dom kunskaperna. Kan svenska kulturinstitutioner som pratar samma språk åker på samma konferenser, får bidrag ur samma "ficka" inte klara av att synka hur historiska yrken beskrivs så är att koppla sig till externa egenskaper i andra länder nog en omöjlighet man behöver byta ut laget och våga ställa krav som följs upp....