Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Wikidata <-> Riksarkivet <-> Wikidata Riksdagens corpus #19

Closed
salgo60 opened this issue Jun 29, 2023 · 3 comments
Closed

Wikidata <-> Riksarkivet <-> Wikidata Riksdagens corpus #19

salgo60 opened this issue Jun 29, 2023 · 3 comments

Comments

@salgo60
Copy link

salgo60 commented Jun 29, 2023

Nu när API är på G borde vi kunna koppla ihop oss mer effektivt.... gissar att saker som ni tittar på med LLM etc... skapar möjliheter jag har svårt att inse... vilka skall ni koppla ihop er med? är Riksdagen Corpus en kandidat....

Förslag: Kanske vi skall träffas efter sommaren och snacka hur denna matchning skall ske på bästa sett.... det är en stort jobb men kan nog göras mer eller mindre effektivt plus att det är bra att veta vilka ambitions nivåer som finns - min lekstuga med Riksdagsmön och NAD #104 / svenska församlingar 2018

Alternativt: att ni samlar fler aktörer - vi får se om DIGG får fart och kan leverera något bra med persistenta identifierare... så borde dom gubbarna vara naturliga partners... känns som persistenta identifierare utan Riksarkivet by definition är fel tänkt...

Tankar:

  1. Kandidat Riksdagens Corpus som idag "bygger sitt data" på Wikidata men förhoppningsvis kommer att fixa bättre data
    • deras planer med egen persistent identifierar #269
    • lesson learned 2023 är att detta projekt idag jobbar perfekt med GITHUB Issues, PR men lite geggigt med csv filer där posterna inte har identifierare --> halvt omöjligt att referera eller spåra...
  2. Riksarkivet SBL måste ni tvingas in i detta det är galet att Riksdagens corpus inte hämtar sitt data från SBL utan leker med en hobby site som Wikidata - jag ställde frågan till SBL tidigare och helt galet svar - vi har inte resurser - att skapa en datafil med koppling SBL nummer - Arkiv id tar 0 sekunder gissar att dom springer runt en hel del i arkiven.... varför inte dokumentera det som Öppen data och inte interna post-it lappar.... nu körs projektet Riksdagens Corpus med > 5 miljoner i budget... som i en perfekt värld inte hade behövts om SBL, KB, Riksdagens Öppna data hade levererat data som data - RAW Datat now
  3. Ni borde skapa en task i en publik backlog "Hur skall Riksarkivet skapa externa kopplingar....processen.... och vem som skall vara med
    1. Lesson learned är att kvaliten ökar på datat med mera kopplingar mellan varandra.... idag tycket jag vi fastnat i en galen tunna som heter Wikidata där 12000 foliehattar alla har sin egen agenda och inte producerar data som duger till forskningsdata eller verksamhetsdata... MEN känns ofta som det är den bästa datan...
@nilsw-ra
Copy link
Contributor

Inget av detta finns mig veterligen med i Riksarkivets planering och utvecklingsresurserna är knappa, så det är knappast sannolikt att det tas in i planeringen i nuläget.

Frågeställningarna är intressanta men inte direkt relaterade till användning av APIerna, så jag noterar och stänger ärendet.

@salgo60
Copy link
Author

salgo60 commented Jun 29, 2023

© Ok det finns en konferans 30 November med arkiv folk från er det är ju helst dom som skall driva detta.... och som borde ha en vision om saker som detta/ persistenta identifierare och statens dokumenthantering #220

image image

@salgo60
Copy link
Author

salgo60 commented Jul 10, 2023

Annat mycket intressant projekt är KBs historiska tidningar där ni borde ha "samma som" och ni bör ha API:er som lirar ihop se dialog med dom https://feedback.blogg.kb.se/forums/topic/lankmodell/#post-24153 där det verkar vara så illa att dom inte skrivit sin app med APIfirst

På Wikipedia startade Lars Aronsson som skapat Runeberg en diskussion att KB:s svenska historiska tidningar skulle kunna vara ett facit hur bra täckning Wikipedia har på historiska händelser platser personer... samma skulle kunna göras med Riksarkivet....

När jag gjorde en snabbkoll på "geggan" med svenska historiska yrken så såg man tydligt vilken "bias" databaser som Alvin har och samma kan man se på Wikidata att "arbetaryrken" saknas oftast medans adelgubbarna har bra närvaro https://github.com/salgo60/HISCOKoder

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants