Referat från Teknikdagen 2024
Årets Teknikdag med SFIS Mellansverige bjöd på en god och insiktsfull blandning av såväl framtidsspaningar på AI-utveckling, språkmodeller och digitala forskningsmetoder, som historiska tillbakablickar på arkivmaterial och lite av en nutidsorientering i var vi står idag, vilka verktyg och system som står oss till buds och hur vi kan använda dem för att lösa olika problem.
Först ut var Fredrik Heintz, professor vid institutionen för datavetenskap, Linköpings universitet. Han presenterade projektet TrustLLM som går ut på att träna språkmodeller till att bli mer tillitsfulla. Dagens snabba utveckling av generativa AI-verktyg kan tyckas ge ifrån sig resultat som ser ut att vara bra, men när vi tittar närmare kan vi se att de inte överensstämmer så bra med hur det faktiskt ser ut. En självkörande bil kan verka köra mot trafikriktningen på en väg som har olika många filer. En karaktär med en väska liksom skuttar fram när hon går och när hon vrider på huvudet har hon inte längre väskan med sig. Detta är exempel på hur vi i nuläget inte kan lita fullt ut på generativ AI och varför vi bör vara medvetna om dess brister.
Språkmodeller är i huvudsak textbaserade, men det blir även vanligare att språkmodeller tränas på flera olika kommunikationsformer förutom text – exempelvis bild och ljud. AI kan således vara multimodal. Därtill kommer representativiteten, eller det som beskrivs som en kulturell sensitivitet för sådana förhållanden som präglar olika delar av världen. Våra kulturella värderingar kan så att säga extraheras utifrån vårt sätt att uttrycka oss språkligt, menar Heintz. För att säkerställa att den data som språkmodeller tränas på är representativ för olika värderingar, samt i linje med de etiska principer som kännetecknar olika identiteter eller grupper av människor, så blir det viktigt att träna språkmodeller på nya och andra slags dataset än tidigare. Fokus för det projekt Heintz jobbar med är just hur man skapar tillitsfulla data. Detta kan ske med hjälp av generativ AI och översättning av promptar till olika språk.
Justyna Sikora, Robin Kurtz och Agnes Toftgård från Kungliga bibliotekets KB-labb berättade därefter om sitt arbete med att med hjälp av AI skapa en forskningsinfrastruktur och utveckla arbetsmetoder för storskalig digital forskning på nationalbibliotekets rika materialsamlingar. Det innefattar utveckling av språkmodeller för text såväl som ljud och bild, där dessa tränas i att känna igen innehåll på svenska. De stora techföretagen prioriterar inte mindre språk och därför utvecklar KB-labb språkmodeller som fungerar bättre i en svensk kontext. De har exempelvis utvecklat modeller för sökning av bilder antingen med hjälp av andra, liknande bilder eller semantiska sökmetoder. Med hjälp av generativ AI skapas också transkriptioner och sammanfattningar med nyckelord för ljuddata. Kärnan i teamet som arbetar med detta består av dedikerade datavetare, men tanken är också att involvera den övriga verksamheten i sin helhet, att dela varandras kompetenser och samarbeta kring olika AI-lösningar. I och med att metadata ofta saknas för stora delar av materialet, består arbetet mycket i metadataberikning. Det innebär ett stort arbete med att analysera samlingarnas innehåll för att generera metadata så att materialet därmed blir sökbart.
Efter lunch var det dags för Magnus Andersson och Eva Sejmyr från Linköpings universitetsbibliotek respektive Digitaliseringsavdelningen vid Linköpings universitet att förtälja resan mot ett nytt bibliotekssystem, nämligen det webbaserade open source-systemet FOLIO. Övergången till detta system hade föregåtts av omfattande kartläggningar av vad som fungerar bra respektive dåligt med det tidigare systemet, Symphony Workflows, vad man ville kunna göra om man fick välja fritt och vad man behövde sluta upp med. Konsekvensanalyser ledde också till ett tidigt beslut om att det var FOLIO de ville ha. Dock tog det stopp i övergångsprocessen med hänsyn till offentlighets- och sekretesslagen vad gäller hantering av låntagaruppgifter i kombination med det som från början skulle varit en extern leverantör eller värd för systemet. Lösningen var till slut att ta fram och leverera systemet på egen hand, med biblioteket och IT-avdelningen i tätt samarbete.
Fördelen med FOLIO är att det är ett intuitivt, flexibelt och förbättringsbart system som gynnas av många olika kompetenser i samverkan och att hela verksamheten känner delat ägandeskap och ansvar för att systemet fungerar som det ska och fortsätter samverka för att det ska utvecklas vidare. Avgörande i arbetet var att det nya systemet skulle få ta tid att utveckla och att inget halvfärdigt skulle stressas fram. Samarbetet med IT har fungerat bra och kommunikationen med övriga medarbetare på biblioteket fanns också på plats och gjorde det hela till en mycket framgångsrik och lösningsorienterad process, med delaktighet, insyn och förankring i resten av biblioteksverksamheten. Några lärdomar var att det är bäst att inte göra några antaganden på förhand om hur saker och ting kommer att falla ut, att det hela tar tid och att det inte behöver vara perfekt från början. Det finns mycket att lära sig på vägen framåt, och resan fortsätter ännu med att engagera sig i det community som finns kring FOLIO, vara med och påverka och lära av varandra – inte minst i samband med de något komplexa uppgraderingarna av systemet.
Claes Westling från Riksarkivet berättade om historiska arkiv som ett viktigt källmaterial för forskningen. Problemet är att endast en liten del, så lite som mindre än 5% av allt material på Riksarkivet, är digitiserat och sökbart. Det betyder inte bara att forskningen endast tar hänsyn till en liten del av materialet och att den styrs på ett bekymmersamt vis, utan kan också ge en skev bild av historien. Till att börja med redogjorde Westling för hur arkivsystemet har byggts upp och numera består av såväl offentliga som privata aktörers arkivsamlingar. Staten har med Riksarkivet som högsta arkivvårdande instans varit den stora draken i den offentliga förvaltningen, och det råder stora skillnader gentemot privata arkiv som kan vara mer utspridda. Fördelen med digitala arkiv är såklart sökbarheten, och Riksarkivets söktjänst är därför välanvänd. Det är förstås bra att det går att komma åt det digitala material som finns att tillgå, men den större delen av arkiven osynliggörs och förblir obeforskad. Det digitiserade materialet ger endast glimtar av historien. Försök har gjorts att automatisera uppläsning av äldre handskrivna texter med hjälp av HTR, Handwritten Text Recognition. Utvecklingen mot digitisering av arkiv går dock mycket långsamt och tilldelas väldigt begränsade resurser.
Sist men inte minst talade AI-optimisten Joakim Jardenberg om vår aktiva interaktion med AI och AI-verktyg som avgörande för att använda rätt verktyg på rätt sätt. Vi ska med andra ord föreställa oss AI som en samtalspartner på andra sidan bordet, som växer och lär sig ju mer vi interagerar med denna. Jardenberg konstaterar att informationsspecialister behövs i en stormig framtid av skrivbordsrevolutionen med AI, där många kanske lutar sig tillbaka och tror att AI kan ge alla svaren och på sikt ersätta oss människor. Och visst kan AI vara till stor hjälp i att lösa problem, men den snabba utvecklingen kräver av oss att vi funderar på vårt förhållningssätt till AI, det vill säga hur vi aktivt använder och interagerar med AI-verktyg på ett meningsfullt och konstruktivt sätt. Vi ska inte passivt förledas till att godta första bästa svar, för AI är inget orakel utan något som formas i samverkan och interaktion med människor. Vi bör utmana verktygen för att iterativt skapa, söka och bearbeta mening med hjälp av AI. Vi kan på så vis också lyfta oss själva, vilket enligt Jardenberg medför ett slags demokratisering av informationsflödet. Vi blir ett slags hackare av systemet som lär oss prompta fram rätt sökfrågor, fortsätter han, och betonar att vi ska tänka på två saker: välj rätt verktyg och interagera med dessa på rätt sätt. Med Gasparovs förlorade schackduell mot en maskin som exempel underströk Jardenberg att människan inte är unik, det avgörande är kvaliteten på maskinen i kombination med det mänskliga. Maskinen kommer alltid att slå oss människor, men grundtanken är att maskin och människa tillsammans kan bilda en oslagbar duo.
SFIS tackar årets alla föredragshållare än en gång samt alla åhörare på plats och digitalt. Vi ser fram emot att ses nästa år igen, på Teknikdagen 2025.
/Cia Gustrén