Jonathans verktygsnytt #4

Vad för information kan vi hitta inuti en fil, i dess metadata? En hel del, visar det sig. Jonathan Lundberg berättar om hur man kartlägger en fils ursprung – och hur metadatan, i form av den nya äkthetsmärkningen C2PA, kan hjälpa oss att avslöja AI.
Varje digital fil innehåller metadata. Den är inte tänkt att synas utåt; metadata betyder “information om information”, alltså sådant som ligger dolt inuti en fil och berättar om var, när, hur, av vem och med vilken utrustning den skapades. Tänk: fotodatumet som kameran lagrar när du tar en bild.
Beroende på filen och hur den hanterats, kan metadatan variera. Om du undersöker en bild i originalskick – kanske uppladdad till en hemsida, eller skickad till dig via mejl, sms eller valfri molntjänst – finns god chans att informationen är intakt. Då kan metadatan (som du finner genom att högerklicka på filen och välja “Egenskaper”, eller använda ett onlineverktyg som Metadata2Go) berätta just när kameran uppger att bilden togs, vilka inställningar som användes, var den togs (om platsdatan lagrats), med mera. Har bilden däremot laddats upp till sociala medier, eller komprimerats på något vis, är risken tyvärr stor att datan försvunnit.
Ett annat problem är att metadata kan manipuleras. Visst finns det exempel när även professionella propagandister glömt bort det – den 18 februari 2022 publicerades en video i en pro-rysk Telegram-kanal, som påstods visa hur polsktalande sabotörer planerat att spränga en klortank i Donetsk-regionen, med civila offer som sannolik följd; en av flera förevändningar som föranledde den fullskaliga invasionen av Ukraina. Men i metadatan kunde OSINT-utredare se att filmen skapats två veckor tidigare, och sedan att klippet var ett montage. Bellingcats grundare Eliot Higgins spekulerade då kring att uppladdaren hade missat att Telegram är ett av få sociala medier som inte rutinmässigt tar bort metadata – men om de känt till det, hade manipulatörerna kunnat fabrikera ett annat skapandedatum.
Sedan ett par år tillbaka talas det allt oftare om C2PA – Coalition for Content Provenance and Authenticity. Det är en öppen standard för att genom metadatan verifiera äktheten i digitalt innehåll, som flera av techjättarna nu anslutit sig till. Tanken är att kameror ska ge bilder en märkning, i sin tur kallad Content Credentials, som visar att de är äkta; och tvärtom, att AI-modeller ska märka upp innehåll de varit med och skapat eller förändrat. Detta skiljer sig från de vattenstämplar likt SynthID som Valkollens förra verktygsnytt handlade om. Metoderna arbetar på olika nivåer; SynthID-stämpeln inpräntas som ett visuellt (eller audiellt) lager, medan C2PA-märkningen läggs i filens inre.
Det är lätt att föreställa sig hur de två teknikerna kan komplettera varandra: låt säga att en bluffmakare skapar en bild med hjälp av AI, och C2PA-stämpeln präntas in i filen. Då kanske personen tar en skärmdump av bilden, och på så vis får en kopia utan metadata – men även i skärmdumpen hänger den visuella SynthID-stämpeln kvar, om den nu inte rensats bort via de metoder som vi också nämnde i det förra nyhetsbrevet.
Men: även om det här är en lovande utveckling, varnar kritiker för en falsk trygghet. Låt säga att någon skapat en bild med en frifräsar-AI som inte lägger på någon visuell vattenstämpel (eller att stämpeln tagits bort). Sedan tar denna person ett foto av bilden, med en kamera som märker upp den med en C2PA-stämpel. Då kommer bildens metadata säga att det är ett äkta fotografi; och det kommer inte finnas någon visuell vattenstämpel som motsäger det.
Nå, att ett plåster inte täcker hela såret är inte skäl för att inte sätta på det. Det kommande halvåret lär vi se dessa tekniker appliceras på bred front – för den 2 december 2026 kickar nästa fas i EU:s nya AI-lagstiftning in, då allt innehåll som skapats eller manipulerats på artificiellt vis måste vara uppmärkt. Hur säkra dessa stämplar sedan blir, får framtiden utvisa.
Om bilden ovan: OpenAI är ett av de techbolag som anslutit sig till C2PA-standarden. Bilden ovan är skapad av ChatGPT – undersöker man dess metadata, exempelvis genom att ladda upp bilden till den officiella Content Credentials-databasen, avslöjas AI-ursprunget.