Christian-Emil Ore, Universitetet i Oslo

Kan informasjonen i museenes samlinger formidles samlet?

CIDOC i Sibiu 2011


I år ble CIDOCs konferanse arrangert i Sibiu eller Hermannstadt i Siebenbürgen i Romania. Området var i seg selv en opplevelse og er absolutt verdt en tur. Men jeg skal her holde meg til innholdet i konferansen. Konferansens tittel var Knowlegde Management and Museums, en ikke helt uproblematisk tittel. Termen ”knowledge”, eller ”kunnskap” på norsk, har siden 1980-tallet vært mye brukt i informatikk og særlig blant forskere i kunstig intelligens og tilstøtende fagområder. Om en slår opp i ordbøker og også i Wikipedia, ser en at kunnskap er noe som et menneske kan oppnå, og ikke noe som kan overføres eller være underlagt ”management”. Forbausende nok var det ingen som kommenterte det. Om en leser konferanseprogrammet og boken med sammendrag av foredragene, så ser en at de fleste foredragsholderne nok mener at kunnskap i denne forbindelsen er det samme som informasjon. Informasjon lyder kanskje ikke fullt så spennende som kunnskap, men ikke desto mindre viktig.

Mange av fordragene hadde de sedvanlige temaene: vårt museum og våre dokumentasjonssystemer. Men det var også en del problematiserende foredrag. Blant annet hold Irina Oberlander-Târnoveanu fra Romania et interessant foredrag med tittelen Who owns museum information? Hun spurte retorisk om med hvilken rett museene sitter på sine data. Hun poengterte det paradoksale i at mens svært mange museer er uvillige til å publisere bilder og referanseinformasjon om gjenstander på nettet og tar høye priser for å fotografere lovlig, så finnes det likevel en utrolig mengde av informasjon om det samme materialet i alle slags sosiale medier. Den restriktive holdningen har dermed egentlig den effekten at bildematerialet som er tilgjengelig på nettet bare holder en lavere kvalitet enn ønskelig og at museene egentlig bare oppnår å bli lite synlige på nettet. Irina Oberlander-Târnoveanu har arbeidet med museumsdokumentasjon i over 20 år. Det var derfor interessant å få høre hvordan den relativt unge finnen Ari Häyrinen diskuterte det samme fenomenet sett fra utsiden av museene i sitt foredrag Google – World's Largest Online Museum? Knowledge Management in Museums in the Age of Networks. Han påpekte som andre har gjort før ham, at mange museer er lite synlige på nettet. Han mente at museenes egne data var for magre og at det var blogger, sosiale medier og dugnadstiltak som Wikipedia som ga best informasjon om museenes gjenstandssamlinger og kulturarv generelt. Han mente at det var slike kollektive tiltak som er fremtiden. Han hadde i tillegg en fascinerende tanke om at informasjonen kunne bindes sammen ved å bruke bilder av gjenstandene som unik indeks. Akkurat det stiller jeg meg litt tvilende til siden mange gjenstander kan være svært like.

Fra Ari Häyrinens ”crowd sourcing” er det et tematisk kort skritt til Europeana som i følge egne strategidokumenter tar mål av seg til å

     ”Develop [the] Europeana service into a common European Information Space (ESI) with easiest
     possible access to content by providing high quality description persistent links, clear rights labeling,
     persistent links to objects so that content remains retrievable over time “(Europeana Content
     Development Strategy 2025 Document).

Monika Hagedorn-Saupe fra Tyskland holdt som vanlig et deskriptivt foredrag om felles tilgang til europeiske museumssamlinger. I år var tittelen Europeana and national digital libraries 2011. Foredraget var en generell introduksjon til utviklingen i Europeana. Men det var et punkt som er verd å nevne spesielt. Hun refererte til en online spørreundersøkelse gjort i 2011 (IRN research, UK) av bruken av Europeana. I foredraget refererte hun til en oversikt over respondentenes vurdering av Europeana med hensyn på blant annet Search facilities?, Usefulness of content?, Trustfulness of content? i forhold til hovedkonkurrentene (rating against main competitor). Fascinerende nok scoret Europeana dårligst på Search facilities. Bare 25% syntes Europeana var bedre, mens 38% synes Europeana var dårligere. Når det gjaldt pålitelighet og brukbarhet var bildet motsatt. Bare 11% syntes innholdet var mindre brukbart, mens over 40% syntes det var bedre. For pålitelighet var det bare 2% som syntes det var dårligere, mens hele 62% syntes den var bedre. Om man skal oppsummere så gir undersøkelsen et inntrykk av at Europeana har ganske dårlige søkemuligheter, mens innholdet oppleves som svært godt og pålitelig. Dette skyldes vel at brukerne vet at dataene kommer direkte fra museer og andre respekterte kulturminneinstitusjoner.

Jeg vet ikke hvorfor Europeana som søkeindeks oppleves som dårligere eller i hvert fall ikke bedre enn Google (main competitor). Det er noe å tenke over. Dersom en ikke klarer å endre en slik konklusjon, er det jo liten vits å bygge en kostbar felles søkeindeks. Det vil være mye billigere for EU om europeiske kulturinstitusjoner inngikk en felles spesialavtale med Google om å lage et ”Google European Culture” etter mal fra Google Books. Men jeg innser at det neppe vil vær politisk mulig. Da betaversjon av europeana.eu ble lansert i 2008, ble den jo raskt lansert av EUs politikere som ”det europeiske svar på Google”. Det hverken var den da eller har den blitt senere.

Personlig liker jeg tanken bak Europeana. Men jeg er bekymret over at en overselger mulighetene som ligger i tjenesten slik den er i dag. Det er et langt skritt fra dagens Europeana til et høykvalitets ”common European Information Space” slik det beskrives i Europeanas strategiske dokumenter. En slik tjeneste forutsetter blant annet at det blir ryddet kraftig i metadataene og at en faktisk tar i bruk den nye datamodellen (Europeana Data Model, EDM). Bare på denne måten kan en få bedre svar på ”hva, hvem, hvor og når” enn hva et hvilket som helst fritekstsøk kan gi.

På CIDOC-konferansen holdt jeg et foredrag om denne problematikken på vegne av en gruppe av kolleger fra Finland, Hellas, Nederland, Norge og Sverige med lang erfaring i digital museumsdokumentasjon. Foredrag hadde tittelen Some aspects of CultureCloud & The European Cultural Heritage Information Space og var basert på en analyse gjort i forbindelse med en søknad om et EU-prosjekt våren 2011.

Om en leser de strategiske dokumentene til Europeana ser en at Europeana ønsker å dreie fokus mer mot kvalitet og ikke så mye på kvantitet:

     ”A move away from numbers (quantity) to quality will be part of the strategy for the next 5 years
     (to 2015): The quality of the metadata […] Its persistency and usefulness for the user; this is the
     primary driver in development of the collections accessible via Europeana” (The Europeana
     Content Development Strategy 2025 Document
)

For å få til dette mener vi at det er nødvendig å rydde opp i metadataene levert til Europeana slik at en i størst mulig grad kan identifisere steder, personer, gjenstander, (sentrale) kulturelle hendelser og typer/term. Med dette menes at for eksempel Grete Prytz Korsmo og Grete Prytz Kittelsen skal vise til samme person altså kunne finne ut at to ulike navn referer til samme person. Tilsvarende må en velge riktig når det er flere ting eller personer som har samme navn. Det er for eksempel minst 12 ulike Gaustad-gårder i Norge. Dette kan synes trivielt men er helt nødvendig for å kunne lenke databaser på en meningsfull måte.

Alle som har jobbet med museumsdata er sørgelig klar over hvilken mangel på orden det er i museumskataloger og museumsdatabaser. Det blir åpenbart ikke mer orden av å samle museumsdata på et nasjonalt (digitalt museum) enn si på et europisk nivå. Det er klart at Europeana aldri vil kunne rydde opp i dette sentralt. Selv i Norge vil det neppe være overkommelig å rydde og systematisere alle museumsdata sentralt. Den eneste mulige løsningen på problemet er å sørge for at ryddingen og systematiseringen av museumsdataene blir gjort der kjennskapet og forståelsen for materialets egenart er størst, nemlig lokalt ved den enkelte samlingsenhet. Dataene kan da bli overført ferdig ryddet til for eksempel Europeana eller Digitalt museum i Norge. Det er ikke urimelig å hevde at det er lettere sagt enn gjort fordi de enkelte museene ikke har verktøy til dette arbeidet, og at det er et nasjonalt ansvar å utarbeide autoritetsregistre for personer, steder og så videre.

Det siste er jeg enig i. Men vanligvis tar jo slike registre bare med de viktigste personene og stedene ut fra kapasitetsproblemer. Derfor må et sentralt oppbygd register støtte seg på lokale miljøer for å få best mulig dekning. Det kan gjøres ved at alle museene får tilgang til verktøy der de kan bygge opp sine egne lokale autoritetsregistre og koble dem mot andre slike registre. På den måten kan en nedenfra og opp konstruere for eksempel person-autoritetsregistre som dekker alt fra lokale bygdebaser til internasjonale oversikter som VIAF (The Virtual International Authority File) eller ULAN (Union List of Artist Names).

Vi mener at uten en konstruksjon av slike omfattende autoritetsregistre for personer, steder og så videre vil Europeana aldri nå sine mål. Jeg vil faktisk si det så sterkt at dersom en ikke kan identifisere personer og steder er mye av grunnlaget for det såkalte ”semantic web” borte. Et tiltak som prosjektet ”Kultur og naturreise” vil heller neppe få noe særlig luft under vingene uten ryddige data. Som vi vet er det meste av dataene i museene inklusive fotografier ikke stedfestet på en skikkelig måte.

I analysen skisserte vi hvordan et slikt system for en stor del kan lages ved hjelp av eksisterende teknologi. Fra tilbakemeldingene jeg har fått siden, har jeg inntrykk av at foredraget ga tilhørerne en del å tenke over. På sesjonen fikk fordraget en god mottakelse og det ble en del diskusjon rundt problemet med rydding og normalisering av data.

Nå har jeg jobbet med dokumentasjonssystemer i museer og andre kulturminneinstitusjoner siden 1990. Rydding i rotete data er det et stort behov for over alt både i lokale museer og ikke minst ved universitetsinstitusjonene. Men selv om folk ser behovet og problemene som rotete data gir, så er det dessverre vanskelig å få noe særlig ressurser til å gjennomføre ryddejobben. Dels mener vel politikerne at institusjonene skulle kunne ha beskikket sitt hus med de bevilgningene de allerede har fått, dels skaper ikke rydding i gamle synder de store overskriftene av typen ”Ny teknologi inn i kulturvernet (Fortidsvern 3/2011)”. Derfor er det desto viktigere at vi klarer å få etablert effektive og distribuerte løsninger for å koble informasjon om samlingene våre til felles autoritetsregistre. Først da kan vi virkelig formidle all den informasjonen vi har i samlingene våre.

 
  til toppen                                                   Tilbake til reiserapporter 2011