Standardi metapodataka

Ovaj članak sadrži opće informacije korisne pri odabiru standarda za opisivanje objekata pohranjenih u digitalnoj knjižnici. Mogu se pronaći i informacije o standardima koji se koriste u ostalim sličnim djelatnostima – muzejima ili arhivima.

Koja će shema metapodatka biti dobar odabir?

Započnimo s pravim poslom! Prema popisu elemenata za provjeru, na početku se treba napraviti identifikacija zahtjeva i dobrih praksi korištenih u sličnim zbirkama. Opisujući ovu fazu, pozvat ćemo se na 9 pitanja koja je sastavila Marie R. Kennedy. Spomenuta pitanja pomažu identificirati zahtjeve i zahvaljujući njima stručnjaci koji izgrađuju zbirku svjesno mogu odlučiti koji su alati i standardi metapodataka najkorisniji za novo stvorenu zbirku. Sva pitanja nisu relevantna u ovoj fazi pa će biti preskočena a za cjelovit popis svih 9 pitanja proučite cjelovit tekst [izvor].

Tko će koristiti zbirku?

Hoće li to biti običan korisnik interneta ili povjesničar? To određuje nekoliko stvari: jezik koji se koristi u opisima, je li korisna uporaba kontroliranih rječnika i koliko opisni metapodaci trebaju biti detaljni. Ponekad je teško procijeniti tko će biti korisnik zbirke i u tom slučaju treba omogućiti što je moguće više ulaznih podataka, npr. sadašnja i povijesna imena ulica.

Tko je katalogizator zbirke?

Je li katalogizator stručnjak u tom području? Hoće li znati ispuniti složenu shemu metapodataka? Morate znati da se rad na jednom zapisz metapodataka može podijeliti i da ga istodobno može raditi nekoliko ljudi. Neki imaju stručna znanja iz područja sadržaja, drugi znaju detalje o shemi metapodataka i mogu pomoći pri ispravnom ispunjavanju metapodataka.

Koliko vremena/novaca imate?

Očito je da što je opis objekta bogatiji, to je veća vjerojatnost da će korisnici koristiti zbirku. Kako bi pripremili bogate metapodatke, potrebno je imati:

  • točnu shemu metapodtaka
  • katalogizatore stručne u korištenju te sheme
  • stručnjaci iz tog područja bili bi najvjerojatnije od koristi.

Imajući sve u vidu, to izgleda kao prilično skup pothvat. Pitanje je imate li vremena sve to napraviti?

Kako će se pristupati vašoj zbirci?

Najvažnije pitanje su mogućnosti sustava digitalne knjižnice da osigura pristup vašim digitalnim izvorima. Podržava li on složene sheme metapodaka? Koje mogućnosti pretraživanja ima? Ako korisnici ne mogu koristiti svo bogatstvo vašeg opisa, pitanje je vrijedi li stvoriti tako bogate metapodatke.

Kakav je odnos vaše zbirke s ostalim zbirkama?

To je važno najviše zbog pitanja interoperabilnosti. Ako ste identificirali sličnu zbirku, vrlo je vjerojatno da ste zainteresirani za povezivanje s izvorima iz te zbirke. Zahvaljujući povezanim izvorima u opisu objekta, korisnici će moći dobiti dodatne informacije.

Vrlo je vjerojatno da će se u nekom trenutku obje zbirke pretraživati putem istog pretraživačkog sučelja zahvaljujući pobiranju podataka (vidi sljedeće poglavlje). U tom slučaju vrijedi osigurati ujednačeno poimanje istih izraza i općih pravila za oblikovanje, npr. Datuma.

Ako vaša knjižnica ima OPAC, uobičajena je praksa povezati zapis u OPAC-u za fizički objekt s digitalnom reprodukcijom u digitalnoj knjižnici.



Koji je obim vaše zbirke?

Određivanjem obima vaše zbirke trebali biste eliminirati neke od standarda metapodataka. Postoji li posebno razvijen standard metapodataka za vaš tip objekata?

Odabir sličnih alata metapodataka (shema, kontroliranih rječnika) otvara mogućnost uštede vremena i novca. Budući da je svaki digitalizacijski projekt drugačiji, trebali biste samostalno procijeniti svoja saznanja i polazišta kako biste izbjegli tuđe pogreške.



Hoće li se vaši podaci pobirati?

Pobiranje podataka je sakupljanje web izvora pomoću specijaliziranog računalnog programa. Takav računalni program (naziva se i web ili mrežni pauk) obično koriste web pretraživači kako bi dobili informacije neophodne za stvaranje svojih indeksa. U području digitalnih knjižnica razvijeni su posebni protokoli za pobiranje podataka – najrašireniji je Otvoreni protokol za pobiranje metapodatka (OAI-PMH). Ako se vaša zbirka pobire, što je slučaj u većini trenutno razvijanih zbirki, trebate biti svjesni o zahtjevu za ovim protokolom. OAI-PMH je kompatibilan sa svim standardima metapodataka zasnovanih na XML-u, ali njegov osnovni zahtjev je da podaci zbirke moraju biti barem u DCMES shemi. Vaša digitalna zbirka može biti opisana u bilo kojem od brojnih XML zasnovanih standarda metapodataka, no kako bi bila kompatibilna ona mora metapodatke prikazati u Dublinskoj jezgri.

Ako je DCMES prejednostavan za vašu zbirku i odaberete standard koji vam više odgovara, morate osigurati odgovarajuće mapiranje i mehanizam konverzije da bi omogućili OAI-PMH pobiranje DCMES-a.

Dosta s pitanjima, vrijeme je za neke odgovore. Na temelju znanja stečenoga u prethodnoj lekciji i odgovorima na opisana pitanja, trebate identificirati grupu potencijalnih shema metapodataka koji odgovaraju vašoj zbirci. Ponekad je teško razlučiti nedostaje li odgovarajući standard, iskustvo ili znanje. U tom slučaju razmislite o Dublinskoj jezgri ili shemi Izraza dublinske jezgre (DC Terms). Ako vam ti i postojeći standardi metapodataka nisu korisni za opis vaše zbirke, uvijek možete stvoriti vlastiti aplikacijski profil.

Aplikacijski profili / Profili primjene

Različiti standardi metapodatkaka definiraju mehanizme koji dozvoljavanju proširenje sheme. Najčešće su sheme proširene kroz takozvane profile primjene ili aplikacijske profile (AP). Definiraju se kao sheme koje se sastoje od elemenata podataka izvedenih iz jednog ili više naziva elemenata koji se zajedno kombiniraju ili optimiraju za posebnu lokalnu primjenu [izvor].

Stvaranje aplikacijskog profila obično se povezuje s miješanjem različitih standarda metapodataka kako bi se pružila bolja pretraživost izvora u datom području. Primjena aplikacijskog profila zahtijeva održavanje odgovarajućeg mapiranja kako bi se postigla dovoljna razina interoperabilnosti [izvor].

Prilikom mijenjanja sheme metapodataka uvijek je bolje pobliže odrediti (kvalificirati) postojeći element nego li stvoriti novi dodatni element. U tom slučaju uvijek je moguće suziti bogatiju reprezentaciju u originalnu shemu kad je potrebno uskladiti ju s izvornom shemom.

Kad dodajete nove elemente zadanoj shemi, preporučuje se povući ih iz drugih standarda metapodataka, ako je to moguće.

U slučaju bilo kakvog dodavanja, pobližeg određenja/rafiniranja ili drugih dodataka (npr. promjena izbornog polja u obvezni element) neophodno je javno dokumentirati te promjene. To će zainteresiranim stranama (uključujući korisnike vaše knjižnice) omogućiti razumijevanje primijenjenog pristupa i učinkovitije korištenje digitalnih izvora iz zbirke.

Više zanimljivih prijedloga o proširenju sheme metapodataka može se naći u [izvor].

Sljedeći dijelovi sadrže kratak opis izabranih standarda metapodataka koji su izabrani iz različitih područja uključujući knjižnice, muzeje i arhive.

Kategorije za opis umjetničkih djela (Categories for the Description of Works of Arts (CDWA)


CDWA [izvor] je stvoren kao sredstvo za opis kulturnih objekta kao što su muzejski izlošci. Ova specifikacija rezultat je rada Snaga za umjetničke informacije (AITIF -The Art Information Task Force), započetog u 90-tima, "koji je potakao dijalog između povjesničara umjetnosti, informacijskih stručnjaka za umjetnost i davatelja informacija, tako da zajednički mogu razviti smjernice za opis umjetničkih djela, arhitekture, skupina objekata i vizualnih i tekstualnih surogata." Izgrađen je od 512 kategorija (koje mogu imati podkategorije); kao što vidite omogućuje vrlo detaljan opis. CDWA identificira 35 ključnih oznaka koje se trebaju koristiti kao minimum. Uspoređujući ga s DCMES-om to izgleda kao vrlo složen standard. 2005./2006. godine CDWA Lite je razvio ovu specifikaciju za XML serijsku izradu zapisa metapodataka stvorenih korištenjem CDWA standarda.

Glavne kategorije CDWA standarda su sljedeće: tip djela objekta, naslov, prikaz, stvaratelj, stvaratelj indeksiranja, mjera prikaza, mjera indeksiranja, materijal/tehnika prikaza, materijal/tehnika indeksiranja, stanje/izdanje prikaza, stil, kultura, datum stvaranja prikaza, datum indeksiranja, lokacija/riznica, predmet, klasifikacija, opis, inskripcija, povezana djela, autorska prava, zapis, izvor.


Za razliku od DCMES-a, CDWA uključuje informacije o izvornoj verziji i digitalnom surogatu. Svi se elementi mogu ponavljati. Vrijedi spomenuti da je CDWA Lite prilagođen OAI-PMH-u te kao i običan DCMES omogućuje suradnju digitalnih zbirki.

Shema metapodataka za opis objekta (Metadata Object Description Schema (MODS))

MODS [izvor] je izravno izveden iz standarda MARC21 i osmišljen je za pojednostavljivanje MARC opisa. Izgrađen je na podskupu polja MARC21 i koristi nazive zasnovane na prirodnom jeziku, za razliku od brojeva koji se koriste u MARC-u. MODS je kodiran u XML-u, tako da su svi zapisi metapodataka usklađeni s MODS-om usklađeni i s XML-om. Kao što već znate, računalni programi lako obrađuju XML.


Napomena:Što to znači da je XML moguće proširiti (XML eXtensible)? Razmotrimo primjer datoteke usklađene s Otvorenim formatom dokumenta (Open Document Format, ISO standard za tekstualne dokumente kodiran u XML-u) koja se lako može proširiti s obilježjima Dublinske jezgre kao što su elementi stvarateljili nakladnik(u XML-u takvo se proširenje naziva imenski prostor namespace) i još će uvijek biti valjana datoteka u Otvorenom formatu dokumenta. Istodobno to će biti i valjan dokument u Dublinskoj jezgri. U većini XML zasnovanih standarda vrlo je jednostavno kombinirati ih zajedno u jednu strukturu. Budući da je svaki od njih formalno opisan, računalni programi nemaju problema s njihovom interpretacijom. Zato se XML naziva prošireni tj. eXtensible.

MODS je posebno sklon omogućavanju bogatih opisa digitalnih izvora. Zahvaljujući razvijenim DC Izrazima (DC Terms) takav se bogati opis može napraviti i korištenjem tog standarda, no u slučaju MODS-a ta je mogućnost prisutna od njegovih početaka. Prema brošuri Razumijevajući metapodatke [izvor], MODS je kompatibilniji s knjižničarskim podacima od Dublinske jezgre, što je razumljivo uzimajući u obzir njegov bliski odnos s MARC 21 formatom, uključujući: neobvezni ID element za olakšano povezivanje na razini elementa, mogućnost određivanja jezika, pisma i transliteracijske sheme na svakoj razini. Prvi prilog predstavlja primjer zapisa metapodataka stvorenog korištenjem MODS-a [izvor].



MODS record example

Prilog 1. Primjer zapisa metapodataka kodiranog korištenjem MODS-a [izvor].

Lagane informacije za opis objekta (Lightweight Information Describing Objects (LIDO))

LIDO je razvijen unutar projekta Athena koji je financirala Europska komisija s ciljem opskrbljivanja Europeane (Europskog muzeja, arhiva i knjižnice) s muzejskim objektima iz cijele Europe. Uvod u specifikaciju LIDO standarda objašnjava motivaciju za stvaranje još jednog standarda na sljedeći način: "Opći je stav u muzejskoj zajednici da sheme izvedene iz DC-a ne pružaju dovoljno bogat pogled na muzejski sadržaj. Važnost muzejskog objekta, posebno izvan područja visoke umjetnosti, često ne pokriva adekvatno." Formati muzejskih metapodataka (npr. CDWA, SPEKTRUM) sadrže vrlo bogati opis za objekte koje LIDO stručnjaci ne mogu lako usporediti s "ravnom" strukturom Dublinske jezgre. Osim toga, stvaratelji ovog standarda navode sljedeće nedostatke Dublinske jezgre: ne postoje alati za stvaranje odnose između različitih klasa i događaja na koje se odnose, njegova mogućnost proširenja (DC dopušta proširenje) je prepreka za interoperabilnost. LIDO je stvoren na temelju postojećih muzejskih shema, posebno ISO standarda pod nazivom CIDOC CRM. LIDO je sukladan s CDWA Lite i museumdat standarda. Zahvaljujući činjenici da LIDO obuhvaća obnovljene standarde ima izglede da bude u širokoj primjeni.

Mora se spomenuti da je LIDO shema za pobiranje i ne treba se koristiti kao osnova za upravljanje zbirkom. LIDO je stvoren uglavnom za dostavu bogatih metapodatka online zbirki institucija bazama podataka i portalima.


LIDO zapis je podijeljen u 7 područja:

  • identifikacija objekta – osnovna informacija o objektu
  • klasifikacija objekta – informacija o vrsti objekta
  • odnos – odnosi objekta s predmetom i ostalim objektima
  • događaj – događaji koji su se dogodili s objektom – stvaranje, nabava, izložba itd.
  • autorska prava djela – informacija o pravima vezanim uz objekt, metapodatke i digitalni surogat koji se pobire za usluge u okruženju
  • zapis – osnovna informacija o zapisu
  • izvor – osnovne informacije o digitalnom izvoru koji se pruža za usluge u okruženju (npr. Europeana)

Ova shema metapodatka je tek nedavno razvijena, no s rastućim zanimanjem Europeane, može biti zanimljivo upotrijebiti ju u slučaju muzejskih podataka.

Opći međunarodni standard za arhivski opis (General International Standard Archival Description (ISAD) ) i Kodirani arhivski opis (Encoded Archival Description (EAD))

ISAD [izvor] definira opća pravila za arhivski opis koja se mogu primijeniti bez obzira na formu ili medij arhivske građe. Sastoji se od 26 elemenata koji se mogu kombinirati za stvaranje potpunog opisa arhivskog entiteta.

EAD [izvor] je standardizirana XML shema koja je razvijena za označivanje podatka iz arhivskih pomagala za traženje. Pomagala za traženje ponešto su drugačija od običnog zapisa metapodataka (iz knjižničarskog gledišta); ona su mnogo duža, više narativna ali istodobno vrlo strogo strukturirana. Pomagala za traženje započinju s opisom zbirke u cjelini, objašnjavaju koju vrstu građe ona posjeduje i zašto je važna. Vrlo je teško zamisliti cijelu biografiju autora kao dio zapisa metapodataka, ali se ona savršeno uklapa u pomagalo za traženje. Na kraju takvog detaljnog dokumenta korisnik će pronaći informacije kako je određeni sadržaj fizički pohranjen, npr. broj kutije. EAD je posebno popularan u akademskim knjižnicama, povijesnim društvima, arhivima i muzejima. Takve institucije imaju velike specijalne zbirke koje u većini slučajeva nemaju jedinstven zapis za svaki predmet.

Kodiranje metapodataka i standardi prijenosa (Metadata encoding and transmission standard (METS))

 

METS [izvor] nije standard za deskriptivne metapodatke; kao što samo ime kazuje, osmišljen je za pružanje standardne strukture podataka za složene objekte digitalne knjižnice. METS je XML temeljena shema, ona omogućuje stvaranje jednog dokumenta koji sadrži informacije o:

  • strukturi objekta, npr. popis stranica u knjizi u odgovarajućem redosljedu

  • povezanim deskriptivnim (npr. DCMES ili MODS zapisima metapodataka) i administrativnim metapodacima (npr. Informacije o postupku digitalizacije)

  • linkovima na datoteke koje predstavljaju sadržaj objekta, moguće je i uklopiti sadržaj unutar METS zapisa

 

Da sažmemo, METS može pohraniti sve metapodatke potrebne za upravljanje digitalnom knjižnicom. METS dokument izgrađen je od 7 dijelova:

  • METS zaglavlje – osnovne informacije o METS dokumentu, npr. Stvaratelj
  • Opisni metapodaci – ovaj dio sadrži opisne metapodatke ali može predstavljati linkove prema vanjskim zapisima metapodataka,
  • Administrativni metapodaci – tehničke informacije o tome kako su datoteke stvorene, pohranjene, i ostale inforamcije (također o autorskim pravima)
  • Dio o datotekama – popis svih datoteka koje su dio ovog projekta
  • Strukturna mapa - - oblikuje strukturu objekata, povezuje datoteke s odgovarajućim zapisima metapodataka
  • Strukturne poveznice – omogućuju stvarateljima METS-a da zabilježe napomene u hijerarhiji skiciranoj u strukturnoj mapi
  • Ponašanje – povezuje izvodiva ponašanja sa sadržajem u METS datoteci.
METS specifikacija ostavlja mnogo slobode u smislu opisnih i administrativnih metapodataka. Nakladničko vijeće METS-a je podržalo tri sheme opisnih metapodataka uključujući Dublinsku jezgru i MODS:

Izvori

  • "Nine questions to guide you in choosing a metadata schema", Marie R. Kennedy, [izvor]
  • "Metadata standards and interoperiability", JISC Digital Media, [izvor]
  • Format Categories for the Description of Works of Arts (CDWA), [izvor]
  • "Metadata Object Description Schema, [izvor]
  • Internal Standard Archival Description, [izvor]
  • Encoded Archival Description, [izvor]
Zadnji puta izmijenjeno: petak, 17. siječnja 2014., 16:06