Kansallinen digitaalinen kirjasto eli KDK on yksi opetus- jakulttuuriministeriön keskeisistä hankkeista. Tavoitteena on suomalaisten
kirjastojen, arkistojen ja museoiden yhteinen asiakasliittymä,
kulttuuriperinnön digitointi sekä digitaalisen aineiston
pitkäaikaissäilyttämisen toteuttaminen. Tiistaina KDK astui taas askeleen
eteenpäin, kun mukana olevien organisaatioiden yhteinen tiedonhakupalvelu Finna
julkistettiin. Itse asiassa se on kaikessa hiljaisuudessa ollut avoinna jo
jonkin aikaa, joten monilla on ollut mahdollisuus tutustua siihen jo etukäteen.
Finnan avajaiset eivät ylittäneet uutikynnystä, eikä verkosta ainakaan vielä
löydy tilaisuudessa pidettyjä puheita.
Nopea selailu osoittaa, että Finna on hyvinkin uutisen
arvoinen. Enää ei tarvitse hakea aineistoa monesta eri osoitteesta. Kohteita on
yli seitsemän miljoonaa. Jos kirjoittaa hakukenttään ”Aino Ackté”, löytää
yhdellä kertaa Acktésta kirjoitetut kirjat, hänen omat teoksensa ja ne levyt,
jotka ovat Kansalliskirjaston kokoelmissa. Lisäksi löytyy tieto, että Acktén
oma arkisto on Kansalliskirjastossa, vaikkei sitä olekaan yksityiskohtaisesti
luetteloitu. Hienointa on, että samalla löytyy suuri määrä Aino Acktéa esittäviä
valokuvia ja maalauksia - ei vain viitteinä, vaan myös digitaalisina kuvina.
Aploodeja Finnalle.
Tällainen on digitaalinen kirjasto parhaimmillaan: kun
aineisto on saatu digitaaliseen muotoon, käyttäjät voivat tutustua siihen
kaikessa rauhassa omilta päätteiltään. Jos kohteesta tarvitaan parempilaatuinen
kopio, mennään kirjastoon kun esivalinta on tehty. Lähes joka maassa puuhataan
tällä hetkellä omaa kansallista digitaalista kirjastoa, ja myös Googlen
tapaiset kaupalliset toimijat ovat aktiivisia. Pitkäaikaissäilytys ja
käyttöliittymät ovat tärkeitä, mutta kun tavallinen käyttäjä puhuu
kansallisesta digitaalisesta kirjastosta, hän odottaa myös aineiston olevan
saatavilla verkossa.
Finna-käyttöliittymässä on mahdollisuus rajata haku
koskemaan vain verkossa saatavilla olevaa aineistoa. Digitaalista aineistoa on yli
600 000, josta suurimman ryhmän muodostavat kuvat, yli 230 000. Kun
tähän lisätään kuvatut museoesineet ja taideteokset, kuvia on noin puolet digitaalisesta
aineistosta. Tämä on kuvia arkistoivilta organisaatioilta loistava suoritus. (Viime
aikoina luvut ovat kasvaneet päivittäin, joten lukuni saattavat olla jo
vanhentuneita).
Seuraavaksi suurin ryhmä on painettu ja kirjoitettu sana, kirjat,
lehdet, artikkelit, opinnäytteet ja asiakirjat, joita on lähes yhtä paljon. Digitaalisesta
kirjastosta löytyy sekä Seitsemän veljestä että tuoreita viranomaisjulkaisuja. En
kuitenkaan löytänyt kuvausta siitä, miten digitoitu teksti jakautuu uuden,
digitaalisena syntyneen kirjallisuuden ja digitoidun painetun
saakka, mutta millä perusteilla kirjat on valittu? Nopea haku tuotti tulokseksi
vain 1200 digitoitua kirjaa vuosilta 1700 - 1900, näistäkin osa ulkomaisia. Tieto
valintaperusteista olisi hyödyllinen käyttäjälle, jotta hän voisi etukäteen
harkita, mitä KDK:sta kannattaa etsiä.
On selvää, että kansallisen digitaalisen kirjaston
rakentamiseen kuluu aikaa. Käyttöliittymä ja pitkäaikaissäilytys ovat tärkeitä
asioita, mutta käyttäjän kannalta varsinainen pihvi on verkossa saatavissa
oleva digitoitu aineisto. Olen etsinyt ministeriön ja kansalliskirjaston
sivuilta visiota siitä, miten kansallisen digitaalisen kirjaston aineistojen
odotetaan kasvavan vuosien mittaan. Mitä KDK:ssa on vuonna 2020 tai 2030? Ministeriö
on digitoinnin tärkein rahoittaja Suomessa, joten sillä pitäisi tässä asiassa
paljonkin sanottavaa. KDK:n kehittämisestä löytyy hienoja teknisiä
suunnitelmia, mutta arkikielellä kirjoitettu visio palveluiden tulevasta
sisällöstä puuttuu.
Joka tapauksessa kansallinen digitaalinen
kirjasto on toistaiseksi vino. Kuvia ja kirjoituksia on satoja tuhansia. Digitoituja
äänitteitä on 261, videoita 27 ja nuotteja 24. Musiikin tutkimuksen kannalta on
harmillista, ettei täältä löydy 1800-luvun suomalaisia sävellyksiä, joista
lähes kaikki ovat jo vapaita (Sibeliuksen varhaistuotantoa lukuun ottamatta,
kiitos säveltäjän pitkäikäisyyden). Nuottien digitoiminen kuvamuodossa ei ole
sen hankalampaa kuin valokuvien tai maalausten, ja niiden kokonaismäärä on
melko pieni. Kokoelmasta löytyy sentään näytteenä Paciuksen Vårt land, joka
kuvalaatu on täysin riittävä.
Kaksi on joukosta poissa
Yksi selitys kokoelmien vinouteen on, että tärkeimmät
av-arkistot eivät ole mukana KDK:n ensimmäisessä vaiheessa. Kansallinen
audiovisuaalinen arkisto KAVA arkistoi elokuvia, videoita sekä viime vuosien
ajalta myös radio- ja televisio-ohjelmia. Näistä ei KDK:sta löydy edes hakutietoja,
tietoa hakevan täytyy siirtyä KAVAn omille sivuille. Suurin digitaalisen
aineiston kokoelma taas olisi Yleisradion arkistossa, jossa on satojatuhansia
radio- ja televisio-ohjelmia ja paljon muutakin. Suuri osa tästä löytyy jo digitoituna
Ylen sisäisestä verkosta, muutama prosentti myös Ylen omilla
Areena-verkkosivuilla. Olisi mielenkiintoista kuulla, miten ja millä
aikataululla sähköinen viestintä ja av-aineisto tulevat KDK:hon.
Yleisradion äänilevystön Fono löytyy jo verkosta. Olisi
teknisesti yksinkertaista lisätä KDK:hon myös radio- ja tv-arkistojen
hakemistot, joista löytyy valtava määrä kulttuurihistoriallisesti arvokasta
tietoa. Ylen arkistojen tutkijapalveluja on vuosikaudet palloteltu KAVAn ja
YLEn välillä. Tutkimuskäyttö on teoriassa mahdollista mutta käytännössä hankalaa,
vanhat aineistot pitää käydä etsimässä YLEssä ja uudet KAVAssa. Hakemistojen
avaaminen verkkoon helpottaisi huomattavasti aineiston käyttöä, kun tutkijat
voisivat itse selvittää mitä on tallella.
Audiovisuaalisen aineiston puute liittyy tietysti tekijänoikeuksiin.
Kaikki tietävät, että digitaalisten kirjastojen tulevaisuuden kannalta
tekijänoikeudet ovat keskeisiä. Tähän liittyviä asioita puidaan EU:ssa, Google
Books-hanke on pyörinyt tuomioistuimissa jo vuosia. Ministeriön hiljaisuus on
omituista. Ne kuuluvat opetus- ja kulttuuriministeriön toimialaan. mutta en
löytänyt KDK:ta koskevasta tausta-aineistosta mitään mainintaa siitä, miten
digitaalisen aineiston käytön edellyttämiä tekijänoikeussopimuksia pyritään
kehittämään.
Mihin suuntaan tekijänoikeudet?
Kaikki kirjastoissa ja arkistoissa oleva aineisto ei tule
ilmaiseen verkkojakeluun. Kustantajat ja tuottajat hoitavat itse uuden,
ajankohtaisen aineiston markkinoinnin verkossa. Toisaalta tekijänoikeudet
vanhenevat, eikä Aleksis Kiven oikeuksista enää tarvitse sopia. Monissa maissa
digitoinnissa priorisoidaan public domain -aineistoa, jonka tekijänoikeudet
ovat vanhentuneet. Tämä tarkoittaa tällä hetkellä kaikkia teoksia, joiden
tekijät ovat kuolleet vuonna 1942 tai aikaisemmin – ja joka vuosi rajapaalu
siirtyy. Public domain-aineiston jakelulle ei ole tekijänoikeudellisia esteitä.
Lähes kaikki 1800-luvulla painettu suomalainen kirjallisuus voisi olla verkossa
vapaasti käytettävissä, suuri määrä uudempaakin. Myös äänitteissä on paljon vapaata
historiallista aineistoa, luultavasti elokuvissakin. Ehkä kiinnostus 1800-luvun
kirjallisuutta ja musiikkia kohtaan on niin vähäistä, ettei sitä kannata
digitoida? Olisi hyvä, jos KDK:n suunnittelijat kertoisivat oman näkemyksensä,
ja käyttäjätkin voisivat sanoa siitä mielipiteensä.
Sillä välin kun opetusministeriö on suunnitellut kansallista
digitaalista kirjastoa, Suomen suurin levy-yhtiö Warner Music on jo avannut oman
”kansallisen äänilevykirjastonsa”. KDK:ssa on 261, Warnerin
palvelussa yli 20 000 äänitettä, jotka ovat käytettävissä Spotify-palvelun
kautta. Ymmärtääkseni myös suurimmat sanomalehdet harkitsevat maksullisia
nettiarkistoja – parhaillaan vireillä oleva laajennettu sopimuslisenssi tekisi
niiden rakentamisen helpommaksi. Warnerin nettipalvelussa on kuitenkin vähän musiikkia 1900-luvun ensimmäiseltä puoliskolta. Mikään kaupallinen
toimija ei tule digitoimaan ajat sitten sammuneiden sanomalehtien vuosikertoja.
Kaupallisesti attraktiivisen aineiston ja public domainin väliin jää kuitenkin valtava
harmaa alue tekijänoikeudellisesti suojattua aineistoa, joka ei tuota
kenellekään mitään. Sen käytöstä voidaan sopia monella eri tavalla.
Kansalliskirjaston johtajan Kai Ekholmin tuoreessa
juhlakirjassa Libraries, Cultural Heritage and Freedom of Information on Kopioston
varatoimitusjohtajan Jukka-Pekka Timosen mielenkiintoinen artikkeli kirjastojen
ja tekijänoikeusjärjestöjen muuttuneesta suhteesta. Timonen kaavailee
tulevaisuudessa jonkinlaista yhteistyötä kirjastojen, kustantajien ja
tekijänoikeusjärjestöjen välillä. Kirjojen kustantajathan eivät pääsääntöisesti
omista julkaisemiensa teosten verkko-oikeuksia, ne ovat jääneet kirjoittajille
ainakin vanhemman aineiston osalta. Kustantajilla ei myöskään välttämättä ole
resursseja laajamittaiseen digitointiin. Niillä olisi kuitenkin halua rakentaa
julkaisemansa aineiston pohjalta uusia verkkopalveluita. Warnerin musiikkiarkisto
on tästä hyvä esimerkki.
Warnerin arkiston kansallista merkitystä osoittaa sekin,
että opetus- ja kulttuuriministeriön osallistui digitoinnin kustannuksiin. Nyt
tarvittaisiin kuitenkin ministeriön visiota kansallisen digitaalisen kirjaston
tulevaisuudesta. Miten digitoitavaa aineistoa priorisoidaan, miten oikeuksista
sovitaan, miten käytöstä maksetaan? Kuka tuo verkkoon ne äänitteet, joita ei
löydy Warnerilta?
Kansallinen digitaalinen kirjasto on loistava idea. Sille
voi kuitenkin käydä niin kuin Suomen terveydenhuoltojärjestelmälle. Yksityisten
terveysasemien roolissa ovat maksulliset nettipalvelut, joista saa nopeasti eniten
kysyttyä aineistoa. Työterveyshuoltoa edustaa Yleisradio, joka tarjoaa
asiakkailleen hyvää palvelua, mutta vain omilla sivuillaan ja oman valintansa
mukaan. Vanhojen ja vähän kysyttyjen kirjojen hoito jää julkiselle
kirjastolaitokselle. KELA:n roolissa on valtiovalta, joka lainsäädännöllä ja
rahoituspäätöksillään luo järjestelmän. Olisi mielenkiintoista lukea opetus- ja kulttuuriministeriön visio kansallisen digitaalisen kirjaston kehittämisestä. Miten digitoitava aineisto valitaan? Míten sähköisen viestinnän arkistot saadaan mukaan järjestelmään? Miten tekijänoikeudet järjestetään, kehitetäänkö KDK:n pohjalta myös maksullisia palveluita?