Takaisin DigPubin kotisivulle 6 JYVÄSKYLÄN YLIOPISTON JULKAISUMALLI

Seuraava Edellinen Alkuun
Seuraava Edellinen Alkuun


  • 6 JYVÄSKYLÄN YLIOPISTON JULKAISUMALLI

  • 6.1 Yleiskuvaus
  • 6.2 Julkaistavan tekstin tuottaminen
  • 6.2.1 Laiteympäristönä PC
  • 6.2.2 Laiteympäristönä UNIX
  • 6.3 SGML-merkkaus ja jäsentäminen
  • 6.4 Muunnokset LaTeX- ja HTML-muotoihin
  • 6.4.1 SGML-tekstin muuntaminen LaTeX-muotoon sgmlspl-ohjelmalla
  • 6.4.2 SGML-tekstin muuntaminen HTML-muotoon sgmlspl-ohjelmalla
  • 6.4.3 LaTeX-tekstin muuntaminen HTML-muotoon LaTeX2HTML-ohjelmalla
  • 6.5 Kuvien ja taulukoiden käsittely
  • 6.6 Julkaisumallin käytettävyys
  • 6.6.1 Julkaisumallin käyttöönotto ja ylläpito
  • 6.6.2 Uusien docbook.dtd:n tekstitunnisteiden käyttöönotto
  • 6.6.3 Muunnosohjelmien päivittäminen
  • 6.6.4 Paperi- ja verkkojulkaisujen arviointia
  • 6.6.5 Julkaisumalli opetuskäytössä
  • 6.6.6 Yleisarvioita julkaisumallista
  • 6.7 Yhteenveto


    6 JYVÄSKYLÄN YLIOPISTON JULKAISUMALLI

    Edellä esitettyihin elektronisten dokumenttien hallintaan ja julkaisemiseen WWW:n välityksellä, akateemiseen julkaisemiseen, rakenteisten dokumenttien käsittelyyn ja SGML-dokumenttien hallintaan tarkoitettujen julkisohjelmien esittelyyn perustuen on tässä luvussa kuvattu julkaisumalli Jyväskylän yliopiston julkaisutuotannolle. Julkaisumallin kehittämisessä käytettiin testiaineistona tätä pro gradu -tutkielmaa. Pro gradu -työt ovat yksi tärkeä osa-alue yliopiston julkaisutuotannosta ja tässä mallissa käytetty dokumentin rakennekuvaus (DTD) ja SGML-tekstistä tehtävät muunnokset LaTeX- ja HTML-muotoon noudattelevat pro gradu -töiden rakennetta.

    Julkaisumallin yleinen, ohjelmistovalinnoista riippumaton rakenne on esitetty luvussa 4.5 'Jyväskylän yliopiston julkaisujen käsittelymalli'. Lisäksi julkaisumallin tarkempi käyttöohje on liitteessä 5, joten tässä keskitytään julkaisumallin esittelyyn sekä sen yleisrakenteen että käytettävyyden kannalta. Seuraavassa on esitelty ensin julkaisumallin yleiskuvaus, jonka jälkeen esitellään tarkemmin ne luvussa 5 kuvatut ohjelmat, jotka osoittautuivat testauksen tuloksena sopiviksi käytössä olleeseen testausympäristöön sekä julkaisujen käsittelymallin rakenteeseen. Luvun lopuksi pohditaan mallin käytettävyyttä ja vertaillaan sen avulla muodostettuja Internetin välityksellä julkaistavia versioita sekä tekijöiden että pienen, tietojenkäsittelytieteiden laitoksen henkilökunnalle ja opiskelijoille kohdistetun kyselyn tuloksien perusteella.

    6.1 Yleiskuvaus

    Julkaisumallin rakenteelle asetettiin tavoitteeksi, että se sisältää käsittelyvaiheet tekstin tuottamisesta sen julkaisemiseen paperi- ja verkkoversiona. Mallin rakenteelle asetetut tavoitteet ja tutkimuksen rajaaminen käsittämään vain UNIX-ympäristöön tarjolla olevat SGML-dokumenttien hallintaohjelmat muodostivat suhteellisen tarkkaan rajatun lähtökohdan tämän tutkimuksen tuloksena syntyneelle julkaisumallille. Toisaalta yliopiston julkaisutuotannon laajuudesta johtuen kaikkien eri julkaisujen huomioiminen tämän tutkielman puitteissa oli täysi mahdottomuus. Tutkimustyön perustuminen tähän tutkielmatekstiin ei kuitenkaan ollut perusteeton, koska pro gradu -työt muodostavat tärkeän ja frekvenssiltään laajan osuuden koko yliopiston julkaisutuotannosta.

    Kuvassa 7 on esitetty julkaisumallin sisältämät vaiheet ja ohjelmat. Mallin perusrakenne muodostuu julkaistavan tekstin tuottamisesta, SGML-merkkauksesta ja muuntamisesta julkaistavaan muotoon. Julkaistava teksti voidaan kirjoittaa periaatteessa kolmella eri tavalla: tekstinkäsittelyohjelmalla PC- tai UNIX-ympäristössä tai SGML-merkkauksen kanssa samanaikaisesti UNIX-ympäristössä. Julkaisun SGML-merkkaus ja muuntaminen julkaistavaan muotoon tapahtuu kuitenkin aina UNIX-laitteella tutkimusalueen rajauksesta johtuen. Koska julkaisumallin tavoitteena oli muodostaa paperi- ja verkkojulkaisu, julkaisumalli sisältää toiminnot julkaistavan tekstin muuntamiseen LaTeX- ja HTML-muotoon. LaTeX-versiota voidaan myös esikatsella näytöltä paperille tulostamisen lisäksi.

    Seuraavassa on kuvattu tarkemmin julkaisumallin vaiheet, niissä käytettävät ohjelmistot ja kokemuksia mallin käytöstä tämän tutkielman tekemisessä. Ohjelmistovalinnat tehtiin aikaisemmin luvussa 5 esitettyjen ohjelmistoraporttien ja testaustuloksien perusteella. Toisaalta tutkimuksen keskittyminen vain UNIX-ympäristön julkisohjelmiin aiheutti sen, ettei ohjelmistotarjonta muodostunut kovinkaan laajaksi. Toisaalta jotkin tarjolla olevat ohjelmistot, joita luvussa 5 on tutkittu, ovat keskeneräisiä beta-versioita.

    Kuva 7. Jyväskylän yliopiston julkaisumalli

    6.2 Julkaistavan tekstin tuottaminen

    Ensimmäiset testiaineistona käytetyt tekstitiedostot tuotettiin Microsoft Word v.2.0 -tekstinkäsittelyohjelmalla, mutta myöhemmin tekstiin kohdistuvat päivitykset tehtiin suoraan UNIXin tekstinkäsittelyohjelmalla SGML-muotoiseen tekstiversioon. Tästä ilmeneekin julkaisumallin keskeisin ongelma eli tekstin kaksinkertainen päivitystarve, jos teksti on tarpeen tallentaa myös PC:lle. Tällöin PC- ja UNIX-versioiden ylläpito vaativat omat toimenpiteensä.

    6.2.1 Laiteympäristönä PC

    Tekstin kirjoittaminen aloitettiin PC:llä Microsoft Word v. 2.0 -tekstinkäsittelyohjelmalla. Teksti muotoiltiin yleisten tutkielman ulkoasuvaatimusten mukaisesti sisällys- ja lähdeluetteloineen, koska dokumentista haluttiin tuottaa myös PC-versio. Jotta tekstitiedosto voitiin siirtää UNIXiin, se tallennettiin tekstitiedosto-muotoon (Text only), jolloin tuloksena oli ASCII-tiedosto ilman rivinvaihtomerkkejä. Myöhemmin PC:n tekstinkäsittelyohjelmalla tuotettu sisällysluettelo osoittautui turhaksi, koska SGML-tekstimuodon muunnoksen (LaTeX- ja HTML-muotoon) yhteydessä se muodostettiin muunnosohjelman toimesta.

    Julkaistava teksti voidaan siis tuottaa millä tekstinkäsittelyohjelmalla tahansa, koska julkaisumallin käytön lähtökohtana on tekstitiedosto, joka ei sisällä mitään tekstin muotoilumerkkejä. Tämän lisäksi muiden kuin tekstikokonaisuuksien (esimerkiksi taulukoiden ja kuvioiden) muotoileminen ja liittäminen tekstiin on turhaa, ellei dokumentista sitten ole tarpeen säilyttää PC-laitteella ylläpidettävää versiota. Niiden käsittelystä on kerrottu tarkemmin kappaleessa 6.5 'Kuvien ja taulukoiden käsittely'.

    6.2.2 Laiteympäristönä UNIX

    Julkaisumallin tekstinkäsittelyohjelmaksi UNIX-laiteympäristöön valittiin GNU Emacs, (ks. luku 5.3.1 GNU Emacs) koska julkisohjelmatarjonta SGML-tekstien tuottamiseen ja hallintaan käsitti käytännössä vain GNU Emacsin ja siihen soveltuvan SGML-muotoisten tekstien muokkaamiseen tarkoitetun PSGML-ohjelman (ks. luku 5.3.2 PSGML). Tätä tutkielmatekstiä tuotettaessa käytimme kyseisiä ohjelmia UNIXin X window -järjestelmässä, jolloin käyttöympäristö muodostui yllättävänkin joustavaksi. Kuten luvussa 5 ohjelmien esittelyn yhteydessä on kerrottu, X window -ympäristössä sekä GNU Emacsin että PSGML komennot ja tekstin muokkaukseen tarvittavat toiminnot ovat valittavissa hiiren avulla ruudun yläosan valikosta.

    Tekstiä tuotettaessa UNIX-ympäristössä käyttäjä voi valita kahden eri toimintatavan välillä. Julkaistava teksti voidaan kirjoittaa kokonaisuudessaan tai osin valmiiksi ennen SGML-merkkausta, tai teksti voidaan kirjoittamisen yhteydessä merkata SGML-muotoon. Käytettiinpä sitten kumpaa tapaa tahansa, SGML-merkkaus noudattaa kuitenkin periaatteiltaan aina samaa menetelmää, josta on kerrottu tarkemmin seuraavassa kappaleessa.

    6.3 SGML-merkkaus ja jäsentäminen

    Julkaistava teksti merkataan SGML-muotoon tekstin kirjoittamisen jälkeen tai sen yhteydessä. Tunnisteiden lisäys tekstin joukkoon tehtiin X window -järjestelmän GNU Emacsin PSGML-ohjelmalla, joka SGML-tiedoston tunnistaessaan tuo valmiit ylävalikot elementtien merkkausta varten. Valmiiksi kirjoitetun ja muotoilemattoman ASCII-tiedoston käsitteleminen (otsikoiden, kappaleiden, yms. tekstiosien havaitseminen ja erotteleminen) oli aluksi työlästä. Tekstitiedoston merkkaaminen SGML-muotoon vaati joskus tarkkaa DTD:n tutkimista ja jonkin verran tekstin rakenteen muuttamista, jotta teksti saatiin lopulta valmiiksi SGML-jäsentäjän hyväksymään muotoon.

    Tekstiä ylläpidettäessä ja päivitettäessä muutokset tehtiin aina suoraan tekstin SGML-versioon. Tällöin SGML-merkkaus tehtiin kirjoittamisen yhteydessä. Keskeisimpien tekstiosien (kuten tekstikappaleet ja -otsikot) merkkaus oli toimenpiteiltään vaivatonta ja helppoakin, mutta monimutkaisempien tekstitunnisteiden (kuten lähde- ja tekstiviittausten) tekeminen ei tuntunut luontevalta kirjoittamisen yhteydessä. Tämän lisäksi myös erikoismerkkien muuntaminen tehtiin yleensä vasta varsinaisen kirjoittamisen päätyttyä.

    Vaikkakin GNU Emacs ja PSGML tarjoavat X window -järjestelmässä toimiessaan suhteellisen helppokäyttöisen ja monipuolisen käyttöliittymän, SGML-muotoisen tekstikokonaisuuden ylläpitäminen ei kuitenkaan vastaa mukavuuksiltaan PC-laiteympäristössä WYSIWYG-periaatteella tehtyjen dokumenttien ylläpitämistä. Sen lisäksi, että teksti sisältää erilaisia SGML-tunnisteita, erikoismerkkien korvaaminen erilaisilla kirjainyhdistelmillä (esimerkiksi ä on korvattu &ae;-yhdistelmällä) tekee tekstistä entistäkin vaikeaselkoisempaa.

    SGMLS-jäsentäjä on myös saatavana PC-versiona, jolloin tekstin muokkaaminen ja ylläpitäminen SGML-muodossa voisi onnistua PC:llä ja näin vältyttäisiin myös moninkertaisilta päivityksiltä. Jäsentäjän toimintaa yritettiin testata myös PC:llä, mutta PSGML-muokkausohjelmiston asennusohjeista ei käynyt ilmi, mitä tekstinkäsittelyohjelmaa se tukee PC-ympäristössä. Niinpä tekstin merkkaamista PC:llä ei ole testattu.

    6.4 Muunnokset LaTeX- ja HTML-muotoihin

    Tekstistä muodostetun SGML-muotoisen version tuottamisen yhteydessä on helppo havaita, että lukuisilla erilaisilla tekstitunnisteilla varustettu SGML-muotoinen tekstikokonaisuus ei ole vielä julkaisuvalmis. Julkaisumallin seuraavat käsittelyvaiheet sisältävätkin tuotetun SGML-tekstin muuntamisen paperi- ja verkkojulkaisumuotoon. Sen lisäksi, että julkaisusta muodostetaan WWW:n välityksellä julkaistava HTML-versio, se voidaan muuntaa myös paperille tulostettavaan muotoon. Tässä julkaisumallissa paperitulostaminen tapahtuu LaTeX-version avulla, koska käytetty tekstinkäsittelyohjelma ei sisällä tekstin muokkaamiseen tai tulostamiseen tarvittavia ominaisuuksia.

    SGML-tekstin muuntamisen perusperiaatteena on, että tekstin sisältämät SGML-tunnisteet korvataan muunnoksen kohteena olevan tekstinmuotoilukielen (tässä tapauksessa LaTeX ja HTML) komennoilla. Helpoin tapa SGML-tunnisteiden erottelemiseen muunnettavasta dokumentista on hyödyntää SGML-jäsentäjän tuottamaa ESIS-muotoa, johon yleensä kaikki saatavilla olevat valmiit muunnosohjelmatkin perustuvat. Tekstin muuntaminen LaTeX- ja HTML-muotoihin tehtiin SGMLS.pm-luokkakirjaston sisältämällä sgmlspl-muunnosohjelmalla (ks. luku 5.5.1 Sgmlspl-muunnosohjelma SGMLS ja NSGMLS-jäsentäjien tulostuksien käsittelyyn). Lisäksi muunnoksen tuloksena muodostunut LaTeX-tiedosto muunnettiin edelleen HTML-muotoon LaTeX2HTML-ohjelman avulla (ks. luku 5.5.5), jolloin julkaistavasta tekstistä saatiin kaksi erilaista verkkojulkaisuversiota. Näitä versioita on myös vertailtu myöhemmin kappaleessa 6.6 'Julkaisumallin käytettävyys'.

    Muunnosprosessin monimutkaisuuteen tai helppouteen vaikutti oleellisimmin dokumentin rakennemäärittelynä käytetty DTD. Eräät muunnosohjelmat perustuivat tiettyyn DTD-määrittelyyn, jolloin muunnoksen tekeminen sujui aika vaivattomasti. Toisaalta taas ne muunnosohjelmat, jotka olivat DTD:n rakenteesta riippumattomia ja soveltuivat siten kaikenlaisten SGML-dokumenttien muunnokseen, sisälsivät vain valmiudet käsitellä SGML-jäsentäjien tuottamaa tulostusta, jolloin elementtikohtaisten muunnostoimenpiteiden määritteleminen jäi käyttäjän tehtäväksi. Tiettyihin DTD-määrittelyihin perustuvat muunnosohjelmat vaativat vähemmän toimenpiteitä muunnoksen toteuttamiseksi, mutta niiden ongelmana olivat usein epäsopivat DTD:t, joiden käyttöönotto pitäisi huomioida jo tekstin SGML-rakennetta suunniteltaessa. Tässä julkaisumallissa käytettävä sgmlspl-ohjelma ei aseta rajoituksia käytettävälle DTD:lle. Sen toiminta perustuukin käyttäjän tekemään määrittelytiedostoon, jonka mukaisesti SGML-teksti muunnetaan haluttuun muotoon käsittelemällä jokainen tekstitunniste erikseen. Liitteessä 1 olevassa taulukossa on esitelty ne docbook.dtd:n elementit attribuutteineen, joita on käytetty tässä tutkielmatekstissä ja julkaisumallissa. Taulukossa on esitelty myös tekstin ulkoasuun liittyviä seikkoja, jotka tietylle tunnisteelle tehdään muunnoksen yhteydessä. Ulkoasun muotoilusta on pyritty selvittämään yleisluontoisella tasolla ne LaTeX- ja/tai HTML-komennot, joilla teksti on muotoiltu. Koska tätä tutkielmatekstiä on käytetty julkaisumallin rakentamisessa, kaikki tekstin muotoiluseikat ovat parhaiten nähtävissä suoraan tästä raportista.

    Tekstin muuntaminen HTML-muotoon onnistui huomattavasti vaivattomammin kuin LaTeX-muotoon. Tämä johtui enimmäkseen HTML-merkkauskielen tarjoamista 'löysemmistä' julkaisujen ulkoasun muokkaamisen mahdollisuuksista. Toisaalta WWW julkaisumedianakaan ei aseta tarkkoja rakenne- tai ulkoasuvaatimuksia sen välityksellä julkaistaville teksteille. Yleisten ulkoasusääntöjen mukaisen pro gradu -tutkielman tuottaminen LaTeX-muodossa vaati todellista pikkuseikkoihin puuttumista, jolloin aina ei edes millimetrin tarkat asetusmäärittelytkään tuntuneet tuottavan toivottua lopputulosta. Muunnoksien testauksen aikana ilmeni tarvetta pro gradu -tutkielma-asetteluiden mukaiselle LaTeX-tyylitiedostolle, jota muokattiinkin keskeisimpien asetteluiden osalta (vakio-otsikoiden suomentaminen ja etusivun muotoilu). Suurin osa tekstin asetteluista jäi kuitenkin muunnosohjelman avulla määriteltäväksi.

    6.4.1 SGML-tekstin muuntaminen LaTeX-muotoon sgmlspl-ohjelmalla

    SGML-dokumentin muuntamiseksi LaTeX-muotoon testattiin sgmlspl-, CoST-, ja QWERTZ-ohjelmia, joista Qwertz poikkesi muista sekä DTD-vaatimuksiltaan että valmiusasteeltaan. QWERTZin toiminta perustui qwertz.dtd:hen, jolloin muunnosprosessi tapahtui automaattisesti. Muunnostarpeita ilmeni kuitenkin LaTeX-muotoisen lopputuloksen suhteen. Sgmlspl ja CoST tarjosivat paremmat mahdollisuudet lopputuloksena syntyneen LaTeX-muodon määrittelyyn muunnosprosessin automaattisuuden kustannuksella, koska ne sopivat mille tahansa DTD-määrittelylle ja edellyttävät muunnosohjelman määrittelemistä käyttäjältään. Vaikka sgmlspl ja CoST muistuttivat toisiaan toimintaperiaatteiltaan, ne perustuivat kuitenkin eri ohjelmointikielien avulla tehtyihin määrittelyihin. CoSTissa määrittelykielenä käytettiin Tcl-kieltä, johon liittyvää käyttöohjeistusta ei juurikaan ollut saatavilla. Sgmlspl:ssä käytettiin ohjelmointikielenä Perliä, johon tutustuminen onnistui huomattavasti helpommin saatavilla olevien manuaalien ja kieleen perehtyneiden UNIX-asiantuntijoiden ansiosta. Tämä seikka vaikutti oleellisesti myös siihen, että käytettäväksi muunnosohjelmaksi valittiin sgmlspl.

    Sgmlspl-muunnosohjelman käyttöönottaminen aloitettiin määrittelemällä tiedosto (specification file), jonka avulla tekstin sisältämät SGML-merkkaukset muunnettiin LaTeXin ymmärtämään muotoon. Määrittelytiedoston tekemistä helpotti ohjelmistopaketin mukana tulleet esimerkkiohjelmat sekä apuohjelma, joka muodostaa määrittelytiedostorungon SGML-tekstissä käytetyistä elementtimäärittelyistä. Määrittelytiedosto (liite 4) sisältää toimenpiteet vain niille SGML-elementeille, joita käytimme testiaineistossamme (ks. liite 1). Koska tavoitteenamme oli muodostaa yleisten tutkielman ulkoasuvaatimusten mukainen LaTeX-tiedosto, tekstin ulkoasun muokkaaminen muodostuikin kohtalaisen työlääksi tehtäväksi. LaTeX käyttää erilaisia tyylitiedostoja, joiden perusteella se muokkaa tekstin ulkoasun, mutta mikään näistä vaihtoehdoista (kirja.sty, kirje.sty, article.sty) ei vastannut meidän tarpeitamme. Käytettäväksi tyylitiedostoksi valittiin artikkelityylinen article.sty, joka muistutti eniten tutkielman rakennetta. Article.sty -tyylitiedostosta ei löytynyt suomenkielistä versiota, joten muodostimme siitä Artikkeli.sty -version, johon suomensimme alkuperäisestä tiedostosta vakio-otsikot (esimerkiksi Contents, References).

    6.4.2 SGML-tekstin muuntaminen HTML-muotoon sgmlspl-ohjelmalla

    Vaikka HTML-tekstirakenne on SGML:n sovellus, SGML:n muuntaminen HTML-muotoon vaatii samantyyliset toimenpiteet kuin LaTeX-muunnoksessa. Jokainen SGML-tekstielementti täytyy käsitellä erikseen, ellei käytössä ole standardoitu DTD, jota muunnosohjelma käyttää. Oleellisin ero LaTeX- ja HTML-muunnosten välillä on, että HTML-muunnoksessa teksti jaetaa erillisiin tiedostoihin. Koska HTML-muotoa käytetään tietoverkon välityksellä tapahtuvaan julkaisemiseen, siinä voidaan myös hyödyntää erilaisia tekstin linkitysominaisuuksia. Linkkien muodostamiseen tarvittavat tunnisteet, kuten muukin tekstirakenteiden merkkaaminen, on kuitenkin huomioitava jo SGML-muotoisessa tekstissä.

    Tekstin muuntaminen HTML-muotoon sgmlspl-ohjelmalla aloitettiin, kuten LaTeX-muunnoskin, tekemällä SGML-tekstin sisältämien elementtien mukainen määrittelytiedosto (liite 4). Edelleenkin testiä varten tehty määrittelytiedosto sisältää vain ne SGML-elementit, joita käytimme testiaineistossamme. HTML-muunnosohjelma poikkesi jonkin verran toiminnaltaan vastaavasta LaTeX-muunnoksesta, koska muunnoksen aikana SGML-teksti jaettiin erillisiin HTML-dokumentteihin, jotka liitettiin toisiinsa viittauksien avulla. Jaettavien tekstiosien koko määritellään muunnosohjelman avulla siten, että tietty SGML-tunniste aloittaa aina uuden HTML-dokumentin. Tässä julkaisumallissa yhden tekstiosan kooksi määriteltiin yksi tekstiluku, joka tallennetaan aina omaksi HTML-tiedostokseen. Tällöin siis docbook.dtd:n mukaisesti uuden tiedoston aloittavana tunnisteena on aina SECT1, jonka attribuutiksi on määritelty siitä muodostettavan HTML-tiedoston nimeksi käytettävä ID-arvo. Esimerkiksi tekstin 1. luku on määritelty SGML:n avulla <SECT1 ID="luku1">, joten SGML-jäsentäjän tulostaessa kyseisen tunnisteen muunnosohjelma luo uuden tiedoston nimellä 'luku1.html'. Tähän tiedostoon tulostuu koko 1. luvun sisältö HTML-muotoon muunnettuna. Ellei SGML-elementille ole määritelty ID-arvoa, muunnosohjelma nimeää dokumenttitiedostot oletuksena nodenn.html -nimisiksi, joissa nn tarkoittaa juoksevaa numerointia ykkösestä alkaen.

    Jotta muodostuneet HTML-tiedostot voidaan käsitellä yhtenäisenä tekstinä, ne on yhdistettävä toisiinsa linkkien avulla. Muunnosohjelma muodostaa tätä tarkoitusta varten refs.pl -tiedoston, joka sisältää tarvittavat viittaukset eri dokumenttitiedostojen välillä. Tiedosto muodostetaan muunnoksen aikana, joten oikeellisten viittauksien aikaansaamiseksi muunnos tulee ajaa ainakin kahdesti läpi, jotta kaikki dokumentin osat sisältyvät viittaustiedostoon. Refs.pl -tiedosto sisältää viittaukset jokaisesta yhden tekstiluvun sisältävästä tiedostosta sitä edeltävään ja seuraavaan tiedostoon. Lisäksi tiedostoon on määritelty luvun sisältämät alaluvut, joita käytetään tiedoston alkuun tehtävän sisällysluettelon määrittelyssä. Seuraavassa on esimerkkinä osa refs.pl -tiedoston sisällöstä.

    $refs{'next'}->{'toc.html'} = 'luku1.html';
    $refs{'up'}->{'luku1.html'} = 'node1.html';
    $refs{'title'}->{'luku1'} = '1  JOHDANTO';
    $refs{'previous'}->{'luku2.html'} = 'luku1.html';
    $refs{'next'}->{'luku1.html'} = 'luku2.html';
    $refs{'up'}->{'luku2.html'} = 'node1.html';
    $refs{'title'}->{'luku2'} = '2  JULKAISEMINEN ELEKTRONISTEN DOKUMENTTIEN HALLINNAN 
    OSANA';
    $refs{'subtitle1'}->{'luku2'} = '2.1  Elektronisten dokumenttien hallinta';
    $refs{'subtitle2'}->{'luku2'} = '2.2 Elektronisten dokumenttien hallinnan sovellus-
    alueet';
        

    $refs-muuttujan ensimmäinen parametri osoittaa viittauksen tyypin. 'Next' viittaa seuraavaan, 'previous' edelliseen ja 'up' koko tekstin ensimmäiseen tekstilukuun. Parametrin arvoja 'title' ja 'subtitle' käytetään tekstiluvun otsikoiden tallentamiseen, ja niitä tarvitaan myös sisällysluettelon muodostamisessa. Seuraavissa kaarisuluissa on sen tekstiosan nimi, jota kyseiset viittaukset koskevat. Yhtäsuuruusmerkin oikealla puolella on viittauksen kohteen nimi, joka on joko tekstiluvun sisältämän HTML-tiedoston nimi tai viitattavan tekstikokonaisuuden otsikko. Edellä esitetyn esimerkin perusteella voidaan siis määritellä viittaukset esimerkiksi luvusta yksi, jolloin sitä edeltävä luku (johdanto) sisältyy tiedostoon node1.html ja seuraava (luku 2) tiedostoon luku2.html.

    Näiden tekstin sisäisten linkkien lisäksi HTML-teksti sisältää myös ulkoisia linkkejä muihin dokumentteihin. Nämä linkit on määritelty URL-osoitteiden avulla, jotka kirjoitetaan SGML-dokumenttiin ULINK-tunnisteen URL-attribuuttiarvoksi. Esimerkiksi viittaukset testattujen ohjelmistojen tietoverkon välityksellä saataviin dokumentaatioihin voidaan määritellä SGML-muodossa

    <ULINK URL='http://www.tex.ac.uk/ctan/latex'>LaTeX</ULINK>

    Tästä esimerkistä muodostuu HTML-dokumenttiin suora linkki URL-attribuutin mukaiseen osoitteeseen HREF-määrittelyllä seuraavasti:

    <A HREF="http://www.tex.ac.uk/ctan/latex">LaTeX</A>

    Muunnosohjelmalla HTML-dokumentiksi muunnettu tutkielmateksti löytyy URL-osoitteesta http://www.cs.jyu.fi/~gelpo/sgmlspl/node1.html.

    6.4.3 LaTeX-tekstin muuntaminen HTML-muotoon LaTeX2HTML-ohjelmalla

    LaTeX-muotoisen tekstin muuttaminen HTML-muotoon on helpompi toteuttaa ohjelmallisesti kuin SGML-muotoisen tekstin muuttaminen, koska LaTeXin rakenne on kiinteästi määritelty päinvastoin kuin SGML-tekstin rakenne. LaTeX-muotoisen tekstin muunnosohjelmia löytyi julkisohjelmina runsaasti, johtuen ilmeisesti juuri kiinteästä merkkaustavasta. Tutkimme pitkälle kehitettyä LaTeX2HTML-muunnosohjelmaa (ks. luku 5.5.5), jonka soveltuvuudesta käsittelymalliin on kerrottu seuraavassa tarkemmin. Tuloksissa kannattaa huomioida se, että pidimme koko ajan yllä sekä WWW- että paperiversioita. Tämä rajoitti jonkin verran sekä LaTeXin että LaTeX2HTML-ohjelman mahdollisuuksia, sillä halusimme pitää LaTeX-muotoisen tekstin merkkien lukumäärän mahdollisimman pienenä. Siten emme käyttäneet mahdollisuutta, jossa HTML-versiota ja paperiversiota varten tehtäisiin omat määrittelyt LaTeX-tekstiin.

    LaTeX2HTML-muunnosohjelman testiaineistona käytettiin sgmlspl-ohjelmalla tuotettua tekstiä. Muunnosohjelma vaati html.sty-tyylitiedoston käyttöönottoa LaTeX-tekstissä, jolloin esimerkiksi kuvien käsittelyyn liittyvät määritykset pystyttiin tekemään ohjelmalle sopiviksi. Kuvien käsittelyyn LaTeX tarjoaa useita eri määrittelymahdollisuuksia, joita LaTeX2HTML ei pysty kuitenkaan kaikkia hyödyntämään. Käyttäjän tehtäväksi jää kokeilla, mikä määritys sopii parhaiten kulloinkin kyseessä olevaan kuvaan ja mitä määrityksiä muunnosohjelma tukee. Tässä projektissa käytimme kaikkien kuvien määrittelyyn psfig-määrittelyä, koska sillä saimme kuvien koon HTML-muotoiseen tekstiin sopivaksi. Kuvat olivat selkeitä kaavioita, jotka eivät vaatineet suurta erottelukykyä eivätkä ne olleet värillisiä. Ongelmana kuvien muunnoksessa oli LaTeXin ja LaTeX2HTML -ohjelmien ymmärtämien merkkilajien lukumäärän rajallisuus. Kuvissa olevat tekstit oli vaikea saada näkymään selkeänä WWW:ssä.

    Muunnoksen lopputuloksena syntyi useita HTML-tiedostoja, joiden linkityksestä LaTeX2HTML-ohjelma huolehti automaattisesti kuten myös kuvien ja muiden ulkoisten elementtien linkityksistä. Koska muunnosohjelma nimeää HTML-tiedostot saman nimisiksi erottaen ne vain juoksevalla numerolla, tiettyyn kohtaan tekstissä on vaikea viitata. Törmäsimme tähän ongelmaan, kun halusimme tehdä sisäisen linkin kappaleesta toiseen.

    HTML-dokumentin jakaminen useisiin osiin oli koko projektimme aikana asia, josta oli niin monta mielipidettä kuin oli lukijaakin: toiset pitivät yhtenäistä tekstiä parhaimpana lukea, toiset taas selasivat mielellään pieniä tekstin osia ja jotkut halusivat lukea esimerkiksi yhden luvun yhtenä kokonaisuutena. LaTeX2HTML tarjoaa tähän ongelmaan lähes jokaiselle ratkaisun, sillä ohjelmalle annettavalla optioilla pystytään määräämään kuinka moneen osaan teksti hajotetaan. Tässä täytyy huomioida, että mitä suuremmat yhtenäiset tekstiosat ovat, sitä vähemmän dokumentti sisältää hypertekstiominaisuuksia ja silloin ei pystytä hyödyntämään ohjelman tarjoamia monipuolisia mahdollisuuksia.

    Kaiken kaikkiaan LaTeX2HTML-ohjelma tuotti lopputuloksena ulkoasultaan ja käytettävyydeltään selkeän HTML-dokumentin, joka sisältää helpon käyttöliittymän tekstissä liikkumiseen. Lisäksi useilla eri optioilla pystytään muokkaamaan erilaisia tekstejä. Testiaineistona muodostunut HTML-dokumentti löytyy WWW:stä URL-osoitteesta http://www.cs.jyu.fi/~gelpo/latex2html/gradu.html, josta voi parhaiten testata ohjelman tuottamaa tekstirakennetta ja sen käytettävyyttä.

    6.5 Kuvien ja taulukoiden käsittely

    Alkuperäiseen testiaineistoomme lisäsimme testauksen myöhemmässä vaiheessa myös kuvia ja taulukoita. Kuvat tallensimme PC:llä ps-muotoon, josta ne siirrettiin UNIXiin ja merkattiin DTD:n mukaisesti testiaineiston joukkoon. LaTeX-tulostukseen tarvittavan ps-muotoisen kuvan lisäksi käytettävistä kuvista tarvitaan myös gif-muotoinen versio HTML-tekstiä varten.

    Ps-muotoisten kuvien muuntaminen gif-muotoon voidaan tehdä pstogif-ohjelman avulla. LaTeX2HTML-muunnosohjelma tekee tämän muunnoksen automaattisesti dvips-ohjelman avulla, mutta sgmlspl-ohjelmalla tehdyssä HTML-muunnosohjelmassa kuvamuunnos on toteutettu siten, että ellei hakemistosta löydy ps-kuvatiedostoa vastaavaa gif-versiota muunnosohjelma kutsuu käyttöjärjestelmäkomentoa, jolla muunnos toteutetaan pstogif-ohjelmalla. Ohjelmaan on määritelty vakioksi hakemistopolku tämän muunnosohjelman käynnistämistä varten. Ps-muotoinen kuva saadaan muunnettua gif-muotoon pstogif-ohjelmalla antamalla pstogif-komennolle parametrina kuvan nimi ilman ps-liitettä.

    Tekstin sisältämät taulukot tehtiin ensin PC:llä Microsoft Word-tekstinkäsittelyohjelmalla, jonka jälkeen ne tallennettiin muun tekstin ohessa ASCII-muotoon ja siirrettiin UNIXiin. ASCII-muotoinen SGML-teksti ei kuitenkaan hyödynnä taulukkoasetuksia ja -muotoiluja, kuten ei muitakaan tekstimuotoiluja. Taulukko ja sen sisältämät rivit merkattiin käytettävän DTD:n mukaisesti SGML-muotoon. LaTeX-muotoiluohjelma tarjoaa erilaisia tapoja ja ympäristöjä taulukoiden käsittelyyn, eikä taulukoiden käsittely aiheuttanut ongelmia LaTeX-muunnoksen yhteydessä. Tällä hetkellä käytössä oleva HTML v.2 ei käyttöoppaiden mukaan sisällä taulukko-ominaisuuksia. Tähän on odotettavissa kuitenkin parannusta HTML v.3:n ansiosta, joka sisältänee myös mm. matemaattisten kaavojen käsittelyominaisuudet.

    Taulukon SGML-merkkauksen yhteydessä on määriteltävä taulukkoelementin ID:ksi taulukon sarakkeiden lukumäärä, tasaussuunta (left, right, center) sekä viivoitukset (tulostetaanko sarakkeiden ja rivien välille viivoja). Sgmlspl-ohjelmalla tehty LaTeX-muunnos ottaa nämä parametrit huomioon, paitsi tällä hetkellä sarakkeiden välille tulostuu aina oletuksena viivoitukset. Testauksen tuloksena syntyneistä taulukoista on esimerkki tämän tutkielman LaTeX- ja HTML-versioissa liitteessä 6, johon on koottu ne ohjelmat, joihin tämän tutkimusprojektin yhteydessä on tutustuttu.

    6.6 Julkaisumallin käytettävyys

    Tässä tutkielmassa esitelty julkaisumalli perustuu siihen, että julkaisija voi muodostaa dokumentistaan tämän tutkielmatekstin muotoilua vastaavan julkaisun muuntamalla julkaistavan tekstinsä SGML-muotoon. Tämän jälkeen julkaistava teksti voidaan vaivattomasti muuntaa paperi- ja verkkojulkaisuksi muunnosohjelmien avulla. Kirjoittajan ei siis tarvitse huolehtia tekstin ulkoasun muotoilusta lainkaan.

    UNIX-laiteympäristöön tarkoitettuihin julkisohjelmiin perustuvan julkaisumallin muodostamisessa jouduttiin tinkimään useistakin ominaisuuksista, jotka ovat edellytyksenä helppokäyttöiselle ja käyttäjäystävälliselle mallille. Toisaalta rakenteisten tekstien hallintaan tarkoitettujen ohjelmistojen tarjonta ei ole vielä tällä hetkellä runsaimmillaan, koska niiden käyttäjäkunta on suhteellisen suppea.

    Rakenteisiin teksteihin perustuvan julkaisumallin käyttöönottaminen ei tapahdu hetkessä. Jo rakenteisiin teksteihin siirtyminen on käytännössä huolellisen valmistelun ja määrittelyn, tekstirakenteiden analysoinnin, käytäntöjen muuttamisen sekä uusien työvälineiden käyttöönoton tulos, johon ei mikään organisaatio halua ryhtyä hetken mielijohteesta. Sen lisäksi, että dokumenttien tuottamisessa siirrytään aikaisemmin käytössä olleesta, yleensä aika vapaamuotoisestakin kirjoitustavasta tarkoin määrättyyn tekstirakenteiden merkkaamiseen perustuvaan tuottamistapaan, lukuisten teknisten yksityiskohtien (käytettävät ohjelmat, tekstin rakennemäärittelyt ja muut organisointitavat) ratkaisemisen lisäksi joudutaan muuttamaan erilaisia toimintatapoja ja tottumuksia, mikä vaatii huomattavasti kauemmin aikaa toteutuakseen kuin teknisten seikkojen ratkaiseminen.

    Toisaalta myös julkaisumenetelmän siirtäminen elektroniseen muotoon on suuri muutos perinteiseen paperijulkaisujen tuottamiseen perustuvaan menetelmään verrattuna. Julkaisujen kirjoittajien tuottamia elektroniseen muotoon tallennettuja tekstejä on aika vaivatonta tallentaa keskitetysti jollekin UNIX-palvelimelle, josta lukijat ympäri maailmaa voivat niitä hankkia. Tällöin on vain ratkaistava se tapa, jolla uusista julkaisuista tiedotetaan mahdollisimman laaja-alaisesti. Internet-verkon välityksellä tapahtuva julkaiseminen vaatiikin jo suurempia muutoksia julkaisuteksteihin. Tekstien muuntaminen tietoverkossa käytettävien selaajien ymmärtämään muotoon vaatii ajan lisäksi myös noudatettavan julkaisupolitiikan, jotta verkkojulkaiseminen toimisi ongelmitta tekstien hallinnan ja lukijakunnan tavoittamisen suhteen.

    Seuraavassa on käsitelty tässä tutkielmassa kehitetyn julkaisumallin käytettävyyttä mallin eri vaiheiden ja niiden tuloksien perusteella. Mallin käytettävyyttä ei ole testattu käytännössä, koska sopivilta testihenkilöiltä olisi edellytetty rakenteisten tekstien tarkempaa tuntemusta, jotta tekstin merkkaaminen SGML-muotoon olisi ollut mahdollista. Tässä esitetyt käytettävyyteen liittyvät arviot ja vertailut perustuvat tutkielman tekijöiden näkemyksiin. Lisäksi julkaisumallin avulla tuotettujen HTML-versioiden käytettävyyttä tiedusteltiin myös tietojenkäsittelytieteiden laitoksen henkilökunnalle ja opiskelijoille tarkoitetun kyselyn avulla.

    6.6.1 Julkaisumallin käyttöönotto ja ylläpito

    Julkaisumallin käyttöönottovaiheessa voidaan käyttää julkaisutekstinä joko olemassa olevaa tai käyttöönoton yhteydessä kirjoitettavaa tekstiä. Julkaistavan tekstin lisäksi mallin käyttämisen edellytyksenä on, että sen käyttäjät hallitsevat rakenteisten tekstien perustiedot ja varsinkin tässä mallissa käytettävän dokumenttityyppimäärittelyn rakenteen (docbook.dtd) ja tekstirakenteiden merkkaukseen käytettävän ohjelman. Tässä tutkielmassa on esitelty liitteessä 1 ne docbook.dtd:n tekstielementit, joita on käytetty tutkielmatekstin rakenteessa ja myöhemmin muunnosohjelmissa. Tekstin perusrakenteiden (luku, kappale, otsikko) lisäksi tässä kuvattu julkaisumalli huomioi myös erilaiset tekstiviittaukset, luettelot, alaviittaukset, taulukot ja kuvat.

    Dokumentin rakenteen määritteleväksi DTD:ksi valittiin docbook.dtd, koska se sisältää monipuoliset mahdollisuudet erilaisten tekstirakenteiden merkkaukseen. Se on myös havaittu käyttökelpoiseksi muuallakin akateemisessa ympäristössä. Vaikka tietyn dokumenttityyppimäärittelyn valitseminen ja käyttöönottaminen vaatiikin huolellisen merkattavien tekstien rakenteen ja DTD:n tarjoamien mahdollisuuksien kartoittamisen, DTD:n rakennetta on mahdollista päivittää myöhemminkin. Mahdollisimman laiteympäristöriippumattoman ja siirrettävän dokumenttikannan muodostamiseksi olisi kuitenkin toivottavinta, että dokumenttien rakenteen määrittämiseen tarvittavat DTD:t pysyisivät mahdollisimman yhtenäisinä ja noudattelisivat vain yleisten versiopäivityksien mukanaan tuomia muutoksia.

    Julkaistavan tekstin muuntaminen rakenteiseen muotoon edellyttää dokumenttityyppimäärittelyn rakenteen tuntemista. DTD:n rakenteeseen tutustuminen kannattaakin aloittaa yksinkertaisimpien dokumentin osien määrittelyllä, joita myöhemmin tekstin valmistuttua tarkennetaan tarvittavin osin. Jotta julkaisumallin myöhemmät vaiheet voitaisiin ottaa käyttöön ongelmitta, tekstin rakenteen merkkaaminen on tärkeää tehdä tarkoin niiden ohjeiden mukaan, joita eri tekstitunnisteiden käytölle on määritelty. Sen lisäksi, että tekstin eri rakenteet merkitään tunnistein, niihin on usein määriteltävä myös erilaisia attribuuttiarvoja, jotka ovat oleellisia myöhempien julkaisumallin vaiheiden kannalta.

    Edellä kuvattujen käyttöönottovaiheiden oletuksena on ollut, että julkaisumallin käyttäjä on sama henkilö kuin julkaisujen kirjoittaja. Toisaalta mallin joustava soveltaminen käytäntöön voi edellyttää erityisen julkaisumallin rakenteeseen, käyttöön ja ylläpitoon perehtyneen henkilön nimeämistä. Käsitteenä rakenteiset tekstit ovat tuntemattomia suurimmalle osalle julkaisijoista. Jos heidän vielä edellytetään muuntavan omat julkaisutekstinsä SGML-muotoon, saattaa kyseessä olla pitkällinen muutosprosessi, jonka lopputuloksien onnistuminen voi olla epävarmaa. Jotta tällainen sekä perinteisiä julkaisutapoja että dokumenttien tuottamistapoja radikaalisti muuttavan menettelytavan käyttöönottaminen olisi mahdollista, kaikki tekstien kirjoittajat tulisi kouluttaa ja ennen kaikkea motivoida uuden toimintatavan omaksumiseksi.

    Joustavin tapa dokumenttien merkkaamiseksi rakenteiseen muotoon olisi, että niiden tuottajat huolehtisivat tekstien rakenteen oikeellisuudesta. Käytännössä kuitenkin tähän toimintatapaan siirtyminen ei onnistu hetkessä, joten ainakin käynnistysvaiheessa olisi toivottavaa, että rakenteen merkkaamiseen olisi mahdollisuus nimetä tukihenkilö. Julkaistavien tekstien rakenteiden yhtenäisyyden ansiosta niiden rakenteen merkkaaminen on mahdollista toteuttaa keskitetysti yhden henkilön toimesta. Vaikka merkkaaminen edellyttääkin useiden eri henkilöiden tuottamiin teksteihin perehtymistä, kyseessä on kuitenkin tekstirakenteen merkkaaminen, jolloin tekstin asiasisältöön ei ole tarpeen puuttua. Tilannetta voisi verrata tuotantolinjan pakkausvaiheeseen, johon osallistuvien ei tarvitse olla perillä itse tuotantoprosessin eri vaiheiden sisällöstä. Tilanne on kuitenkin toinen, jos pakattava tuote ei ole mahdollista suhteuttaa tarjolla olevaan pakkausmateriaaliin, eli jos teksti sisältää rakenteita, joita ei ole määritelty käytettävässä DTD:ssä.

    Tässä tutkimuksessa kartoitettujen tietojenkäsittelytieteiden laitoksen julkaisutuotantoon kuuluvien tekstien rakenteista kävi ilmi, että eri julkaisusarjojenkin julkaisut sisältävät verrattain yhtenäisiä tekstirakenteita ja -osia. Tämän perusteella voidaankin olettaa, että eri julkaisusarjoille voidaan käyttää samaa dokumenttityyppimäärittelyä, mikä on myös dokumenttien hallinnan kannalta ihanteellisin vaihtoehto. Tässä tutkimuksessa käytetyn tutkielmatekstin puitteissa ei ilmennyt mitään puuttuvia tai sisällöltään vajaita tekstirakennemäärittelyitä, joita ei olisi docbook.dtd:ssä huomioitu. Mikäli näin kävisi, puuttuvien tekstirakenteiden määrittelemiseen kannattaisi etsiä mahdollisia muita vaihtoehtoisia tapoja ja samalla selvittää tulevien docbook.dtd:n versioiden sisältämiä tekstirakennemäärittelyiden päivityksiä.

    Oleellisinta uusien docbook.dtd:n sisältämien tekstitunnisteiden käyttöönoton yhteydessä on, että niille on määriteltävä myös käsittelyrutiinit muunnosohjelmiin, jotta ne huomioitaisiin myös eri julkaisuversioita muodostettaessa. Tästä on kerrottu tarkemmin seuraavissa kappaleissa.

    6.6.2 Uusien docbook.dtd:n tekstitunnisteiden käyttöönotto

    Tarvetta uusien tekstitunnisteiden käyttöönotolle saattaa erityisesti esiintyä silloin, kun julkaisuun lisätään sellainen tekstirakenne, jota ei aikaisemmin ole määritelty, tai mikään olemassa olevista tekstitunnisteiden muunnoksen yhteydessä tehtävistä ulkoasumuotoiluista ei sovellu kyseiseen tekstirakenteeseen. Tämän tutkielmatekstin rakennetta merkattaessa törmäsimme usein docbook.dtd:n tiukkoihin tekstin rakenteelle asettamiin vaatimuksiin, kun lisäsimme uusia tekstirakenteita. Esimerkiksi kuvamäärittelyt (figure) eivät saaneet sisältyä tekstikappaleisiin (para) ja liitteiden määrittelyssä jouduttiin tekemään joitakin turhia tyhjiä tekstitunnistemäärittelyitä, jotta tarvittavat liitteet saatiin määriteltyä. Tällaisissa tapauksissa olisimme toivoneet huomattavasti enemmän joustavuutta käytettävän DTD:n rakenteelta, koska varsinkin tyhjien tekstitunnisteiden määrittely tuntui turhalta työltä.

    Vaikka docbook.dtd sisältääkin monipuolisemmat mahdollisuudet tekstirakenteiden merkkaamiseen kuin mitä tämän tutkielmatekstin rakenteen merkkaukseen on käytetty, uusien tekstitunnisteiden käyttöönottaminen vaatii lisäyksiä myös niihin muunnosohjelmiin, joilla varsinaiset julkaisut muodostetaan. Liitteessä 4 esitetyt muunnosohjelmakoodit sisältävät käsittelyrutiinit vain niille docbook.dtd:n tekstitunnisteille, jotka on esitelty liitteessä 1. Tämä on erityisen tärkeää huomioida silloin, kun tekstin rakenteen merkkauksessa otetaan käyttöön uusia tekstitunnisteita. Muunnosohjelmiin tehtävistä lisäyksistä on kerrottu lisää seuraavassa kappaleessa.

    Tekstin kirjoitusvaiheessa GNU Emacs ja PSGML huolehtivat siitä, että käyttäjän valittavana on kaikki sellaiset tekstielementit, jotka sisältyvät docbook.dtd:hen. Docbook.dtd sisältää lukuisia muitakin tekstin rakennemäärittelyyn käytettäviä tunnisteita, kuin mitä tämän tutkielmatekstin puitteissa on käytetty. Uuden tunnisteen käyttöönoton yhteydessä tulee myös miettiä, onko tunnisteelle tarpeen määritellä tarkenteita (attribuutteja, ID-arvoja), joilla tunnisteen avulla merkatun tekstikokonaisuuden käsittelyä voidaan ohjata tarkemmin. Tunnisteiden käytön yhtenäisyyden helpottamiseksi niiden käyttöönoton yhteydessä olisi hyödyllistä tehdä myös jonkinlainen dokumentti uuden tunnisteen käyttötarkoituksesta. Yksinkertaisena esimerkkinä on liitteessä 1 esitetty taulukko tässä tutkielmatekstissä käytetyistä tekstitunnisteista, jossa on esitelty tunnistekohtaisesti niiden käyttötarkoitus, määriteltävät attribuutit selvityksineen ja muunnoksessa tehtävät toimenpiteet. Tämän tyyppisen yhteenvedon ylläpitäminen palvelee myöhemmin myös muita rakenteiseen muotoon kyseisen DTD:n avulla tekstejä muuntavia kirjoittajia.

    Liitteessä 1 on kuvattu käytettyjen tekstitunnisteiden lisäksi myös niiden yhteydessä käytetyt attribuutit, joiden sisältöä käytetään apuna muunnosohjelmissa. Vaikka docbook.dtd asettaakin suhteellisen tiukat rajoitukset tekstin rakenteen määrittelemiseen, tekstitunnisteiden lisämääreinä käytettävien attribuuttien sisältö on käytännössä käyttäjän päätettävissä. Esimerkiksi tekstikappaleiden (sect1) määrittelyiden ID-arvona voidaan käyttää kappaleen yksilöivää merkkijonoa (esimerkiksi "luku123"), jota käytetään myöhemmin HTML-muunnoksessa muodostettavien HTML-tiedostojen niminä. Tästä johtuen voidaankin todeta, että yleisestä ja laajasti käytössä olevasta DTD-määrittelystä huolimatta jokainen sen avulla määritelty rakenteinen dokumentti on yksilö, jos rakenteiden määrittelyssä on käytetty apuna erilaisia attribuuttiarvoja. Dokumenttien siirrossa tämä tarkoittaa sitä, että dokumenttien lisäksi vastaanottajalle on selvitettävä attribuuttien käyttötarkoitus tai välitettävä myös niiden käsittelyyn tarvittavat muunnosohjelmat.

    6.6.3 Muunnosohjelmien päivittäminen

    Julkaisumallissa käytettävät muunnosohjelmat on toteutettu siten, että jokaiselle SGML-dokumentin tekstitunnisteelle on määritelty käsittelyrutiinit, jotka muunnoksessa toteutetaan. Tämä tarkoittaa sitä, että SGML-tekstitunnisteet korvataan kohdemuunnoksen mukaisella määrittelyllä. Koska muunnosohjelmat on määritelty käsin, ne eivät ota automaattisesti huomioon niitä tekstitunnisteita, jotka on lisätty julkaistavaan tekstiin muunnosohjelman tekemisen jälkeen. Muunnosohjelmat sisältävät ainoastaan virhekäsittelyrutiinin, joka tulostaa ilmoituksen kaikista tuntemattomista tekstitunnisteista ja määrittelemättömistä erikoismerkeistä.

    Käytännössä muunnosohjelmiin tehtävät muutokset ja päivitykset edellyttävät käyttäjältä sekä kohdemuunnoksen että muunnosohjelmien tuntemusta. Jos oletetaan, että julkaisumallissa ei olisi huomioitu taulukoiden käsittelyä ja julkaisutekstiin olisi lisätty tekstitunnisteet niiden määrittelemistä varten, muunnosohjelman päivittäjän tulisi hallita muunnosohjelmassa käytettävän ohjelmointikielen lisäksi myös kohdemuunnoksen taulukkomäärittelytavat. Muunnosohjelman päivityksen yhteydessä saattaa vielä tulla tarve attribuuttien lisäämiseen, jotta tarvittavat tekstiosat saadaan eriteltyä ja muotoiltua mahdollisimman tarkasti.

    6.6.4 Paperi- ja verkkojulkaisujen arviointia

    Kehitettävälle julkaisumallille asetettiin tavoitteeksi, että sen avulla voidaan muodostaa julkaistavasta tekstistä paperille ja WWW:n välityksellä julkaistava versio. Molempien julkaisuversioiden muodostaminen on toteutettu muunnosohjelmien avulla, koska SGML-tekstin käsittelyyn käytetyt ohjelmistot (GNU Emacs ja PSGML) eivät sisältäneet vaadittavien julkaisujen muodostamiseen tarvittavia välineitä.

    Paperijulkaisun muodostamisen apuna käytettiin LaTeX-tekstinmuokkausohjelmistoa, jota on käytetty yleisesti akateemisissa yhteisöissä monimutkaistenkin matemaattisten tekstien muotoiluun. LaTeXin sisältämät lukuisat tekstien muotoiluominaisuudet tuntuivat välillä liiankin monipuolisilta tämän tutkielmatekstin kaltaisten perustekstirakenteiden muotoiluun. Runsaat muotoilumahdollisuudet vaativat joskus käyttäjältä pitkää pinnaa millimetritarkkuuksien mittaamiseksi ja määrittelemiseksi. Julkaisumallin sisältämien valmiiden muunnosohjelmien avulla käyttäjä voi muodostaa julkaisustaan vaivattomasti LaTeX-muotoisen paperitulostusversion. Paperijulkaisun ulkoasua on mahdollista muotoilla suoraan myös LaTeX-ajon tuloksena muodostuneeseen tex-tyyppiseen tiedostoon. Tällaista tarvetta tämän tutkielmatekstin muokkauksessa ilmeni ainakin viimeisimmän version muokkauksessa, jolloin jouduttiin korjaamaan joitakin LaTeXin tekemiä virheellisiä tai puuttuvia tavutuksia. Paperijulkaisun muodostamisvaiheessa tiedoston sisältöä on mahdollista myös esikatsella ruudulta ennen lopullisen tulostusversion muodostamista. Vaikka paperijulkaisuun tarvittavan muunnosohjelman määrittely vaatikin lukuisien ulkoasumuotoiluseikkojen määrittelyä, valmiin muunnosohjelman käyttäminen, ja siten myös paperijulkaisuversion tuottaminen ei vaadi käyttäjältä kuin muutaman käyttöjärjestelmätason komennon suorittamista.

    WWW:n välityksellä julkaistavien verkkojulkaisujen ulkoasulle ei toisaalta ole määritelty tarkkoja sääntöjä, mutta toisaalta verkkojulkaisujen muotoiluun tarkoitettu HTML-merkkauskieli ei tarjoa kovinkaan monipuolisia mahdollisuuksia siihen. Verkkojulkaisujen ulkoasujen muotoilu tehdään tällä hetkellä pääasiallisesti kirjoittajien mielipideseikkojen mukaisesti. Tämän julkaisumallin avulla muodostettavan HTML-julkaisuversion voi vaihtoehtoisesti tehdä kahdella eri ohjelmalla. Sgmlspl-muunnosohjelma perustuu käyttäjän määrittelemiin SGML-tekstitunnisteiden muunnoksiin, jolloin HTML-julkaisuversion rakennetta voidaan muuttaa vain muunnosohjelman sisältämiä käsittelyrakenteita muuttamalla. Tämä on tyypillistä sellaisille SGML-muotoisten tekstien muunnosohjelmille, jotka eivät perustu mihinkään standardoituun dokumenttityyppimäärittelyyn. HTML-verkkojulkaisu voidaan muodostaa vaihtoehtoisesti myös julkaisumallin avulla muodostetusta paperijulkaisu- eli LaTeX-versiosta LaTeX2HTML-muunnosohjelmalla. LaTeX2HTML-muunnosohjelman perustuessa LaTeX-muotoisen tekstin muuntamiseen, sen avulla muodostettavaan HTML-julkaisun ulkoasuun voi vaikuttaa erilaisten parametrien avulla.

    HTML-julkaisuversioiden käytettävyydestä järjestimme tietojenkäsittelytieteen laitoksen henkilökunnalle ja opiskelijoille kyselyn, jonka tarkoituksena oli selvittää yleisiä mielipiteitä verkon välityksellä tapahtuvasta akateemisesta julkaisemisesta. Lisäksi kyselyssä pyydettiin vastaajia tutustumaan tästä tutkielmatekstistä kahdella eri ohjelmalla tehtyihin verkkojulkaisuversioihin ja arvioimaan niiden luettavuutta. Kysely toteutettiin sähköpostitse siten, että kysymykset lähetettiin tietojenkäsittelytieteiden laitoksen ja Dumppi ry -ainejärjestön sähköpostilistalle. Yhteensä kyselyn vastaanottajia oli noin 200 henkilöä, ja lopulliseksi vastausprosentiksi muodostui 8.5. Vastaajien lukumäärä oli 17, joista laitoksen henkilökuntaan kuului 6 ja opiskelijoita vastaajista oli 11. Kysymyslomake on liitteenä 7.

    Suurin osa vastanneista on joskus etsinyt tai selannut WWW:ssä olevia tietoja ja lähes yhtä monelle käsite HTML on tuttu. Sen sijaan kysyttäessä SGML-käsitteen tuttuudesta vastaukset jakautuivat lähes tasan kahteen osaan. Noin puolet vastaajista on joskus julkaissut jotain WWW:n välityksellä, mutta lähes kaikki olivat kiinnostuneita käyttämään tätä julkaisukanavaa omien tekstien, kuten pro gradujen, artikkeleiden, väitöskirjojen, esittelyiden, ilmoitusten ja mainosten, julkaisemiseen. Kun vastaajilta tiedusteltiin heidän halukkuuttaan julkaistavan tekstin merkkaamiseen rakenteiseen SGML- tai HTML-muotoon itse, reilusti yli puolet vastauksista suhtautui tähän myönteisesti. Runsas enemmistö toivoi myös laitoksen julkaisevan enemmän tiedotuksia ja oppaita WWW:n kautta. Akateemisissa yhteisöissä paljon keskustelua herättäneeseen WWW:n välityksellä julkaistavan tiedon luotettavuuteen suhtauduttiin neutraalisti.

    Kahdella eri ohjelmalla tuotettujen tutkielmatekstien verkkojulkaisuversioiden vertaileminen osoitti, että WWW:ssä julkaistavan tekstin luettavuuden ja käytettävyyden arviointi tapahtui lukijoiden henkilökohtaisten mieltymysten ja asenteiden mukaan. Niukka enemmistö oli vahvasti sitä mieltä, että tietoverkon välityksellä julkaistava ja ruudulta luettava teksti tulisi olla suurina kokonaisuuksina, jolloin sitä on miellyttävämpi lukea ja ajatus on helpompi pitää tekstissä. Toisaalta pienempiin osiin jaoteltua tekstiä on helpompi selata kokonaisuuden hahmottamiseksi, eivätkä pienet tekstikokonaisuudet ole rasittavia lukea. Puolet vastaajista oli sitä mieltä, että sopiva tekstiosion pituus on yksi kokonainen luku ja puolet pitivät yhtä kappaletta sopivan pituisena.

    Kyselyn mukaan ruudulta lukeminen koettiin yleensä epämiellyttäväksi erityisesti silloin, kun kyseessä olevat tekstit ovat pitkiä ja tekstin kirjasinkoko on pieni. Pitkien tekstien lukemisessa koettiin hankalimmaksi tekstin eri osioiden hahmottaminen yhtäaikaa. Vastaajia pyydettiin myös kommentoimaan verkkojulkaisujen sisältämien suorien tekstiviittausten määrää ja käytettävyyttä. Enemmistö vastaajista oli sitä mieltä, että linkkien määrää ja viittauksia muihin teksteihin voisi kasvattaa kummankin version osalta. Linkkejä tekstistä sisällysluetteloon ja kotisivulle pidettiin hyvänä ratkaisuna.

    6.6.5 Julkaisumalli opetuskäytössä

    Eräs tavoite julkaisumallin kehittämiselle oli, että sitä voidaan hyödyntää myös digitaalisen median maisterinkoulutusohjelmassa. Koska malli perustuu rakenteiseen muotoon muunnettavaan julkaisutekstiin, sen avulla on helppo havainnollistaa SGML:n soveltamista käytäntöön, sekä sen mukanaan tuomia etuja. Selkeimmin mallin avulla voidaan osoittaa SGML-muotoisten dokumenttien jatkokäytettävyys, eli miten yhtä, rakenteiseen muotoon tallennettua tekstiä ylläpitämällä voidaan muodostaa useita erilaisia julkaisuversioita. Tällöin siis mallin avulla voidaan myös osoittaa rakenteisten dokumenttien siirrettävyys ja soveltuvuus erilaisiin julkaisumuotovaatimuksiin.

    Julkaisumallin sisältämät muunnosohjelmat antavat myös hyvän esimerkin siitä, mikä on rakenteisten tekstien keskeisin idea. Kun SGML-muotoisessa tekstissä erilaiset tekstirakennekokonaisuudet on määritelty rakenteet yksilöivin tekstitunnistein, tekstirakenteiden muotoilu voidaan toteuttaa muunnosohjelmien avulla. Muunnosohjelmiin perehdyttäessä on myös tutustuttava SGML-jäsentäjän toimintaan, koska muunnokset perustuvat jäsentäjän tuottamaan SGML-tekstin jäsennykseen. Perusperiaatteena on, että muunnosohjelmat etsivät SGML-jäsentäjän tuottamasta jäsennyksestä tekstin sisältämiä SGML-tunnisteita ja käsittelevät niiden sisään määritellyt tekstit tapauskohtaisesti. Tekstikokonaisuuksien käsittelyyn vaikuttaa eniten tavoitteeksi asetetun muunnoksen rakenne ja mitä vaatimuksia se asettaa tekstin muotoilemiselle. Opetuksellisesti konkreettisin hyöty julkaisumalliin kuuluvien muunnosohjelmien perehtymisestä on varmasti se, että jokainen voi havaita SGML-muotoisen tekstin perusolemuksen: se ei itsessään ole valmista, luettavaan muotoon tulostettavaa tekstiä, vaan tapa dokumenttien 'syntaksin' määrittelemiseen.

    Opetuskäytössä on hyvä mahdollisuus tutustua tähän malliin muutenkin kuin sen käytön kannalta. Parhaiten rakenteisten tekstin käsittelyyn voitaisiin perehtyä SGML-muotoisen tekstin tuottamisen lisäksi myös julkaisumallia ylläpitämällä. Tämä olisi mahdollista siten, että käsiteltävään tekstiin lisättäisiin tekstitunniste, jota tässä mallissa ei ole huomioitu, ja käytäisiin mallin eri vaiheet läpi tarvittavine muutoksineen. Käytännössä tällainen tilanne aiheuttaisi muutoksia muunnosohjelmiin, jolloin niihin olisi päivitettävä uusien tekstitunnisteiden sisältämien tekstien käsittelyrutiinit. Näiden eri vaiheiden avulla voidaan konkreettisesti havainnollistaa rakenteisten tekstien riippumattomuus ja neutraalisuus myöhemmin tehtävän tekstimuunnoksen ja tekstin hyötykäytön suhteen.

    6.6.6 Yleisarvioita julkaisumallista

    Yksi tärkeä tavoite, joka julkaisumallille asetettiin tutkimuksen alkuvaiheessa, saavutettiin tässä tutkielmassa evaluoitujen julkisohjelmien avulla: mallin avulla on mahdollista muodostaa yhdestä ylläpidettävästä tiedostosta kaksi eri julkaisuversiota. Rakenteisiin teksteihin perustuvien dokumenttien suurimpana etuna onkin se, että tekstistä voidaan muodostaa muunnosohjelmien avulla erilaisia versioita.

    Mallissa käytetty GNU Emacs -tekstinkäsittelyohjelma yhdessä PSGML:n kanssa tarjoaa riittävät toiminnot tekstin muokkaukseen ja SGML-tekstielementtien merkkaukseen. Toisaalta GNU Emacs ei myöskään aseta ylärajoja muokattavan tekstitiedoston koolle, mikä aiheuttaa usein ongelmia PC-laiteympäristössä tapahtuvassa tekstinkäsittelyssä. Oleellinen ero "perinteiseen" tekstikäsittelyyn tässä mallissa on, että käyttäjän ei tarvitse huolehtia tekstin tulostusasun muotoilusta kirjoittamisen yhteydessä. Koska tekstin ulkoasun muotoilu tehdään muunnosohjelman avulla käyttäjän on toisaalta vaikea vaikuttaa siihen ja toisaalta perehdyttävä muotoilumahdollisuuksiin tarjolla olevien muunnosohjelmien avulla. Tällöin siis käyttäjän tehtäväksi jää valita se muunnokseen tarvittava määrittelytiedosto, jonka avulla tarvittava julkaisuversio on mahdollista muodostaa.

    Koska tavallisesti monet tekstinkäsittelijät ovat tottuneet käyttämään suurimman osan tekstinkäsittelyyn tarvittavasta ajasta ja energiasta tekstin muotoiluun ja tulostusasun viimeistelyyn, muotoilemattoman tekstin kirjoittaminen voi vaatia eniten totuttelemista. Tekstin osalta muotoiluseikat voivat ollakin sivuseikka, mutta esimerkiksi kuvien ja taulukoiden asettumien tekstin joukkoon olisi usein kiinnostavaa nähdä ennen tekstin julkaisemista. Koska rakenteisten tekstien perusideana on, etteivät ne sisällä mitään tekstin muotoiluun liittyvää, kuvien ja muiden muotoiluseikkojen tarkastaminen on mahdollista vasta muunnosohjelmien avulla muodostetuista julkaisuversioista. Tällöin muunnosohjelmilta edellytetäänkin toimivuutta ja tekstin ulkoasun muotoilutoimintoja mahdollisimman moniin tarpeisiin. Tämän julkaisumallin avulla muodostetun LaTeX-muotoisen paperijulkaisun ulkoasua voidaan tarkastella ennen tulostamista erilaisten esikatseluohjelmien avulla (xdvi, gs, ghostview), ja verkkojulkaisun (HTML-versio) tarkasteleminen tapahtuu helpoimmin HTML-selaajalla.

    Muunnosohjelmien avulla tapahtuva julkaisutekstien muuntaminen ei vaadi niiden käyttäjältä kuin käyttöjärjestelmätasolla annettavat komennot. Jotta mahdollisesti erilaisten tai muuttuvien ulkoasutarpeiden vaatimien julkaisujen muodostaminen olisi mahdollista, käytettäviä muunnosohjelmia tulisi ylläpitää ja tarvittaessa muodostaa uusia. Julkaisumallin yhtenäisen toimivuuden kannalta olisikin oleellista, että muunnosohjelmien ylläpito olisi mahdollista hoitaa yhden henkilön toimesta. Ylläpitäjältä edellytetäänkin tietämystä sekä muunnosohjelmista että tarvittavasta kohdemuunnoksesta.

    Tämän tutkielman tekijät ovat yhtä mieltä siitä, että rakenteisen tekstin muokkaaminen ja SGML-tekstitunnisteiden merkkaaminen on mahdollista omaksua lyhyenkin käyttökokemuksen perusteella. Koska teksteissä toistuvat aina tietyt vakiorakenteet ja ne muodostavat huomattavasti suurimman osan tekstitunnisteista, niiden merkkaaminen luontuu sujuvasti muutaman harjoittelukerran jälkeen. Esimerkiksi tekstikappaleiden perusrakenteen (luku, otsikko, kappale) merkkaus tapahtuu näppärimmin tekstiin kirjoittamalla ne aina uuden kappaleen alussa. Kun merkkausrutiini on tuttu, hiiren avulla tapahtuva tunnisteiden haku ja valinta tuntuu aivan liian työläältä.

    6.7 Yhteenveto

    Jyväskylän yliopistoon kehitetty julkaisumalli toimii UNIX-ympäristössä julkisohjelmia hyödyntäen. Poikkeuksena tästä varsinainen tekstin tuottaminen voidaan tehdä millä tekstinkäsittelyohjelmistolla tahansa, edellyttäen, että teksti voidaan tallentaa ASCII-muotoon. ASCII-muotoista tekstiä ylläpidetään UNIX-ympäristössä, jossa myös tekstin muuntaminen rakenteiseen muotoon ja siitä edelleen tarvittavaan ulkoasuun tapahtuu. Näin päästään tilanteeseen, jossa yhtä tiedostoa ylläpitämällä saadaan aikaan monta ulkoasultaan erilaista versiota tekstistä.

    SGML-merkkaus suoritetaan GNU Emacs-tekstinkäsittelyjärjestelmän ja sen yhteydessä toimivan PSGML-ohjelman avulla. Tekstin merkkauksen oikeellisuus valittuun dokumenttityyppimäärittelyyn nähden tarkastetaan SGMLS-jäsentäjän avulla, joka toimii joko PSGML-ohjelman alaisuudessa tai suoraan käyttöjärjestelmätasolta. Tarkastettu SGML-teksti muunnetaan joko ensin LaTeX-muotoon ja siitä HTML-muotoiseksi taikka suoraan WWW:stä luettavaksi HTML-tekstiksi. SGML-tekstin muunnokset toteutetaan sgmlspl-ohjelmalla toteutettujen muunnosmäärittelyjen avulla. LaTeX-muotoisen tekstin muunnokseen HTML-muotoon on puolestaan valittu LaTeX2HTML-niminen ohjelmisto.

    Julkaisumalli on sellaisenaan käyttökelpoinen, jos halutaan julkaista tekstiä, jonka rakenne ja ulkoasu vastaavat tätä pro gradu -tutkielmaa. Muussa tapauksessa muunnosohjelmiin ja ulkoasua määrittäviin tyylitiedostoihin on tehtävä muutoksia. Varsinaisen julkaisemisen lisäksi julkaisumallia voidaan käyttää opetuskäytössä, jolloin mallin eri osiin tutustuminen tutustuttaa opiskelijan samalla rakenteisiin teksteihin ja digitaaliseen julkaisemiseen tarvittaviin erilaisiin ohjelmistoihin.



    SeuraavaEdellinenYlös
    Seuraava Edellinen Alkuun