(C) Olavi Kanervisto & Tietotila Oy 1998

Käännöksiä kotimikrolla

Suomi—englanti—suomi -käännösohjelma Syntax ei läpäisisi ylioppilastutkinnon kielikoetta. Koska ohjelma ei edes yritä täydellisesti jäsentää ja ymmärtää lauseen sisältöä, käännös menee usein metsään. Syntax on kuitenkin askelen edellä elektronisia sanakirjaohjelmia.

Voisi kuvitella, että tavallisen käyttäjän ulottuvilla olevat koneelliset kielenkääntimet olisivat 18 vuodessa kehittyneet enemmän kuin käytännössä on tapahtunut.

Tutustuin koneellisen kielenkääntämisen ensi askeleisiin vuonna 1979. Paristokäyttöistä Graig M100 -kämmenmikroa kaupiteltiin Suomessa kuvaavalla nimellä Tankero. Tämä elektroninen lelu tunsi 5000 sanaa ja sanontaa, ja se "käänsi" perusmuodossa peräkkäin kirjoitetuista sanoista muodostetun "lauseen" kerralla.

Sanat saivat olla ainoastaan perusmuodossa, prepositioita ja artikkeleja yms. hienouksia laite ei edes yrittänyt tunnistaa. Muutamissa kohdin, joissa väärinkäsityksen vaara oli ilmeinen, se pyysi täsmennystä: käännettäisiinkö sana "clean" englannista suomeen verbinä ("to") vai substantiivina ("be"), tai tarkoitetaanko "olla"-sanalla ilmaisua "on", "omistaa" vai kenties "olla samaa mieltä".

Sana sanalta

Varhaisten käännösohjelmien kehno toiminta johtui väärästä lähtökohdasta: sana sanalta kääntäminen yleensä epäonnistuu. Jäsenninohjelma osaa purkaa lähdekielen virkkeiden syntaksin etsimällä ensin päälauseenjäsenet ja sitten niihin liittyvät objektit, attribuutit ja adverbiaalit, ja tekee siten ymmärrettävän kääntämisen mahdolliseksi. Virkkeet rakennetaan lauseenjäsenistä kokonaan uudestaan kohdekielellä sen syntaksin ja kieliopin mukaisesti.

Tietokone ei voi käsittää edes yksittäisten sanojen vaihtoehtoisia merkityksiä, saati monimutkaisten lauseiden vivahde-eroja. Siksi kone ei koskaan pysty kääntämään kertomakirjallisuutta yhtä hyvin kuin ihminen. Kielen rakennetta jäsentävä ohjelma sitä vastoin selviytyy jo nyt asiatekstistä melko hyvin.

Syntax ei osaa syntaksia

Nimestään huolimatta Syntax ei ole lauseita syntaktisesti jäsentävä ohjelma. Suomesta englantiin kääntäessään se osaa kyllä joten kuten purkaa verbien ja nominien perästä sekä taivutuspäätteet että liitepartikkelit ja korvata ne kohdekielen pronomineilla tai prepositioilla. Enempään se ei pysty. Ohjelma tunnistaa esimerkiksi verbien persoonamuodot, muttei aikamuotoja eikä passiivia.

Syntax-ohjelmalla englanniksi käännetyn lauseen sanajärjestys muodostuu suomen kielen mukaisesti ja tulos on kömpelö. Vain hyvin lyhyet ja yksinkertaiset lauseet ovat vierasmaalaisellekin ymmärrettäviä. Lastenkirjat ja sanomalehtiuutiset kääntyvät siedettävästi.

Monimerkityksisiä ilmaisuja kohdatessaan ohjelma pyytää käyttäjää valitsemaan parhaan kahdesta vaihtoehdosta. Esimerkki: Tarkoittaako "kieli" puhekieltä, vai suussa olevaa? Tai onko "yhtä" vielä, vaiko yksi?

Käyttöliittymässä puutteita

Ulkonäkö ja hyvät suomen- tai englanninkieliset ohjeet ovat Windows95-käyttölogiikan mukaiset. Yleisvaikutelma on kuin teksturissa. Kuvaruudulla on kaksi ikkunaa, joista ylempään käännettävä teksti voidaan kirjoittaa tai lukea tiedostosta. Käännös näkyy alemmassa ikkunassa.

Ikkunoiden käsittely voisi olla kätevämpää: muun muassa toiminto, jolla molempia tekstejä vieritetään yhtä monta riviä kerrallaan, puuttuu.

Vakavampi puute on se, että ohjelma ei osaa käsitellä eli muuntaa selväkielelle tavallisimpien Windows-tekstureiden dokumentteja, internetin HTML-tiedostoja eikä edes ASCII-tekstiä. Vain Windows Latin1-merkkijärjestelmällä tallennetut tekstitiedostot kelpaavat. Ohjelman rinnalle kaipaakin siis jonkin Latin1-, ASCII-, HTML- ja Macintosh-merkkijärjestelmämuunnokset hallitsevan apuohjelman.

Englannista suomeksi kääntävä osa on perusohjelmaakin kömpelömpi. Valmistaja korostaa, että kyseessä on vasta ohjelman kaupanpäällisenä tuleva kehitysversio. Se kelpaa kuitenkin karkeisiin raakakäännöksiin, kuten Internetistä imuroidun, sanastoltaan vieraan tekstin ymmärtämisen avuksi.

Mikron prosessorin teho ja työmuistin määrä vaikuttavat ratkaisevasti käännösnopeuteen: sadan megahertsin Pentiumissa tämä juttu kääntyi tankeroenglanniksi parissa minuutissa, 25 megahertsin 386-suoritin raksutti 24 minuuttia. Tulos oli samanlainen kummallakin koneella.

Käyttöohjeiden kääntämiseen

Syntax on hyödyllisimmillään sanaluetteloiden ja runsaasti erikoistermejä sisältävän lyhytvirkkeisen tekstin kääntämisessä. Noin 200.000 sanan sanakirja sisältää melkoisen määrän juridista, kaupallista ja teknistä terminologiaa, ja ohjelman ehdottamat käännösvastineet ovat hyvin usein parhaita mahdollisia. Laajoja tekstikokonaisuuksia käsiteltäessä sanastokuri on erityisen tärkeää: jokainen termi pitää kääntää johdonmukaisesti samalla tavalla — myös silloin, kun laaja työ on jaettu usealle henkilölle.

Ohjelman käyttökelpoisuutta lisää sen sanakirjojen räätälöitävyys. Käyttäjä voi lisätä puuttuvat tai parannetut käännösvastineet omaan täydennyssanakirjaansa. Ohjelma käyttää aina ensin käyttäjän omaa tietokantaa oman sanastonsa sijasta.

Kokeilemisen arvoinen

Syntax maksaa 695 markkaa, toimii Windowsissa ja asennetaan rompulla tai levykkeillä. Kiintolevytilaa tarvitaan vain kuusi megatavua, mikä osaltaan kuvaa ohjelman vaatimattomuutta. Työmuistiksi riittää kahdeksan megatavua.

Ohjelman kotelon mainoskuvassa näkyy Innosuomi-tietotekniikkakilpailusta kertovaa tekstiä. Tällä ohjelmalla ei kuitenkaan ole mitään tekemistä viime vuonna vuoden parhaan ohjelmistotuotteen Oiva-palkinnon saaneen TranSmart-konekäännösjärjestelmän kanssa: sen jälki on huomattavasti laadukkaampaa.

TranSmartia ei ole vielä saatavana kotimikroihin, ohjelma vaatii toimiakseen NT- tai UNIX- käyttöjärjestelmän. Syntax on siis toistaiseksi sanasto-ohjelmien ainoa vaihtoehto kielenkääntämiseen kotimikrossa. Vaikka ohjelma on ominaisuuksiltaan vielä vaatimaton, se on jo muita elektronisia sanakirjoja käyttökelpoisempi.

Jos ei muuta, ohjelma osoittaa ainakin sen, miten vaikeaa kielen hahmottaminen ja kääntäminen tietokoneelle onkaan!

KUVATEKSTIT:

SYNTAX-ohjelman esittely ja tilausohjeet löytyvät Internetistä osoitteesta www.blueball.fi.

SYNTAXin käyttö on yksinkertaista: käännettävä teksti kirjoitetaan tai luetaan tiedostosta ylempään ikkunaan ja napsautetaan "käännä teksti" -painiketta. Vieraskielinen teksti tulee alempaan ikkunaan.

PARASTA ohjelmassa on helposti täydennettävä ja ylläpidettävä sanastotietokanta, johon käyttäjä voi lisätä puuttuvat tai paremmat käännökset usein tarvitsemilleen sanoille.

Takaisin juttuluetteloon

Tietotila Oy:n pääsivulle