(C) Olavi Kanervisto & Tietotila Oy 1998

Kotimikro kielenkääntäjänä

Lokakuun numerossa julkaistu "Ilmaispalveluja internetissä" -juttu poiki tavallista enemmän palautetta. Erityisesti koneellinen kielenkääntäminen kiinnosti kirjoittajalle sähköpostia lähettäneitä.

Jutun yhteydessä julkaistussa kuvassa Kielikoneen internet-käännöspalveludemosivulta oli luettavissa sinne naputtelemani suomenkielinen teksti sekä koneen paluupostissa tarjoilema englanninkielinen käännös:

"Arvoisa vastaanottaja Xxx Yy. Koska en osaa vieraita kieliä, olen kääntänyt tämän kirjeen englanniksi internetissä tietokoneella. Kokeilin Kielikoneen maksutonta käännöspalvelua (TranSmart). Toivon, että tilaukseni tulee oikein ymmärretyksi. Haluaisin tilata seuraavat varaosat kylvökoneeseen..."

TranSmart-ohjelma käänsi tekstin näin:

"Honoured receiver Xxx Yy. Because I do not know foreign languages, I have translated this letter into English in the Internet on the computer. I tried the free translation service of Kielikone (TranSmart). I hope that my order would be understood right. I would like to order the following spare parts to the sowing machine..."

Lukijat halusivat tietää, miten tekstissä mainittu kilpaileva käännösohjelma olisi selviytynyt samasta tekstistä. Seuraavassa Syntax 6.0:n laatima käännösehdotus:

"Valuable receptionist Xxx Yy. Because I can’t foreign languages, I have translated this letter in English the Internet in the computer. I tried Language machine free translation service (Transmart). I hope, that my order comes correct for understood. I would like to order following replacements to the hopper."

Englantia osaavat havaitsevat näin lyhyestäkin näytteestä, että lauserakenteet ovat kömpelömpiä, ymmärrettävyys ontuu, ja kielioppivirheitä löytyy enemmän. Tässä tapauksessa pieni ja halpa ohjelma ei siis kykene samantasoiseen suoritukseen kuin suuri ja kallis.

Syntax 6.0 on järvenpääläisen Blue Ball Oy:n tuote, jonka saa CD-romppuna tai kolmella korpulla 695 markan hintaan. Ohjelma toimii melko vaatimattomassakin kotimikrossa, 386-prosessori ja 6 Mt työmuistia riittää. Kiintolevytilaa Syntax tarvitsee asennettaessa 8 megatavua.

Ohjelma osaa kääntää vain yleisessä tekstinkäsittelymuodossa tai rtf-muodossa olevaa tekstiä. Mm. internetin HTML-tekstitiedostot on siis ensin muunnettava selväkielisiksi, ennen kuin ne voidaan syöttää Syntax-käännösohjelmaan.

* * *

Mutta pystyykö Syntax ymmärrettävään suomentamiseen? Olisi houkutteleva ajatus pystyä kielitaidottomana ymmärtämään vaikkapa ulkomaisia internet-sivuja, kuten 45 vuotta toimineen amerikkalaisen luomutilan ja luomutuoteyrittäjän tyylikkäiltä verkkosivulta löytyvää tekstiä:

"Pavich Family Farms Celebrate 45 Years. Pavich Family Farms Celebrates 45 Years as Pioneers in Agriculture. Second-generation organic farmers. In 1953, Stephen Pavich, a Croation immigrant who knew he wanted more than a job on the fishing docks in northern California, took his first step toward his American dream. He and his wife leased 140 acres of prime agriculture land and made a commitment to growing grapes and raising a family in the Central Valley of California, the fruit bowl of the world."

Kas näin Syntax siitä selviää:

"Pavich Perhe Maatilat Juhlia 45 Vuodet. Pavich Perhe Maatilat Juhli 45 Vuodet kuin Uranuurtajat maatalouksen. Toisen polven elollista maanviljelijiä. 1953issa, Stephen Pavich, Croation maahanmuuttaja kuka tieti hän haa enemmän kuin työ kalastuksella telakalla pohjoisen Californiassa, otettu hänen ensimmäinen askelma kohti hänen Amerikkalainensa unelma. Hän ja hänen vaimonsa vuokrasi 140 acre tärkeä maatalouksen maasta ja teki sitoumus kasvaaminen viinirypäleet ja nostava perhe kesken Laaksossa Californiasta, maailman hedelmä astia."

Siirtolainen Pavichin kansalaisuus (kroatialainen) jäi kääntämättä ilmeisesti siksi, että alkutekstin sanassa Croatian on painovirhe. Jälempänä tekstissä mm. orgaanisen viljelyn järjestötoiminnan veteraaniksi mainitun Pavichin puheenjohtajuus suomentuu rintamamiesjärjestön elolliseksi teollisuusjohtajaksi.

Tekstinäytteestä selvinnee kotikäyttöön tarkoitettujen käännösohjelmien tämänhetkinen taso. Sanavarasto on riittävä, mutta ohjelmasta puuttuvat toistaiseksi välineet oikean vaihtoehdon valitsemiseksi. Lauserakenteet ovat mitä sattuu, koska ohjelma ei (nimestään huolimatta) osaa jäsentää lauseita syntaktisesti. Ohjelma näyttää toimivan kuin kielitaidoton ihminen, joka yrittää saada vieraskielisestä tekstistä tolkkua pelkän sanakirjan avulla.

Tällaisenaankin Syntax soveltuu jo sanalistojen, kuten varaosaluetteloiden kääntämiseen sekä vieraskielisten käyttöohjekirjojen yms. teknisen tekstin ymmärtämisen apuvälineeksi. Työn ja ajan säästö verrattuna ihmistyönä tapahtuvaan kääntämiseen on huomattava, vaikka ihminen joutuukin aina tarkistamaan ja korjaamaan koneen tekemän käännösehdotuksen.

Käännösohjelmasta lienee eniten hyötyä henkilöille, joiden oma kielitaito on ohjelmaakin vaatimattomammalla tasolla. Kieltä tyydyttävästi osaavalle Syntax-raakakäännöksestä voi olla apua runsaasti erikoistermejä sisältävän tekstin työstämisessä. Ohjelman omaan sanakirjaan sisältyvät käännösvastineet voidaan vaivattomasti korvata kulloiseenkin työhön paremmin sopivilla ja tallentaa ne omaksi lisäsanakirjaksi, jota ohjelma aina käyttää perussanakirjan sijasta.

Siihen, vastaako ohjelmasta saatava hyöty siitä maksettavaa 695 markan hintaa, en ota kantaa.

Lokakuun mikropalstalla mainituista internet-sivuista on jo ehtinyt muuttua ainakin Telian AltaVista-palvelu, joka löytyy nyt osoitteesta http://www.evreka.com/fi. Suomen yrityshakemistoon pääsee suoraan näppäilemällä osoiteriville http://www.yritystele.fi.

Takaisin juttuluetteloon

Tietotila Oy:n pääsivulle