(C) Olavi Kanervisto & Tietotila Oy 1998

Aprillipiloja internetissä

Sain kopion sähköpostikirjeestä, jonka lähettäjäksi oli merkitty Bill Gates. Viesti sisälsi houkuttelevan tarjouksen: jos lähettäisin siitä kopion sähköpostitse tarpeeksi moneen uuteen osoitteeseen, saisin Windows98-päivityksen ilmaiseksi heti ohjelmiston tultua myyntiin.

Parin viime vuoden aikana olen saanut noin seitsemän eri kopiota viesteistä, jossa varoitetaan avaamasta tietyn nimistä sähköpostisanomaa. "Good Times" tai "Join the Crew" tai "Penpal Greetings" -otsikoitujen viestien lukeminen laukaisisi viruksen, joka nakertaa tietokoneen kiintolevyn käyttökelvottomaksi.

Alkuvuonna verkossa vaelsi varoituskirje muka puhelimen keskusääntä moduloimalla tietokoneesta toiseen siirtyvästä, modeemin muistipiirejä väli-isäntänään käyttävästä tuholaisohjelmasta. Lopulta virus siirtyy kiintolevylle ja tyhjentää sitten mikron "muistin" — tieteisfantasia, jonka olen ensi kertaa lukenut jo liki kymmenen vuotta sitten!

Ilmaisia päivityksiä sähköisen ketjukirjeen jatkajille luvannut viesti ei varmasti ollut lähtöisin Microsoftin johtajalta. "Good Times" -nimistä sähköpostiviestiä en tiedä kenenkään koskaan nähneen ja vaikka olisikin, viestin lukeminen ei voisi aiheuttaa kuvailtua ilmiötä. Ja modeemia välimuistinaan käyttävä virusohjelma on jo ajatuksena mahdoton.

Nämä sähköpostissa jo monta kertaa maailman ympäri kiertäneet huuhaa-ketjukirjeet varoittavat olemattomasta ja ovat siis itse se jäynä, jota pahaa-aavistamattomien verkon käyttäjien toivotaan monistavan muille yhtä tietämättömille tulokkaille. "Liity joukkoon" -aprillipila muunnelmineen saattaa elää ikuisesti internetissä?

Toistan vielä: sähköposti-tekstiviestin lukeminen ei voi tartuttaa tietokonevirusta, ei makroviruksia eikä edes ns. troijan hevosia. Vain ohjelmatiedostoissa sekä Word-ohjelmalla tehdyissä "doc"-liitteissä virukset leviävät myös sähköpostin kautta.

Mutta eihän kukaan asioista perillä oleva lähetä Word-tiedostoja doc-asiakirjoina, eikä ainakaan suostu vastaanottamaan sellaisia?

Jos sähköpostitse kuitenkin saapuu "doc"-tarkentimella varustettu liitetiedosto, sen voi aina avata turvallisesti Windows95-käyttöjärjestelmään sisältyvällä WordPad-teksturilla. WordPad ei suorita eikä levitä Word-makroina tallennettua viruskoodia. WordPadilla doc-tiedosto voidaan kuitenkin lukea ja sen jälkeen tallentaa joko tekstitiedostoksi tai RTF-"näköispainoksena". Näin muunnettu puhdas tiedosto voidaan avata Word-ohjelmallakin ilman makrovirusten vaaraa.

Lisää ääkkösongelmia

Mikropalstalla joulukuussa (KM 13/97, s.32) julkaistut näytteet ä- ja ö-kirjainten näkymisestä eri postijärjestelmillä toivat palautetta. Mukana kun eivät olleet kaikki käytössä olevat vaihtoehdot "ääkkösten" koodaamiseksi tietoverkossa.

Esimerkkilause "Älä tee tätä työtä" siirtyi 70-luvun sähköpostiohjelmilla muodossa "[l{ tee t{t{ ty¦t{". Amerikkalaiseen kirjaimistoon sisältymättömät merkit oli korvattu haka- tai kaarisulkein, jotka vastaanotto-ohjelmien olisi pitänyt osata muuntaa takaisin meikäläisiksi kirjaimiksi.

80-luvulla teksti siirtyi monilla postiohjelmilla MIME-koodattuna ("=C4l=E4 tee t=E4t=E4 ty=F6t=E4") ja lisäksi ainakin seuraavina muunnelmina:

"{\rtf1\ansi{\deff1}\par\’8El\’84 tee t\’84t\’84 ty\’94t\’84.}"

"RTF"-koodatut ääkköset toimivat oikein lähes kaikilla Windowsissa toimivilla sähköposti-, tekstinkäsittely- ja taitto-ohjelmilla.

"{\rtf1\mac{\deff2}\par\’80l\’8a tee t\’8at\’8a ty\’9at\’8a.}"

RTF-standardista on omat versiot DOS- ja Macintosh- merkkijärjestelmille. Edellä oleva mac-rtf-teksti ei välttämättä näy oikein kaikilla pc-ohjelmilla.

"Älä tee tätä työtä"

HTML- eli ns. internet-muotoa käytetään yleisesti www- verkkosivuilla. Ääkköset näkyvät kaikilla selainohjelmilla oikein sekä DOS-, Mac- että Windows-laitteissa.

8 bittiä = 255 merkkiä

Yhden ainoan kirjainmerkin välittämiseen tietoverkossa saatetaan käyttää neljän, jopa kuuden merkin jonosta koostuvaa tavukoodia.

Miksi näin? Syynä on 8-bittisiin ns. tavuihin perustuvasta käyttöjärjestelmästämme johtuva kirjain- ja numeromerkkien rajallinen määrä, enintään 256 erilaista.

Vielä 70-luvulla yleiset, tuolloin huikeaan 400 merkin minuuttinopeuteen yltäneet kaukokirjoittimet eli telexit käyttivät kirjaimistoa, johon sisältyivät vain numerot, 26 pienaakkosta ja muutamia välimerkkejä. Ä:n tilalla käytettiin a-kirjainta, ja ö korvattiin vastaavasti o:lla.

70-luvun lopun tietokoneiden merkistö oli "7-bittinen": 127 erilaista tavua eli merkkiä sisältävä järjestelmä käsitti amerikkalaiset aakkoset (sekä isot että pienet kirjaimet), numerot sekä välimerkit. Puuttuvat Å-, Ä- ja Ö-kirjaimet tallennettiin Pohjoismaissa haka- ja kaarisulkuina.

Microsoftin DOS-käyttöjärjestelmä otti käyttöön kahdeksannen bitin, ja merkkivalikoima kaksinkertaistui. Osa uusista koodeista kuitenkin tuhlattiin erilaisiin viiva-, rasteri- ym. koristemerkkeihin, ja eri kieliä varten piti ottaa käyttöön erilaiset merkkivalikoimat, ns. koodisivut.

Valitettavasti Windows-järjestelmässä Ä- ja Ö- kirjaimet määriteltiin eri tavalla kuin pc-ohjelmissa. Macintosh käyttää kaikista näistä poikkeavaa merkistöä. Sekasotku oli valmis.

Ongelmattomimmat tavat suomen- ja ruotsinkielisten tekstien siirtämiseen eri ohjelmien ja laiteympäristöjen välillä ovat RTF- ja HTML-tiedostomuodot. Mikäli mikrossasi on riittävän fiksut ohjelmat, Ä- ja Ö- merkit näkyvät omalla kuvaruudullasi aina virheettömästi.

Uusi 16-bittinen Unicode-standardi määrittelee yksiselitteisesti 256-kertaisen määrän erilaisia merkkejä. Järjestelmän mahdollistamista noin 65.000:sta merkistä lähes puolet on jo varattu pysyvästi maailman eri kielten ja symbolijärjestelmien tarpeisiin. Unicode-järjestelmä pystyy tekemään ääkkösongelmista historiaa, mutta se tuskin ehtii yleistyä vielä tällä vuosituhannella.

Takaisin juttuluetteloon

Tietotila Oy:n pääsivulle