(C) Olavi Kanervisto & Tietotila Oy 1997

AltaVista-hakukone omaan mikroon

Etsi ja löydä

Internetin suosittu AltaVista-hakuohjelmisto on nyt kaupan myös oman tietokoneen tai -verkon dokumenttien hallintajärjestelmäksi. Kotimikrossa tiedon etsintä sujuu samalla tutulla tekniikalla ja yhtä hyvin kuin internet-verkossakin, eikä maksa paljon.

Ihminen on luonnostaan laiska. Jos olet perusluonteeltasi lähempänä luovaa kuin byrokraattista, työpöytäsi ja arkistosi pitäminen järjestyksessä voi joskus olla vaikeaa.

Tietokoneen käyttäjän perusluonne näkyy siinä, miten helposti ja nopeasti hän löytää mikron levylle tallennetut tiedostot. Vain järjestelmällisimmät pystyvät keksimään tallenteilleen kyllin kuvaavat nimet ja sijoittamaan ne johdonmukaisesti aina oikeisiin kansioihin niin, että kaikki löytyy hetkessä.

Keskimääräinen kotimikron käyttäjä ei löydä enää helposti vanhoja tiedostojaan koneiden yhä kookkaammilta kiintolevyiltä. Niinpä ohjelmatalot tarjoavat erityisiä etsintäohjelmia ja tiedonhallintajärjestelmiä, jotka kuitenkin usein lajittelevat tiedostot vain niiden nimen perusteella.

Tiedonhallintaohjelmien käyttöönotto edellyttää ylimääräistä työvaihetta ja siten enemmän vaivannäköä kuin mihin keskimääräinen kotimikron omistaja on valmis. Alan maineikas klassikko, jo 80-luvulla kehitetty Lotus Magellan myös maksoi kotikäyttäjän kannalta liikaa ja on erinomaisuudestaan huolimatta jäänyt mikron omistajien enemmistölle tuiki tuntemattomaksi.

Hyviin tiedostonimiin ja harkittuun hakemistorakenteeseen perustuvan tiedonhallinnan täydentäjäksi kotimikroihinkin on saatavana erityisiä indeksointiohjelmia. Hierarkkisen järjestelmän asemesta ne lukevat ja lajittelevat kaikki tekstiasiakirjoihin sisältyvät sanat niin sanotuiksi indeksiksi, minkä jälkeen jokainen asiakirja, johon etsittävä sana tai sanat sisältyvät, löytyy nopeasti.

Miljoonia testaajia

Parin viime vuoden aikana suureen suosioon noussut internet www-selaimineen ja hakukoneineen on saanut yhä useamman oivaltamaan helpon tiedonetsintäjärjestelmän edut. Yahoo, Lycos sekä kotimainen Trampoliini-haku löytävät hetkessä tietoverkosta oikeat osoitteet suomenkielistenkin hakusanojen perusteella.

Vuoden 1996 alussa toimintansa aloittanut Digitalin uusi AltaVista-hakukone nousi nopeasti käytetyimpien joukkoon. Sen suosio vain kasvoi ruotsalaisen Telian palvelimelle replikoidun hakukoneen alkaessa palvella käyttäjiä myös suomen kielellä. Useimmat tuntemani internet-surffarit ilmoittavat AltaVistan yhdeksi kolmesta eniten käyttämästään hakupalvelujärjestelmästä.

Viime vuoden lopulla AltaVistan kotisivulle ilmestyi mainos, joka kertoi indeksointi- ja hakuohjelman olevan saatavana myös käyttäjän omaan koneeseen. Imuroitavissa oli ilmainen beta- esittelyohjelma, joka kuitenkin toimisi vain kuukauden ajan.

"AltaVista Search My Computer Private eXtension" -ohjelman myyntiversion mainos toimitettiin sähköpostitse kaikille testiversion imuroineille. Neljä käyttöliittymäkieltä sisältävä romppu maksoi 19,95 dollaria. Suomeen tilattuna hinnaksi lähetyskuluineen kertyi 94 markkaa. (Hinta nousi sittemmin 29,95 dollariin, mikä ei ole paha hinta sekään.)

Oman koneen AltaVista-ohjelmaromppu käsittää 14 pakattua tiedostoa, yhteensä hieman yli 5 megatavua. Asennus sujuu vaivattomimmin alkuperäislevyltä, mutta mikään muu kuin tekijänoikeuslaki ei estä kopioimasta ohjelmaa lähiverkossa tai tiivistettynä kolmelle korpulle.

Asennus sujui ongelmitta SETUP-ohjelmalla. Levytilaa tarvitaan tilanvarausyksikön koosta riippuen vähintään 9 MB ohjelmistolle ja muutama megatavu lisää sanaindekseille. Ohjelmiston kiintolevyltä täydellisesti poistava UNINST-ohjelma sisältyy toimitukseen.

Ei toimi 386-laitteissa

Mikrossa on oltava vähintään 486-prosessori, 12 megaa työmuistia ja 10 MB levytilaa sekä Windows 95 tai NT 4.0 -käyttöjärjestelmä. Lisäksi laitteesta tulee löytyä joko Microsoft Internet Explorer tai Netscape-selaimen 2- tai 3-versio ja TCP/IP-yhteystapa.

Jo vähimmäisvaatimukset täyttävässä laitteessa sekä asentaminen että käyttö onnistui mallikelpoisesti. Indeksointi sujui noin 100.000 sanan minuuttivauhdilla. Parhaimmillaan hakukone tietenkin on nopeimmissa Pentium-laitteissa.

AltaVistan indeksointiohjelman sekä hakurobotin pienoiskuvakkeet näkyvät Windowsin tehtäväpalkin niin sanotulla ilmaisinalueella, mutta ainoastaan indeksointiohjelma voidaan siitä käynnistää. Hakukonetta käytetään internet-selaimen – joko Explorerin tai Netscapen – välityksellä. Hakurobotti ilmoittaa vastaanottaneensa etsintäpyynnön selaamalla pienoiskuvaketta.

Yrityksen lähiverkkoon liitetyissä koneissa oman koneen kiintolevyn hakusivu lisätään automaattisesti suosikit- tai bookmarks-osoiteluetteloon. Modeemiyhteyttä käyttävissä kotikoneissa voi olla tarpeen määritellä "configuration"-valikossa "NoProxy" ja 127.0.0.1, joka on oman koneen IP-osoite. WWW-selain käyttää siis AltaVistan omaa hakukonetta samalla TCP/IP-yhteyskäytännöllä kuin internetissä sijaitsevia palveluja.

Automaattisesti ajan tasalla

Asennuksen jälkeen AltaVista haluaa tiedot siitä, mitkä kansiot levyltä indeksoidaan. Listaa voi myöhemmin karsia tai täydentää. Hakumahdollisuus ulottuu niin haluttaessa selaimen cache-hakemistoihin kopioituneisiin HTML-sivuihin sekä Exchange-, Eudora-tai Mail-sähköpostitiedostoihin. Myös lähiverkossa sijaitsevat postikansiot, joihin käyttäjällä on lukuoikeus, voidaan sisällyttää hakuun. Pelkkiä ohjelmatiedostoja sisältävien hakemistojen liittämisessä mukaan ei ole järkeä.

Levyn kaikkien tiedostojen sanaindeksin rakentaminen kestää muutamia minuutteja. Kokonaisaika riippuu prosessorista, kiintolevyn lukunopeudesta ja indeksoitavien tiedostojen määrästä.

Uusia tiedostoja lisätään indeksiin joko automaattisesti käyttäjän määrittäminä aikoina tai käynnistämällä indeksointiohjelma käsin milloin tahansa.

Suomen kielikin sujuu

Internetin hakukoneet ovat jo tehneet yleisimmät hakuehdon kirjoitustavat monille tutuiksi. Oman levyn sisältöä etsitään nyt täsmälleen samalla tavoin. Ellei AltaVistan hakutekniikka ole ennestään tuttu, kannattaa lukea ja tulostaa erinomainen suomenkielinen ohje http://www.altavista.telia.com -sivulta.

Ä- ja ö-kirjaimia sisältävät sanat löytyvät yhtä hyvin siitä riippumatta, käytetäänkö tiedostoissa Windowsin ANSI- tai MS-DOS-merkkijärjestelmää. Myös RTF-tiedostot sekä yleisimpien tekstinkäsittelyohjelmien asiakirjat indeksoituvat oikein.

Hakutuloksena kotikoneen AltaVista näyttää tiedoston nimen, sen sijaintiosoitteen (hakemistopolun) sekä 2–3 riviä tekstin alusta samaan tapaan kuin internetissä toimiva selain, joten käyttöliittymä tuntuu heti tutulta. Näpäyttämällä hiirellä tiedoston nimeä sen sisältö näytetään joko selainohjelmalla (HTML-dokumentit), Windows Tiedostonkatselulla tai siinä määritellyllä muulla ohjelmalla, kuten teksturilla.

Isojen kirjainten ja aksenttien – joiksi amerikkalaisperäinen ohjelma luokittelee myös ä- ja ö-kirjainten pisteet – käsittelykin on enimmäkseen johdonmukaista. Oikeastaan ainoa puute AltaVista-hakukäytännössä kotimaisiin ohjelmiin verrattuna on se, että se ei tunne suomenkielisten sanojen taivutusmuotoja: jokerimerkkiä käyttäen esimerkiksi haku "kenkä*" tai "kenk*" ei löydä monikkoa "kengät".

Useimmiten etsittävät sanat ovat kuitenkin perusmuodossa, ja kansainvälisessä internet-verkossa testattu tekniikka toimii suomenkielisissäkin asiakirjoissa yllättävän hyvin.

Hinta kohdallaan

Oman koneen AltaVista-hakurobotti on malliesimerkki siitä, mitä internet on tehnyt tietokoneohjelmille ja niiden hinnoittelulle.

Tietoverkon kautta ohjelman imuroineet beta-testaajat tekivät tuotteesta ennätysajassa erittäin vakaan ja helppokäyttöisen, ja markkinointi sähköpostin avulla mahdollisti sen myymisen 100–150 markalla eli kymmenesosalla siitä hinnasta, mitä vastaavista tuotteista vielä muutama vuosi siten pyydettiin.

Tämä hyödyllinen ohjelma on niin halpa, että tuskin kukaan sen vakituiseen käyttöön ottanut kehtaa käyttää luvatonta kopiota.

KUVATEKSTIT:

OMAN mikron hakuohjelmaa käytetään täsmälleen samalla tavoin kuin tätä internet-verkon ohjelmaa. Käyttöliittymän tekstit vain ovat englanniksi, saksaksi, ranskaksi tai espanjaksi. Suomea ohjelman romppuversio ei vielä osaa.

ASENNUSOHJELMASSA on asialliset virheilmoitukset ja ohjeet kaikkien mahdollisten vastoinkäymisten varalta. Tässä levy täyttyi kesken asennuksen.

ENNEN tiedostojen indeksointia kannattaa harkita, mitkä kansiot otetaan mukaan. Ohjelmatiedostoja sisältävien hakemistojen indeksointi on turhaa.

Takaisin juttuluetteloon

Tietotila Oy:n pääsivulle