Skip to main content
Takaisin

Hyödynnä koneoppimista tehokkaasti myös on-premises -ympäristöissä

Blogi-koneoppiminen-1

Julkipilvialustat houkuttavat, kun on aika lähteä jalostamaan oman organisaation dataa eteenpäin. Skaalautuva ja kustannustehokas infrastruktuuri ilman omia laiteinvestointeja, mahdollisuus nopeisiin kokeiluihin valmiilla työkaluilla, matalat aloituskustannukset… Kuulostaa kieltämättä hyvältä.

Julkipilven palvelut eivät silti ole aina paras – tai edes mahdollinen – vaihtoehto. Millaisissa tilanteissa tekoälyn hyödyntämiseen on viisaampaa käyttää paikallista laskentatehoa, ja saako silloin kaikki uusimmat herkut käyttöönsä? Näihin kysymyksiin saat vastauksia tästä artikkelista. 

Yhteenveto: Tekoälyn hyödyntäminen on-premises -ympäristössä

    • Omassa hallinnassa oleva ympäristö tarjoaa täyden kontrollin kriittisen tärkeän datan käsittelyyn.
    • Avoimen lähdekoodin työkalujen avulla koneoppimisen mallit voi viedä myös suljettuihin ympäristöihin, eikä niiden käyttöön tarvita jatkuvaa verkkoyhteyttä.
    • Uudet, entistä kevyemmät kielimallit mahdollistavat myös generatiivisen tekoälyn paikallisen hyödyntämisen.
    • Hybriditoteutuksissa yhdistyvät pilven skaalautuva laskentateho ja on-premises -ratkaisun kontrolli.



Milloin valita paikallinen datan käsittely julkipilven sijaan?

Useat tekijät vaikuttavat päätökseen, kun koneoppimisen projekteille etsitään sopivinta ympäristöä:

Datan suojaustarve: Suojeltava tieto voi olla niin kriittistä, että sitä ei missään tapauksessa voi päästää ulkopuolisen toimijan ulottuville. Salaista voi olla sekä opetusdata, ennusteisiin käytetty data että itse ratkaisu.

Luotettavuus ja turvallisuus: Julkipilvialustat tarjoavat joustavuutta yhdistettyinä moderneihin salausmenetelmiin. Omassa hallinnassa olevissa on-premises -ratkaisuissa kriittistä tietoa voidaan kontrolloida sataprosenttisesti omilla toimilla. Molemmissa vaihtoehdoissa tarvitaan omanlaistaan erikoisosaamista, jolla varmistetaan tietoturvan eri kerroksia. 

Saavutettavuus ja toimintavarmuus: Esimerkiksi pitkälle optimoidussa prosessiteollisuudessa vaade palveluiden saavutettavuudelle ja toimintavarmuudelle on korkea, jopa reaaliaikainen. Pilvipalveluiden latenssi on varsin lyhyt, mutta toisinaan prosessit vaativat millisekuntien etumatkaa, joka saadaan tuomalla laskentaprosessit lähemmäs. Tapauskohtaisesti vastaus ongelmaan voi löytyä yhtä hyvin julkipilven maantieteellisistä regioonista tai paikallisesta laskennasta.

Kustannusten ennakoitavuus: Julkipilven automaattinen skaalautuvuus, samoin kuin kyselykohtainen hinnoittelumalli, voi karata käsistä, jos kapasiteetin käyttö kasvaa yllättäen suureksi. On-premises -ratkaisuissa kustannukset ovat ennakoitavissa ja hallittavissa, jos myös kapasiteetin tarve on hyvin tasainen. Ratkaisun kuormaprofiili vaikuttaa siihen, kumpi tie on kustannustehokkaampi.

Modernit koneoppimistyökalut voi viedä myös paikallisiin ympäristöihin

Jos pilvi ei ole vaihtoehto, tässä huojentava tieto: koneoppimisen hyötyjen kerääminen ei riipu alustasta. Vaikka monet palvelut ovat pilvinatiiveja, useimmat koneoppimisen keskeisimmät kirjastot, kehykset ja ekosysteemit perustuvat avoimen lähdekoodin toteutuksiin.

Pilviympäristöistä tuttujen valttikorttien, kuten sujuvan resurssien skaalauksen, mallien hallinnan ja automaation ei kannata antaa lannistaa paikallisen sovelluksen kehittäjää. Käyttökelpoisia tekoälyratkaisuja voi toteuttaa avoimen lähdekoodin elementtien avulla myös on-premisessä, vaikka prosessi olisikin erilainen. 

Lopputuotoksena saadaan toimivia malleja, joita käytettäessä verkkoyhteyden ei tarvitse olla jatkuvasti auki, ja ratkaisut voivat toimia täysin eristetysti. Se on olennaista etenkin turvallisuuskriittisissä ympäristöissä. Tekninen siirto vaatii toki huolellista suunnittelua, erityisesti ympäristön konfiguroinnissa, resurssien hallinnassa ja mahdollisten riippuvuuksien hallinnassa.

Projektia varten tarvitaan riittävä käyttöympäristö kirjastoineen ja ajureineen. Julkipilven valmiina työkaluina tarjoamia ratkaisuja esimerkiksi mallien käyttöönottoon ja hallintaan joutuu miettimään ja toteuttamaan itse, mutta onneksi infran pystytyksessä voi aina tukeutua kumppaneihin, eli kaikkea ei tarvitse osata itse.

Yhä kevyemmillä tehoilla kielimallien kimppuun

Koneoppimisen lajityyppejä riittää joka lähtöön, mutta voiko paljon hypetettyjä generatiivisia LLM-sovelluksia hyödyntää paikallisesti? Työkalujen kehittyessä myös kielimallit kevenevät, joten mallien kehitys ja testaus onnistuu yllättävän vaatimattomallakin laskentateholla. 

Googlen Gemma-kokoelma on kiinnostava esimerkki tästä. Mallit mahdollistavat generatiivisen tekoälyn hyödyntämisen asennuksesta eteenpäin täysin ilman verkkoyhteyttä ja kolmannen osapuolen palveluita. Koneoppimista voi siis periaatteessa tehdä vaikka luolassa yhdellä tietokoneella.

Hybridimallissa yhdistyvät pilven ja paikallisen ympäristön parhaat puolet

Lähes kaikki on mahdollista tehdä lokaalisti, mutta kaiken tekeminen on-premisessä ei ole aina järkevää. Kustannustehokkuutta etsivän kehittäjän ratkaisu onkin usein hybridimalli, jossa pilven joustavuus ja nopeus yhdistyy omien järjestelmien hallittavuuteen. 

Omaa dataa mahdollisimman hyvin vastaavan opetusdatan voi esimerkiksi kerätä julkisesta verkosta. Laskennallisesti raskas mallin opetus tehdään julkipilvessä. Siinä kohtaa, kun mallia aletaan rikastaa omalla kriittisellä datalla, viedään tekeminen paikalliseen ympäristöön. Salassapidettävä data sekä itse tuotantovaiheen koneoppimisratkaisu säilyvät on-premises -ympäristössä. 

Tuottavuus paranee jatkuvasti myös on-premises-ympäristöissä

Julkipilven ja AI as a Service -palveluiden suosio kasvanee lähitulevaisuudessa. Lieviä merkkejä on kuitenkin havaittavissa siitä, että ylläpidon ja työkalujen kehittämisen ulkoistaminen ei ole enää kaikille itsestään selvä valinta.

Koneoppimisen kehitystyö nopeutuu ja tuottavuus paranee myös paikallisissa ympäristöissä. Pienemmät kielimallit mahdollistavat kehittyneet sovellukset ilman pilviyhteyttä. 

Tuottavuuserot pilvikehityksen ja on-premises -tekemisen välillä näyttivät vielä jokin aika sitten selkeiltä julkipilven hyväksi. Nyt teknologioiden jatkuvasti kehittyessä tuo railo ei ole enää niin suuri. Se vaikuttaa niin ratkaisuihin kuin niiden toteuttamiseen, erityisesti nyt, kun yhteiskunnan toimintojen kannalta kriittinen data puhuttaa monia meistä.

Miten saat omasta datastasi enemmän irti? Katso kaikki Arvoa AI:sta -webinaarit!

 

 

 Cinia Oy
Kirjoittaja Cinia Oy Cinia tarjoaa turvallisia korkean käytettävyyden tietoverkko-, kyberturvallisuus- ja ohjelmistoratkaisuja.