arttula kirjoitti: ↑27.12.2024 klo 12.57
Minä odotan ilolla ja innolla tekoälyn kehittymistä vielä tästä. Visioissani on, että jo lähivuosina voit heittää tekoälylle pureksittavaksi kirjan, se hetkessä tuottaa siitä elokuvan. Voit vapaasti valita pääosien esittäjät ihan ilman parkua siitä, miten elokuvateollisuus suosii valkoisia. Tai vaihtaa sankarin sukupuolen lennosta ties miksi ikinä haluatkaan.
Hetki tuohon vielä menee, mutta uskon sen olevan jo näköpiirissä.
Eihän tuohon mitään tekoälyä tarvita - ihmisellä on mielikuvitus - liki jokaöiset uneni ovat mennen tullen parempia kuin 99,9% mistään elokuvista.
Siinä jäljelle jäävässä promillessa on muutamia helmiä.
Äsken MTV3-uutisissa oli juttu Kansallisarkiston tekstintunnistuspalvelusta, joka osaa 'lukea' vanhoja käsinkirjoitettuja kirkonkirjoja ym. melko hyvällä tuloksella.
Käytettiin kuitenkin sanaa 'tekoäly', vaikka kyse on aivan tavanomaisesta osaamisalueesta, hahmontunnistus/tekstintunnistus sovellettuna käsinkirjoitettuun tekstiin. Todennäköisesti siihen yhdistettynä tietokonelingvistiikkaa vähintään sanastovertailun ja ehkä myös lauserakenteen tarkistuksen muodossa etsittäessä pelkän tunnistustuloksen parhaita tulkintavaihtoehtoja.
Ei mitään uutta älyä tai keinotekoista sellaista. Tunnettuja algoritmeja ja lähestymistapoja, joille uusi tarkempi kuvantamistekniikka ja halpa pressointiteho on antanut mahdollisuuden tuottaa entistä parempia tuloksia.
Ehkä joitain oppimisalgortmeja on yhdistetty kokonaisuuteen eli paranee vanhetessaan jos saa palautetta. Ensiopetus on toki välttämätön - eli äly tulee siitä, ei mistään AIV-pullosta.
Kokeilen viime viikolla käyttää ocr:ää käsinkirjoitettuun tekstiin ja tulos oli erittäin huono. Voihan olla että tekoäly oppii paremmin tunnistamaan käsialaa, konekirjoitus- ja printattu/painettu teksti on siihen verrattuna paljon helpompihahmoista. Ja toki tekoälyllä voidaan sitten hallusinoida sisältöjä jos käsialasta ei saa selvää
Käsinkirjoitetun tekstin tunnistaminen vaatii huomattavan paljon opettamista verrattuna painettuun tai kirjoituskoneella tuotettuun tekstiin. Normaalisti OCR.tuotteet kompastuvat merkkien eristämiseen, jos alkuperäinen on epäselvää tai merkit kiinni toisissaan - kuten esimerkiksi kreikankielisessä tekstissä tuppaa olemaan. Silloin tunnistajalle täytyy opettaa merkkipareja tai jopa kolmikkoja.
Sanakirja- ja kielioppityökaluihin yhdistettynä tulokset paranevat - useiden tunnistushypoteesien joukosta valitaan se 'paras'.
Sama käsinkirjoitetun tunnistamisessa, opettaminen on vain kovin työläs prosessi jos opetusaineistoa ei ole valmiina olemassa.
Mutta ei se mitään tekoälyä ole, tunnettua tietotekniikkaa, malleja ja algoritmeja.
Hyvä huomio, mutta ei kannata vähätellä tekoälyn roolia. Vaikka hahmontunnistus perustuu vanhoihin konsepteihin, tekoäly tuo nopeutta ja tarkkuutta prosessiin, varsinkin kun se mukautuu oppimalla. Eiköhän anneta sille sen ansaitsema kunnia – kuitenkin aika iso askel ihmisen mielikuvituksen ulkopuolelle!
Pitäisi varmaan yrittää jättää tämä termi ’tekoäly’ johonkin joka vastaisi mielikuvaa ’älystä’. Matkiminen tai ennustaminen ei siihen yllä. Ihmisen suoritukset ovat olleet jo pitkään ylitettävissä mutta jatkuvasti yhä laajemmin.
Nykytilanteeseen sopiva määritelmä ’tekoälylle’ olisi mielestäni pelkästään ’tarkoitukseensa sopiva tietokoneohjelma’. Kyvykkyydet kasvavat, osin algoritmikehityksen mutta erityisesti oppimisalgoritmeihin liittyvän massiivisen mallikalibroinnin tultua mahdolliseksi kasvavan digitaalisen aineiston kautta. Ja tämä yhdistettynä digilaitteiden kasvavaan tehokkuuteen.
Jos termejä miettii, niin itse tietokone-termikin on harhaanjohtava.
Siitä huolimatta emme enää vähättele tietokoneen osuutta elämäämme - käyköhän tekoäly-termillekin samalla tavalla?
Viime päivinä on kohkattu kiinalaisesta ’tekoälystä’, DeeepSeekistä - jopa siinä määrin, että NVIDIAn - muidenkin - pörssikurssikin on heilahtanut.
Neuraaliverkoista ovat vissiin jenkeissä päässeet innostumaan rakennusinsinöörit. Sitten tulevat kiinalaiset matemaatikot ja jyräävät rakennusinsinöörien periaatteet.
Kun nuoruuteni tietokoneissa oli muistin koko 16 kilotavua tai 128 kilotavua, niin ohjelmissakin määriteltiin muuttujat huolellisesti - INTEGER8, INTEGER16, FP16, FP32 jne. - tarpeen mukaan. 8-bittinen kokonailuku vei yhden tavun, muut enemmän.
Nyt kiinalaiset ovat havainneet, että 8-biittisenä opetettu neuraaliverkko tuottaa aivan mainioita tuloksia - eikä opettamiseen tai opetuksen varastointiin tarvita 64 bitin lohkoja siirtäviä lämmittimiä.
Mielenkiintoista.
[Rakennusinsinöörin periaate - rauta korvaa järjen. Jos ei jonkin erikoismallisen rakenteen lujuutta osata laskea, pannaan betonin sekaan riittävästi rautaa.]