Tekoäly (AI) ja konekääntäminen kehittyvät koko ajan ja kovaa vauhtia. Onkin syytä kysyä: miksi maksaa kääntäjälle, jos Google Translate tekee saman työn ilmaiseksi? Tai miksi palkata toimittaja, jos Chat GPT:n teksti näyttää ihan hyvältä? Selvitimme, millä tasolla AI-kääntäminen tällä hetkellä oikein on.
Suomen kielen rakenne on moniin ”maailmankieliin” verrattuna monimutkaisempi – jo pelkästään sijamuotojen määrän tai astevaihtelun vuoksi. Lisäksi suomen kielellä on vähemmän puhujia ja suomenkielinen tekstikorpus ylipäänsä on pienempi kuin suurilla kielillä. Siksi tarkkaan ja luonnolliseen tulokseen pääsevää konekäännöstä on toistaiseksi vaikea saavuttaa. Tekoäly
- ei tunnista useinkaan sanontoja
- ei pysty tuottamaan aina luonnollista ilmaisutapaa
- tekee suoria käännöksiä ja joskus jopa virheitä.
Katsotaan seuraavaksi, missä tämänhetkinen (marraskuu 2024) tekoäly todennäköisimmin erehtyy.
Kääntää sanat mutta ei ajatusta
Tekoäly- ja konekääntämisen perusongelmia on se, ettei mikään suosituimmista käännöspalveluista pysty kääntäessään ottamaan huomioon koko kontekstia. Se ei ”ymmärrä” kokonaisen tekstin ajatusta. Tekoälyllä on edelleen vaikeuksia huomata piilomerkityksiä ja erotella tärkeä vähemmän tärkeästä.
Otetaan esimerkiksi tällainen lause: This is considered the ultimate morphine drip.
- Google Translate: Tätä pidetään äärimmäisenä morfiinitippauksena.
- Chat GPT 4o: Tätä pidetään äärimmäisenä morfiini-infuusiona.
Sananmukaisesti kumpikin käännös on oikein (vaikkakin ”tippaus” on aivan siinä rajoilla), mutta lopputulos jotenkin kankea ja ajatus jää hämäräksi. Morfiini, tiputus ja infuusio ovat meikäläisessä kielenkäytössä melko silmiinpistäviä käsitteitä. Lisäksi herää kysymys, millainen olisi se ”ei-äärimmäinen” tiputus. Tämänkaltaisia metaforia ei kannata eikä saa kääntää sanasta sanaan. Sen sijaan on välitettävä lauseen ajatus. Morfiini lievittää kipua ja puuduttaa, joten ihminen voisi muotoilla lauseen tähän muotoon: ”Tätä pidetään kaikkein voimakkaimpana puudutusaineena.”
Tühi rida
– Google Translate: Säilyttääksesi ystävyytesi keskeytät epäuskon.
– Chat GPT 4o: Jotta säilyttäisit ystävyytesi, laitat epäuskon hetkeksi sivuun.
Konekäännökset ovat tosiaankin aivan kuin suomea, mutta ovatko ne ymmärrettäviä tai luontevan kuuloisia? Ilman alkukielistä lausetta niitä voi olla vaikea ymmärtää. Tässä esimerkissä Chat GTP on onnistunut melko hyvin. Luontevalla suomen kielellä sanottaisiin jotakin sellaista kuin: ”Ystävyyden hyväksi epäilyt on joskus unohdettava.” Usein sivulauseen ja päälauseen vaihtaminen tekee virkkeestä suomalaiselle helppolukuisemman: ”Epäusko kannattaa joskus unohtaa, jos haluaa säilyttää ystävyyden.”
Seuraava esimerkki on helppo kuvitella mielessä: The regiment was inspected by the general, all members in full dress.
- Google Translate: Kenraali tarkasteli rykmentin, kaikki jäsenet täydessä pukeutumisessa.
- Chat GPT 4o: Rykmenttiä tarkasteli kenraali, kaikki jäsenet täydessä pukeutumisessa.
Kummassakin käännöksessä on useita ongelmia. Ensinnäkin kenraali tarkastaa paraatijoukot, ei ”tarkastele”. Chat GPT:n sanajärjestys ”Rykmenttiä tarkasteli kenraali” eikä ”Kenraali tarkasteli rykmenttiä” on outo, vaikka sitä ei suoralta kädeltä vääräksi voi sanoakaan. ”Täydessä pukeutumisessa” on sen sijaan virheellinen ilmaus – eihän näin sanota! ”Täysissä pukeissa” tai ”täysin pukeutuneena” on oikeaa suomea, mutta kontekstista ilmenee, että ei ole kysymys siitä, onko rykmentti kokonaan pukeissa, puolipukeissa (vai peräti alasti). Englannin full dress tarkoittaa nimittäin paraatipukua. Tämä lause voisi olla suomeksi siis: ”Kenraali tarkasti rykmentin, joka oli paraatipuvussa.” Tai: ”Kenraali tarkasti paraatipuvussa olevan rykmentin.”
Tekoälykäännöksen vierasperäiset rakenteet
Tekoäly tekee kääntäessään paljolti samanlaisia virheitä kuin ihminen kääntäjänuransa alussa. Kumpikin nimittäin takertuu liiaksi alkutekstin rakenteisiin, koska pelkona on, että jos tekstiä muuttaa liikaa, myös alkutekstin ajatus muuttuu.
Esimerkkinä tyypilliset kysyvät lauseet:
- It’s hot today, isn’t it? –> Tänään on kuuma, eikö olekin?
- You like me, do you? –> Pidätkö minusta, pidäthän?
- I think he should try harder, shouldn’t he? –> Minusta hänen pitäisi yrittää enemmän, eikö niin?
Google Translate kääntää uskollisesti myös tällaiset englannissa tyypilliset tag-questionit eli ”liitekysymykset”, vaikka niitä suomessa ei juuri käytetä. Ne kuulostavat jotenkin ”brittiläisiltä”. Vain harvoin suomalainen haluaa tällä tavoin korostaa sitä, että hän haluaa kuulla keskustelukumppaninsa mielipiteen asiasta. Lisäksi kysymyksessä Pidätkö minusta? kumppanilta kysytään asiaa suoraan eikä sitä tarvitse erikseen korostaa. Suomalaisen kielenkäytön mukaisia käännöksiä olisivat esim.: Onpa tänään kuuma. Taidat pitää minusta. Minusta hänen pitäisi yrittää enemmän. Vai mitä?
– Google Translate: Haluat ehkä viettää enemmän aikaa opiskeluun ja vähemmän aikaa videopelien pelaamiseen.
– Chat GPT 4o: “Voisit haluta käyttää enemmän aikaa opiskeluun ja vähemmän aikaa videopeleihin pelaamiseen.”.
Englannin verbimuoto might pehmentää sanomaa, joka on ”Sinun pitäisi käyttää enemmän aikaa opiskeluun…” Tässä Googlen käännös oikeastaan onnistuu hyvin. Suomalainen voisi ilmaista asian kysymyksellä: ”Haluatko ehkä käyttää enemmän aikaa opiskeluun…?”
Kumpaankin konekäännökseen on livahtanut kömpelö rakenne ”viettää aikaa opiskeluun ja pelaamiseen”, sen sijaan että sanottaisiin luontevasti käyttää aikaa opiskeluun ja pelaamiseen.
Suomalaisilla on tapana käyttää seuraavaa, englantilaisperäistä pehmentävää miksi-kysymystä:
- Why don’t you just wait, and I’ll get you some coffee?
- Chat GPT 4o: Entä jos odotat, niin minä haen sinulle kahvia?
- Google Translate: Miksi et vain odota, niin tuon sinulle kahvia?
Muodollisesti ihan kelvollisia käännöksiä, mutta suomalaisessa kielenkäytössä hyvinkin kömpelöitä. Suomalainenhan sanoisi jotakin tällaista: ”Odotapa vähän, niin tuon sinulle kahvia.”
Tühi rida
Vanha tuttu ”varustelun adessiivi”:
–
– Chat GPT 4o: Pulla manteli- ja vaniljatäytteellä.
– Google Translate: Vehnäsämpylöitä manteli- ja vaniljatäytteellä.
Varustelun adessiivista eli myymäläadessiivista suomalaisia on varoiteltu jo yli sata vuotta, mutta se on niin helppokäyttöinen ja lyhyt, että se ei ole hävinnyt mihinkään. Kielenhuolto kehottaa tällaisissa tapauksissa käyttämään joko yksinkertaista ja-rakennetta (vehnäpullia ja manteli- ja vaniljatäytettä) tai adjektiivimääritettä (manteli- ja vaniljatäytteisiä pullia). Ja-rakenne on helppo ja lyhyt käyttää, erityisesti ravintola-annosten kääntämisessä, esim. pastaa, kylmäsavulohi-kermakastiketta ja aurinkokuivattuja tomaatteja. Esimerkkilauseessamme kaksi ja-sanaa peräkkäin kuulostaa kömpelöltä. Sen sijaan adjektiivirakenne on luonteva ja toimiva – mutta sen ongelmana vaikealukuisuus, jos pitää muodostaa pitkiä yhdyssanoja ja pidempiä luetteloita, esim. ”mantelin, kanelin ja vaniljan makuisella täytteellä täytettyjä pullia”.
Englannin with– ja ruotsin med-rakenteet on kääntäjän tai toimittajan mietittävä joka kerta erikseen, sillä rakenteita käytetään hyvin erilaisissa yhteyksissä. Kirjoitanko ”lihapiirakka kaikilla mausteilla” tai vain ”lihapiirakka, kaikki mausteet”? Esimerkiksi ”kaikilla mausteilla varustettu lihapiirakka” on mahdoton. Sen sijaan kaikilla lisävarusteilla varustettu Volvo on eri asia, mutta haittana on ”varustelun” toistuminen. Usein voi käyttää myös joka-lausetta: District with good transport connections and plenty of parks voisi olla suomeksi kaupunginosa, jossa on hyvät kulkuyhteydet ja paljon puistoja.
Tühi rida
AI-kääntäminen: muotisanoja ja sudenkuoppia
Valitettavan usein vierasperäiset käännöslainat ovat yleistyneet siinä määrin, että ne tuntuvat ihan kotoiselta kieleltä. Niitä näkee somessa, kuulee radiossa ja televisiossa ja niitä vilisee omien lastemmekin puheessa. Ei siis ihme, että myös tekoäly sortuu samoihin sanankäänteisiin.
Se, että jokin ilmaus on yleinen, ei tee siitä kuitenkaan hyvää tai hyväksyttävää.
Esimerkkinä seuraavat:
- Massive winds continue to wreak havoc.
- Google Translate: Massiiviset tuulet jatkavat tuhojaan.
- Chat GPT 4o: Valtavat tuulet jatkavat tuhoa.
Muotiadjektiivi massiivinen tarkoittaa nykyään melkein mitä vaan suurta, voimakasta ja vaikuttavaa. Nykysuomen sanakirjassa sen merkityksiä ovat ’massaltaan suuri, jykevä, järeä, raskas’ tai ’hyvin laaja tai runsas’. Näitä merkityksiä ei tarvitse venyttää paljon, että voi puhua ”massiivisista tuulista”, mutta hieman kyseenalaista se silti on. Chat GPT onkin vaihtanut massiivisen valtavaan.
Tühi rida
–
– Chat GPT 4o: Sinun pitäisi todellakin lisätä tämä kauneusrutiiniisi.
– Google Translate: Sinun pitäisi todella lisätä tämä kauneusrutiiniisi.
Kielitoimiston sanakirjan mukaan rutiini tarkoittaa tottumusta, taitoa, (mekaanista) osaamista tai tavanomaista työjärjestystä (työpaikalla). Mainoskielessä taas puhutaan paljon ”unirutiineista”, ”suunhoitorutiineista”, ”arkirutiineista”, vaikka monessa yhteydessä voitaisiin puhua nukkumistavoista, suunhoidosta tai lyhyesti vain arjesta.
Toinen ongelma esimerkkilauseessa on suomalaiselle jopa tunkeileva pitäisi tehdä näin, sen sijaan että sanottaisiin: kannattaisi tehdä. Suomalainen voisi muotoilla kyseisen mainoslauseen vaikka näin: ”Sinun tosiaankin kannattaisi lisätä tämä jokapäiväiseen kauneudenhoitoosi.”
Tühi rida
Lopuksi hyvin suosittu muoti-ilmaus, joka sekin on suora käännöslaina englannista:
- We are open for dialogue,“ she said.
- Chat GPT 4o: ”Olemme avoimia keskustelulle”, hän sanoi.
- Google Translate: ”Olemme avomia dialogille”, hän sanoi.
Kukapa ei nykyään sanoisi olevansa ”avoin yhteistyölle”, ”avoin uusille mahdollisuuksille”, ”avoin eri vaihtoehdoille” tai ”avoin haasteille”? Nämä ovat kuitenkin anglismeja, ja ne voidaan kiertää eri tavoin suomeksi: olen valmis yhteistyöhön, odotan uusia haasteita, harkitsen eri vaihtoehtoja tai olen valmis kohtaamaan haasteet.
Tekoälykääntämisessä vastuu on ihmisellä
Yhteenvetona voidaan sanoa, että tekoälyn tekemä käännös voi olla kielellisesti kömpelö ja sisällöltään jopa virheellinen – mutta myös ihan kelvollinen teksti. Jos käännät tai toimitat tekstejä, sinun on oltava hyvin perillä kielen eri vivahteista. Jos olet vähänkin epävarma, kannattaa pyytää arviota ammattitaitoiselta kääntäjältä tai toimittajalta.
Joskus tuntuu siltä, että englannista lainattua ilmausta on vaikea korvata jollakin suomalaisella tai omakielisellä. Usein ongelma johtuu siitä, että kääntäjän omassa sanavarastossa on vielä kehittämisen varaa – sama pätee käännösteknologian käytössä olevaan tekstikorpukseen. Siinä missä ihmisen sanavarasto karttuu lukemalla, myös konekäännösten laatu riippuu siitä, miten laadukas on teksti, johon koneiden käyttämät tekstikorpukset perustuvat.
Vain tämän kuun loppuun alennus jopa 20%