Jak funguje Google překladač? | VímVíc.cz

Jak funguje Google překladač?

04. 07. 2019

Google překladač je nejznámějším a nejpoužívanějším volně dostupným strojovým překladačem na světě. V současné době dokáže překládat 104 jazyků, mezi nimi je například i esperanto nebo latina. V roce 2017 ho používalo 500 milionů lidí a můžeme si domyslet, že v současnosti bude toto číslo ještě mnohem vyšší. Vznikl v roce 2006, od té doby ušel dlouhou cestu a stále se zlepšuje, vysvětlíme vám, jak.

Jak fungoval Google překladač na začátku

Na začátku bylo slovo. Skutečně. První strojový překladač dostupný na webu byl Stystran od Xeroxu. Fungoval na principu porovnávání stejných textů ve více jazycích. Rozdělil text na slova a zjišťoval, jak se jedno slovo řekne v obou jazycích. Čím více textů „přelouskal“, tím byly překlady přesnější. Přicházel na to, že některá slova mají více významů a učil se ustálená slovní spojení, ale něco velmi důležitého mu scházelo. Byl to kontext.

Také Google translate dlouhou dobu fungoval na základě statistického překladu. Od svého vzniku až do roku 2013. Díky internetu měl Google přístup k obrovskému množství přeložených textů jako zákony, příručky, směrnice a dokumenty. Jedním zdrojem, který je přeložen úplně do každého jazyka je i Bible, jazyk v ní je ale zastaralý, a tak není pro současné překlady moc přínosná.

Jak funguje Google překladač nyní

Průlom přišel v roce 2016, kdy Google začal používat neurální strojové učení (anglicky Neural Machine Translation, zkráceně NMT), díky němuž pokročil od překládání frází k překládání celých vět. Umělá neuronová síť se učí podobně jako člověk. Můžeme si představit, že překladač má mozek, který se učí podobně jako malé dítě. Dokud mu nedáte žádné podněty, nic neumí. Neurální strojové učení získává informace dvěma způsoby - na základě pravidel a na základě odpozorovaného chování.

Překladač se procházením obrovského množství textu učí obvyklé používání jazyka. Na druhou stranu se ale učí i gramatiku a pravopis. Co je podstatné jméno, co přídavné, jaký je mezi nimi vztah a jak funguje ve kterém jazyku slovosled. Čím více textu překladač zpracuje, tím lépe umí s jazykem zacházet. Na rozdíl od statistických překladačů umí lépe pracovat s kontextem a zpětnou vazbou. .

Když se všechny tyto informace propojí, překlad je lepší, než kdy dříve. Neuronové sítě se neučí jazyk jako takový slovo po slově, ale spíše se snaží napodobit ve výsledném překladu zákonitosti a chování, které znají z textů, co zpracovali. Tento proces je nesmírně náročný na výpočetní výkon.

Problém nastává ve chvíli, kdy není v jazyku k dispozici dostatek tréninkových dat. Například taková somálština obecně nemá dostatek psaných textů. Ustálená somálská abeceda vznikla až v roce 1972. To je v porovnáním s Anglickou, která se datuje už k roku 602 propastný rozdíl. Proto je problém přeložit něco například ze somálštiny do finštiny. Textů, které by byly přeloženy do obou dvou těchto jazyků je velmi pomálu. Je tedy vždy jistější použít jako odrazový můstek angličtinu, pokud ji ovládáte.

Google překladač, Google translator,

Jak přesný je v současnosti Goole translate

Překladač celých vět je skvělý v případě, že vyrážíte na dovolenou do země, jejíž jazykem nemluvíte. Na to se mimochodem skvěle hodí i nově rozšířená kapacita vizuálních překladů. Nyní můžete pouhým vyfocením překládat cedule, jídelní lístky, nebo články v novinách z 89 jazyků.

Překladač se v zásadě dá použít i na překlad odbornějších cizojazyčných textů z jazyků, kterým rozumíte jen málo, nebo vůbec. Je fér říci, že ač se občas dopouští gramatických chyb, téměř vždy je z překladu jasná hlavní myšlenka.

Co ovšem nemůžeme doporučit, je překládání textů z češtiny do jiného jazyku s vírou, že text bude výsledek naprosto správný. Pokud posíláte důležitý e-mail, nebo píšete například životopis v angličtině a nejste si svou jazykovou vybaveností příliš jistí, vždy si najděte někoho, kdo vám dokument zkontroluje a opraví. Cit pro jazyk lidem vlastní zatím stroje nahradit nedokážou.

S Google překladačem se dá užít i zábava

Nebyli bychom to my, lidé, kdybychom nedokázali něco tak praktického jako překladač zneužít za účelem pobavení se. Možná jste zaregistrovali písně, které vytvářejí lidé za pomoci hlasitého předčítání Google překladače. Někdo se také baví tak, že vezme text písně, přeloží ho do málo rozšířeného jazyka jako například chorvatština a poté zpět do originálu. Samozřejmě tak vznikne text plný nonsensů významem velmi vzdálený tomu původnímu. Jimmy Fallon tuto podivnou disciplínu dokonce zahrnul do své Tonight Show.

Google translate songs - Jimmy Fallon Tonight show

Jak vidíte, přes veškerý pokrok má pořád strojový překlad prostor pro zlepšení. Pokud chcete rozumět cizím jazykům, nejlepší je se je naučit. A jestli nemáte čas docházet na lekce do jazykové školy, můžete zkusit třeba online kurzy.

Témata:

Ze života firem a kanceláří