Jak africké jazyky jsou digitální

Cizí jazyky a Internet (Červen 2019).

Anonim

Digitalizace afrických jazyků je složitý, ale nezbytný proces. Nyní akademičtí pracovníci a společnosti z oblasti informačních technologií z celého světa spolupracují na integraci nových jazyků do různých forem softwaru a technologií.

Přestože se na celém světě vyskytují tisíce jazyků (mnoho z nich v Africe samotných), několik, stejně jako angličtina, je stále všudypřítomné - zejména pokud jde o digitální nástroje a technologie. Donedávna byly nástroje pro překlad, pravopis a gramatiku zaměřeny především na běžné západní jazyky. Toto zaměření se začalo posunout, i když pomalu, k tomu, aby se více afrických jazyků digitalizovalo.

Vývoj technologie lidských jazyků

Domorodé africké jazyky historicky nedostaly stejné uznání, pokud jde o technologickou integraci. Nicméně, protože technologie nadále proniká na nové africké trhy, více společností vidí potřebu zlepšit technologii lidských jazyků (HLT) na kontinentu. To je důležité pro pokračující technologický rozvoj i pro zachování základního kamenu kultur v digitálním věku.

Podle Arizonské univerzity se jazyky a informační technologie pravidelně setkávají po celém světě, a proto je potřeba vědního výzkumu a vývoje: "Kdekoli se jazyk dotýká informačních technologií nebo kde lidé potřebují komunikovat s počítači, jazykové potřeby (organizované) tak, aby bylo možné manipulovat a zpracovávat výpočetními prostředky. To často vyžaduje široké znalosti nejen o lingvistice a způsobu fungování jazyků, ale také o informatice a příbuzných oborech. "

Tech giganti investují do afrických jazyků

Výsledkem toho je, že mnoho velkých společností, včetně technologických gigantů, jako je Facebook a Google, investuje do HLT pro africké jazyky (a to pouze za účelem zvýšení jejich tržního dosahu a zisku). První znatelné změny přinesly schopnost používat Google v různých africkém jazyce. Některé společnosti, jako je Microsoft, také zahrnují africké jazyky do kousků a gramatických nástrojů.

Existují však ještě vážné nedostatky a je zapotřebí mnoho práce. Jak to zdůrazňuje badatelka Maria Keetová, přesně a smysluplně integrovat nové jazyky s technologií je spíše než jen přejetím přepínače a místo toho vyžaduje integrovaný přístup: "Jaký je důvod hledání webu, řekněme (jihoafrický jazyk) isiXhosa při v isiXhose je jen málo online dokumentů a algoritmy vyhledávače nemohou stejně dobře zpracovávat slova, a proto nevracejí výsledky, které hledáte? "

Složitější, než se zdá

Keet zdůrazňuje, že je zapotřebí nástrojů pro zpracování textu tak, aby tyto jazyky začlenily do pravopisných kousků, aby pomohli všem - od školních dětí až po odborníky - psát dokumenty, dokumenty, zprávy a e-maily ve svém rodném jazyce.

Digitalizace jakéhokoli jazyka je komplikovaná a vyžaduje rozsáhlý výzkum a testování, než dosáhne etapy automatické implementace. Africké jazyky vyžadují výrazně více práce než angličtina.

Zatímco základní pravidla syntaxe byla použita k digitalizaci anglického jazyka, mnoho afrických jazyků sestává z vět, které jsou velmi závislé na kontextu situace, mají složité slovesa a věty struktury, a proto nejsou snadno otevřené automatickým nástrojům pomocí strukturovaných dat.

Výsledkem je, že výzkumníci musí vytvářet gramatické motory, které generují základní věty. Tyto algoritmy spouštějí složité algoritmy, které čerpají z existujících textů, což přináší řadu dalších otázek.

Krmení existujících textů

Jádrem všech digitálních jazykových znalostí jsou již existující texty a tyto algoritmy se na nich podílejí. Umístění a porovnávání těchto textů je pro mnoho afrických jazyků obtížné, vzhledem k historickému zkreslení západních jazyků, pokud jde o publikování.

Navzdory těmto potížím organizace na celém kontinentu začínají identifikovat a shromažďovat vysoce kvalitní dokumenty v rodném jazyce, které zahrnují nejen přesný pravopis a gramatiku, ale jsou také modernější, aby byly dnes považovány za důležité. Bez tohoto kulturního kontextu, softwarové algoritmy riskují, že jsou nejlépe nepřesné a necitlivé a v nejhorším případě jsou zcela rasistické.

Velká data a kombinované úsilí

Většina procesu se tedy spoléhá na velké údaje a na společné úsilí několika různých stran, od výzkumných pracovníků až po tech giganty. Jelikož některé organizace identifikují příslušné texty, experti afrických jazyků pracují na algoritmech, které je mohou přesně přeložit. Technologické společnosti je pak integrují do stávajících projektů a pomáhají rozvíjet nové nástroje, které pomohou těm, kteří je potřebují nejvíce.

A již dosahují pokroku - některé jazykové kouzelníky afrických jazyků nyní dosahují míry přesnosti až 80%, podle jedné studie.

Přestože proces digitalizace afrických jazyků je komplikovaný a vyžaduje spolupráci několika významných osob a organizací, dopad je dalekosáhlý. Zatímco jistě bude hrát významnou roli při zachování kultur, vzdělání a každodenním životě lidí, kteří používají digitální nástroje, jsou také obrovské rozdíly na své nejzákladnější úrovni - bude to mít přímý dopad na kvalitu života, zejména v oblastech jako je zdravotní péče, protože technologický pokrok může pomoci překonat jazykové bariéry mezi lékaři a pacienty.