Guarani e outras 23 línguas passam a fazer parte do Google Tradutor

Texto de Guilherme Tagiaroli (Site UOL)

    Imagem: Paraesh Dave/ Reuters

    O Google Tradutor começa a oferecer a partir desta quarta-feira (11) a possibilidade de tradução em mais 24 idiomas que, segundo a empresa, são pouco atendidos pela tecnologia. O destaque fica por conta do guarani, que é falado no Paraguai, além de populações indígenas no Brasil, Argentina e Chile.

    Junto com o guarani, que é uma das línguas oficiais do Mercosul e falado por cerca de 7 milhões de pessoas no mundo, será adicionado ainda na plataforma de tradução quíchua e aimará, falados por povos nativos do Peru, Bolívia e Argentina. Estima-se 10 milhões e 2 milhões, respectivamente, falem esses dois idiomas.

    Como a tecnologia aprendeu os idiomas Segundo Isaac Caswell, engenheiro de software e pesquisador do Google, o diferencial na inclusão dessas línguas foi o uso de um modelo neural de inteligência artificial que aprendeu os idiomas “do zero”.

    Geralmente, para implementar uma nova língua, são necessários milhões de exemplos para um sistema “entender” e conseguir traduzi-la. Com o modelo neural, segundo Caswell, as línguas adicionadas foram treinadas dessa forma. A tecnologia passou a entender então como os idiomas funcionam.

    A empresa diz ter consultado representantes de diversas comunidades antes de liberar os novos idiomas.

    “Imagine que você é poliglota e que, baseado no seu entendimento de como as línguas são, consegue interpretar algo. É mais ou menos assim que opera nossa rede neural”, explicou o pesquisador em conversa com jornalistas.

    Planos futuros Num primeiro momento, as 24 línguas só estarão disponíveis para tradução textual. O Google tem planos de adicionar com o tempo a parte de voz, permitindo a tradução de alguém falando ou mesmo para facilitar o entendimento de quem tem curiosidade sobre a sonoridade das palavras.

      Imagem: Divulgação Google

      Ainda em conversa com jornalistas, Caswell disse que as línguas não estarão perfeitas logo de cara. “A qualidade é menor que o inglês e espanhol. Sabemos que haverá alguns erros, mas a ferramenta será útil”, afirmou.

      Fora da América Latina, o Google adicionou línguas como o krio, dialeto inglês de Serra Leoa, lingala (falado por 45 milhões de pessoas no centro da África, sobretudo na República do Congo) e mizo, falada por 800 mil pessoas no norte da Índia.

      As novidades se somam aos mais de 100 idiomas que o Google Tradutor já oferece.

      • aimará – falado por quase 2 milhões de pessoas na Bolívia, Chile e Peru.

      • assamês – falado por quase 25 milhões de pessoas no nordeste da Índia.

      • axante – falada por cerca de 11 milhões de pessoas de Gana.

      • bambara – falado por cerca de 14 milhões de pessoas de Mali.

      • boiapuri – falado por cerca de 50 milhões de pessoas no norte da Índia, Nepal e Fiji.

      • diveí – falado por cerca de 300 mil pessoas das Maldivas.

      • dogri – falado por cerca de 3 milhões de pessoas do norte da Índia.

      • jeje – falado por 7 milhões de pessoas de Gana e Togo.

      • guarani – falado por 7 milhões de pessoas no Paraguai, Bolívia, Argentina e Brasil.

      • ilocano – falado por cerca de 10 milhões de pessoas no norte das Filipinas.

      • concani – falado por quase 2 milhões de pessoas do centro da Índia.

      • krio – falada por quase 4 milhões de pessoas de Serra Leoa.

      • curdo sorâni – falada por cerca de 8 milhões de pessoas (a maioria delas do Iraque).

      • língala – falada por quase 45 milhões de pessoas na República do Congo, Angola, República do Sudão do Sul e República Centro-Africana.

      • uganda – falada por quase 20 milhões de pessoas em Uganda e Ruanda.

      • maitili – falada por quase 34 milhões de pessoas no norte da Índia.

      • mizo – falada por cerca de 830 mil pessoas no nordeste da Índia.

      • oromo – falada por 37 milhões de pessoas da Etiópia e do Quênia.

      • quechuá – falada por 10 milhões de pessoas no Peru, Bolívia, Equador e regiões próximas aos países.

      • sânscrito – falada por 20 mil pessoas na Índia.

      • sepedi – falada por cerca de 14 milhões de pessoas na África do Sul.

      • tigrínia – falada por quase 8 milhões de pessoas na Eritreia e na Etiópia.

      • tsonga – falada por cerca de 7 milhões de pessoas em Essuatíni, Moçambique, África do Sul e Zimbábue.

       

      Compartilhar

      Rodrigo Martins

      Deixe um comentário

      O seu endereço de e-mail não será publicado.

      Next Post

      sex maio 13 , 2022
      Texto: Facebook Comissão Pró-Índio de São Paulo Imagem (Comissão Pró- Índio de São Paulo- facebook)   Universidades reconhecem a importância de dois grandes pensadores indígenas com títulos de Doutor Honoris Causa! Ailton Krenak, liderança, filósofo e ativista, receberá o título da Universidade de Brasília (UnB), em homenagem que acontece hoje […]