Choose your language
Eleka desenvolveu uma versão melhorada de Matxin, o tradutor automático para o par de línguas castelhano-euskera
15/12/2009
O desenvolvimento da versão melhorada do tradutor automático para o par de línguas castelhano-euskera foi realizada em colaboração com a Fundação Elhuyar e o grupo IXA da UPV/EHU.
Passaram cinco anos desde que a Eleka Ingeniaritza Linguistikoa, SL começasse a desenvolver a plataforma Opentrad de tradução automática em código aberto junto com empresas e universidades da Galiza e dos Países Catalães. (www.opentrad.com). A versão melhorada de Matxin (castelhano-euskera) faz parte da plataforma Opentrad, onde se utilizaram diversas técnicas de tradução.
A apresentação realizada hoje no Koldo Mitxelena Kulturunea tem contado com a participação de Inaki Irazabalbeitia (gerente de Eleka), de Josu Waliño (diretor de projetos da Fundação Elhuyar) e de Iñaki Alegria (do grupo IXA da UPV-EHU). Tal e como se mencionou, a versão que se mostrou hoje é a evolução da versão anterior do tradutor automático para o par castelhano-euskera.
Matxin é uma aplicação de código aberto, e faz parte da plataforma Opentrad. A versão renovada que se apresentou hoje mostra duas características particulares. Por uma parte, melhorou-se o tradutor de castelhano a euskera. Isto é, esta é uma versão renovada do protótipo que se apresentou em 2006, e cabe destacar que tem melhorado notavelmente sua qualidade na tradução. Por outra parte, criou-se o primeiro protótipo do tradutor Matxin para a direção euskera-castelhano. Os dois tradutores podem ser utilizados de forma gratuita na página www.opentrad.com.
No mundo da tradução automática utilizam-se dois métodos para a tradução: o que está baseado nas regras sintáticas e o estatístico. O sistema baseado em regras funciona com informação linguística, isto é, criam-se regras segundo a estrutura sintática do idioma. Pelo contrário, o sistema estatístico baseia-se em traduções já realizadas com anterioridade, e utiliza esses dados à hora de realizar as traduções. No caso de Matxin desenvolveram-se e integrado as duas técnicas para a combinação castelhano-euskera; e só se utilizou o método estatístico para a combinação euskera-castelhano.
O valor acrescentado mais importante de Matxin para o par castelhano-euskera é que faz parte do sistema de código aberto Opentrad. Portanto, o motor de tradução castelhano-euskera fica ao serviço da comunidade após seu desenvolvimento. Assim, qualquer utente poderá adaptá-lo às suas necessidades, sem ter que pagar nenhuma licença.
Pode-se aceder ao motor desenvolvido por Eleka na página www.opentrad.com.
Expressaram-se mostras de agradecimento às prefeituras de Donostia-São Sebastião, de Vitória-Gasteiz e de Arrasate, a IVAP, a Eroski, a EiTBNET e à revista Aldaketa 16, pelas memórias de tradução que prestaram, já que têm sido de grande utilidade para o treinamento do sistema estatístico.
Esta iniciativa foi subvencionada pelo Departamento de Indústria, Comércio e Turismo do Governo Basco, e pelo Ministério de Indústria, Turismo e Comércio, com os programas Gaitek e Profit, respectivamente.


