Hasta no hace mucho Google Translate (Traductor de Google) era el claro referente a la hora de traducir cualquier tipo de texto tanto en dispositivos móviles como en PCs y portátiles conectados a internet. Sin embargo a finales de 2017 apareció un competidor singular en este ámbito: DeepL.
Ambos servicios son gratuitos y permiten traducción de texto entre distintas combinaciones de idiomas, y nosotros hemos querido evaluar su comportamiento y características para valorar cuál se puede ajustar mejor a cada necesidad.
La traducción ayudada por la inteligencia artificial
Los motores de traducción de estos servicios tienen un fuerte componente tecnológico. Google ya anunció en septiembre de 2016 el uso de un sistema de traducción automática llamado Google Neural Machine Translation (GNMTS) que está basado en las llamadas Redes Neuronales Recurrentes (RNN).
Este sistema ha permitido a Google mejorar de forma constante la calidad de las traducciones ya que en él no solo se toman en cuenta las palabras o las frases, sino también el contexto en el cual aparecen esas palabras y frases y qué otras aparecen cercanas a ellas.
Esa ha sido la clave de la traducción humana y la traducción automática, y de hecho en Google pronto renovaron ese motor con la llamada Zero-Shot Translation y un nuevo sistema de representaciones de vectores distribuidos en los que las frases a traducir iban traduciéndose entre distintos pares de idiomas para ir combinando esos resultados y ver si todas ellas tenían sentido entre sí.
Su rival, DeepL, hace uso también de sistemas de inteligencia artificial, y en concreto redes neuronales de convolución, algo distintas a las recurrentes.
En este servicio la empresa alemana que lo desarrolla se aprovecha de otro componente fundamental: su diccionario multi-idioma, el conocido, Linguee. Este proyecto ha permitido construir una base de datos enorme con la que el traductor automático DeepL puede trabajar para lograr resultados destacables en la traducción.
DeepL soporta menos idiomas, ¿es más preciso?
Una de las desventajas claras de DeepL es el número de idiomas soportados. A día de hoy DeepL cuenta con soporte para 9 idiomas, mientras que Google da soporte a nada menos que 103 idiomas.
Esa desventaja en cantidad parece contrastar con su ventaja en calidad. Según la propia empresa las traducciones obtenidas por DeepL fueron votadas como las favoritas en una evaluación a ciegas realizada por traductores humanos profesionales. Estos indicaron que el servicio de DeepL era superior al de otras herramientas como Google Translate (u otros como Microsoft Bing o el traductor de Facebook) por un margen de 3 a 1.
No solo esos traductores profesionales parecen preferir los resultados ofrecidos por DeepL: también lo hace un banco de pruebas llamado BLEU (PDF) que mide la precisión de la traducción y que por ejemplo para la traducción entre inglés y alemán obtuvo una puntuación de 31,1 puntos frente a los 28,4 de Google Translate.
Es ciertamente difícil afirmar si uno u otro es mejor, pero lo cierto es que en nuestras pruebas DeepL lleva sorprendiéndonos desde su aparición. Nuestros compañeros de Genbeta lo indicaron nada más aparecer en el que indicaban que DeepL ofrece una traducción "más natural" que Google Translate, y lo cierto es que en muchas ocasiones los resultados son comparables pero DeepL efectivamente suele ofrecer un tono "menos artificial".
Podemos experimentar con algunos ejemplos más o menos complejos. Uno especialmente duro es el de ese célebre comienzo de la obra magna de la literatura, 'Don Quijote de la Mancha', de Miguel de Cervantes. En ese inicio se leen las palabras originales "En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco y galgo corredor".
Al ofrecer el texto en inglés con la edición en inglés del Proyecto Gutenberg nos encontramos con un resultado bastante distinto entre Google Translate y DeepL. Como puede verse, ninguno de los dos lo hace especialmente bien, aunque Google si traduce con más precisión el "vivió no hace mucho tiempo", pero DeepL traduce mejor ese último "galgo corredor" que se asemeja más a aquella inmortal frase original.
Aún así se lo hemos puesto probablemente demasiado difícil a estos motores. Probemos con un texto algo menos complejo: el inicio de 'Cien años de soledad', de Gabriel García Márquez, también célebre, y que decía lo siguiente: "Muchos años después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo".
Si utilizamos la traducción que por ejemplo aprovechan en la web de los Premios Nobel y la pasamos por ambos traductores el resultado es el de la imagen. La de DeepL podría considerarse ligeramente mejor por el tiempo verbal (un 'recordaría' algo más preciso que 'recordaba') y también por la forma en la que este último expresa ese "al enfrentarse" más literario en lugar del "cuando se enfrentaba", más literal quizás.
Esos dos textos son complicados, pero si cogemos ejemplos algo más cotidianos de un periódico en inglés como The New York Times, podemos elegir una noticia reciente como esta y ver el resultado por parte de ambos sistemas de traducción:
De nuevo podemos ver cómo la traducción de DeepL es más natural al utilizar expresiones como "consiguió un respiro" y no el "tuvo un respiro" de Google Translate, pero sobre todo en palabras como "en un partido repleto" y no el "en un juego lleno" que parecen dejar claro que DeepL ofrece mayor precisión a la hora de reconocer el contexto y las palabras adecuadas para ese ámbito del que se habla.
Si nos vamos a una noticia tecnológica, podemos poner como ejemplo esta de hace unos días de The Verge en la que se habla de la nueva decisión de Tesla frente a su estrategia comercial y la cancelación del cierre de sus tiendas físicas.
En esta ocasión las cosas están menos claras y ambas traducciones son bastante similares en su precisión. Quizás es algo más acertada la de Google por detalles como reconocer que Model 3 es una marca comercial de Tesla y mantiene las mayúsculas, pero por otro lado en DeepL se traduce correctamente la forma de escribir el precio. Son pequeños detalles, y para traducciones más largas pueden determinar la confianza del usuario en esos sistemas de traducción.
Cantidad o calidad
Google es claramente superior a DeepL en ese número de idiomas soportados y en características útiles y muy llamativas como la posibilidad de traducir páginas web enteras (basta con introducir la URL en el campo de traducción), algo que DeepL no permite de momento.
El traductor de Google gana por tanto en cantidad, pero nuestra sensación es que pierde en calidad. En esas comparaciones que hemos hecho en la traducción del inglés al español DeepL es sensiblemente superior. Mi experiencia me dice lo mismo: llevo usando DeepL más de un año y en todo ese tiempo "me fío" más de esas traducciones que de las que hace Google Translate.
Evidentemente aquí puede haber casos en los que eso no sea así y perspectivas distintas, pero en cualquier traducción automática siempre habrá fallos importantes por las limitaciones de estos sistemas para reconocer el contexto, la jerga o la traducción más adecuada para una palabra en según qué situación.
Es ahí donde la supervisión humana es importante para lograr que esa traducción automática se vuelva más precisa y gane calidad. Y sin embargo, ambas propuestas son fantásticas por su carácter gratuito -DeepL tiene una versión Pro con algunas opciones interesanes- y su facilidad de uso y acceso.
Ver todos los comentarios en https://www.xataka.com.co
VER 0 Comentario