ESTUDIOS DE CORPUS MULTIMODAL

GRUPO DE INVESTIGACIÓN TRACCE

LINEAS DE INVESTIGACIÓN: ESTUDIOS DE CORPUS MULTIMODAL

El uso de corpus supuso el nacimiento de la lingüística y por tanto de la traductología como ciencia empírica. Para ofrecer una base científica sólida a la investigación sobre cómo crean significado los textos multimodales es necesario recopilar una colección extensa de datos que la avalen. Además, para que los datos nos permitan responder de forma rápida a diferentes tipos de cuestiones, así como extraer conclusiones fiables, el corpus debe ser una colección de textos reales y representativos de una clase textual. La calidad de los resultados dependerá siempre del tamaño y del diseño del corpus, según sus objetivos y, finalmente, de la capacidad de poder ser anotado (Jiménez 2010: 57). El análisis de corpus multimodal es uno de los métodos utilizados para la investigación en traducción audiovisual (Olohan 2004), y, por tanto, en las modalidades de traducción accesible.

Una de las líneas prioritarias de TRACCE es el análisis de corpus multimodal. Se trabaja en dos tipos de corpus multimodal:

  • TRACCE_AD que consiste en un corpus multimodal anotado de películas audiodescritas
  • TRACCE_SpS, un corpus multimodal anotado de películas subtituladas para personas sordas

Consiste en un corpus multimodal anotado de aproximadamente 300 películas audiodescritas en español (más un total de 50 en alemán, inglés y francés), así como de la transcripción de sus respectivos guiones audiodescriptivos (GAD).

Estos GAD son el principal objeto de estudio, la base del etiquetado semántico y el fundamento de la base de conocimiento.

El grupo TRACCE crea el marco conceptual subyacente al sistema de etiquetado semántico dividido en tres niveles. Esta subdivisión del etiquetado, que atiende a los diferentes lenguajes que componen de texto audiodescrito, permite establecer comparaciones para buscar parámetros y equivalencias pertinentes entre los distintos esquemas —narratológicos, cinematográficos y gramaticales— que interactúan en los textos fuente y meta del proceso audiodescriptor: el filme audiodescrito y el GAD, respectivamente.

Este sistema de etiquetado múltiple del texto audiodescriptivo ha posibilitado la identificación y codificación de ciertas pautas morfosintácticas, léxico-semánticas y pragmático-discursivas presentes en la traducción intersemiótica que representa el proceso audiodescriptor, así como la automatización y sistematización de dicha información para su posterior estudio y explotación. Las siguientes figuras representan los mapas conceptuales correspondientes a los tres niveles que conforman el sistema de etiquetado semántico, a saber, Narración, Imagen y Gramática (véanse las Figuras 3, 4 y 5).

 

TRACCE_SpS es un corpus representativo de textos multimedia accesibles para personas sordas, que se creó con el fin de describir el proceso semántico y cognitivo implicado en la traducción del sonido a palabras. Está compuesto por cincuenta y dos películas con subtitulado para personas sordas y se ha dividido en tres subcorpus. El primero está formado por películas que integran la colección de DVD Cine para Todos (2012); el segundo está compuesto por películas subtituladas por la empresa Navarra de Cine junto con la colaboración de la Fundación Orange ambos muy comprometidos con la accesibilidad de los textos fílmicos. Por último, el tercer grupo lo componen películas realizadas por otras empresas (El País, A Contracorriente Films S.L) y que no han sido validadas por los usuarios.

TRACCE_SpS crea un sistema de etiquetado en dos niveles específicamente pensado para los dos objetivos del proyecto: el análisis de la selección de contenidos acústicos en el TO que realiza el subtitulador y las estrategias traductoras que aplica para ello.

El cruce de etiquetas entre niveles, modo audio (nivel 1) y estrategias de traducción (nivel 2), permite generar datos acerca de CÓMO se traduce cualquier tipo de elemento acústico que haya sido anotado, así como observar las estructuras lingüísticas resultantes. En realidad, el objetivo de este cruce es relacionar la tríada compuesta por la selección de tipo de sonido, activación de estrategia traductora y la expresión lingüística utilizada en el subtitulado.