Región de Murcia
Fundación Séneca
FSE

Evaluación de métodos lingüístico-computacionales para la detección de la mentira en el lenguaje escrito. Un estudio contrastivo inglés-español.

Ángela Almela nace en Murcia en 1984. Es licenciada en Filología Inglesa (2007-2008) y en Traducción e Interpretación (2008-2009) por la Universidad de Murcia. En 2009 realizó el Máster en Lengua y Lingüística Inglesas: Aplicaciones Académicas y Profesionales, obteniendo la Suficiencia Investigadora con la tesis de máster Evaluación de Técnicas de Reconocimiento Automático de Términos Multipalabra en un Corpus de Sanidad Animal. Fue becaria predoctoral de la Fundación Séneca. Su labor investigadora se centra principalmente en Lingüística de Corpus y Computacional, Lingüística Forense y Traducción Asistida por Ordenador. Ha realizado dos estancias externas en el Instituto Interuniversitario de Lenguas Modernas Aplicadas de la Comunidad Valenciana (IULMA) de la Universidad de Valencia en 2010 y en la Fondazione Bruno Kessler (Italia) en 2011. Es doctor desde diciembrede 2012 por la Universidad de Murcia. Actualmente está contratada en  la Universidad Católica San Antonio de Murcia.

Resumen de tesis

La distinción entre el lenguaje de la verdad y la mentira ha suscitado numerosos estudios desde el campo de la lógica formal y la investigación psicológica. Estudiosos de la kinésica han probado que la comunicación no verbal juega un papel principal en la detección de la mentira. Sin embargo, el estudio de los rasgos exclusivamente lingüísticos en este tipo de interacción es un fenómeno apenas estudiado.
En este marco de investigación, el presente trabajo explora las similitudes y diferencias entre los rasgos lingüísticos propios del engaño en el medio escrito en lengua inglesa y española. Para el análisis, se han compilado dos corpora en los que se recogen testimonios verdaderos y falsos de 100 participantes y se ha procedido a su procesamiento lingüístico-computacional y estadístico atendiendo a las variables más frecuentemente estudiadas en el área de la estilometría. Además de ello, se han realizado experimentos con ciertas variables no exploradas en la literatura anterior para tal fin, obteniendo resultados ciertamente prometedores en lo referido a su aplicación en el ámbito forense.

Área de conocimiento

Lingüística computacional

Grupo de investigación

LACELL (Lingüística Aplicada Computacional, Enseñanza de Lenguas y Lexicografía)
Director: Pascual Cantos Gómez

Programa de doctorado

Lengua y lingüística inglesas: aplicaciones académicas y profesionales

Período de Actividad

01/01/2010 - 31/12/2012

Estado de tesis

Defendida

Principales indicadores de producción científico/tecnológicos

Almela, A., Valencia-García, R. & Cantos, P. (2012). Seeing trough deception: A computational approach to deceit detection in written communication. Comunicación oral presentada en EACL 2012 Workshop on Computational Approaches to Deception Detection. Abril, Avignon (Francia).

Almela, A., Valencia-García, R. & Cantos, P. (2012). Detectando la mentira en lenguaje escrito. Revista de Procesamiento de Lenguaje Natural, 48 (en prensa).

Orts, M.A. & Almela, A. (2012). Deep into the Discourse of the Spanish Crisis: The Deployment of English Lexical Incorporations to Translate the Untranslatable. Ibérica, 23 (en prensa).

Almela, A. (2012). La evaluación de la calidad del discurso turístico traducido en Internet. En J. Sanmartín (Ed.), Discurso turístico e Internet: normas y usos, pp. 261-286. Madrid: Editorial Iberoamericana Vervuert.

Ochoa, J.L., Almela, A., Hernández-Alcaraz, M.L. & Valencia-García, R. (2011). Learning Morphosyntactic Patterns for Multiword Term Extraction. Scientific Research and Essays, 6(26): 5563-5578. 

Resultados mas destacados de la tesis doctoral

Hasta el momento, en la presente investigación se ha utilizado un clasificador automático para el reconocimiento de la mentira en textos escritos en lengua española, utilizando para su entrenamiento las categorías psicolingüísticas de la aplicación LIWC (Pennebaker et al., 2001). A través de un experimento llevado a cabo sobre cuatro conjuntos de datos, se ha probado que es posible separar los textos en dicha lengua de acuerdo con su condición de verdad, siendo las dos primeras dimensiones, procesos lingüísticos y psicológicos, las más relevantes para tal fin.

La investigación futura en esta línea incluirá una comparación de la metodología empleada con un sistema bag-of-words, en el cual el texto se represente como una colección desordenada de elementos al margen de factores lingüísticos como la gramática. Además de ello, se están comparando los resultados de la presente investigación con la aplicación de la misma metodología de análisis a un corpus en inglés, con el fin de elaborar un estudio contrastivo basado en las diferencias y similitudes lingüísticas de ambos idiomas.

Pennebaker, J. W., M. E. Francis, y R. J. Booth. 2001. Linguistic Inquiry and Word Count. Mahwah (NJ): Erlbaum Publishers.

Estancias anteriores

Ha realizado dos estancias externas, una en el Instituto Interuniversitario de Lenguas Modernas Aplicadas de la Comunidad Valenciana (IULMA) de la Universidad de Valencia en 2010 bajo la supervisión de la Dra. Francisca Suau Jiménez para investigar en lingüística de corpus y colaborar en el desarrollo de herramientas y aplicaciones lexicográficas.

Y en la Fondazione Bruno Kessler (Trento, Italia) en 2011 bajo la supervisión del Dr. Carlo Strapparava para investigar en lingüística computacional e iniciar el análisis del corpus recopilado para la tesis doctoral

Aviso legalPolítica de privacidad