PSICOLOGÍA DEL TESTIMONIO: INVESTIGACIÓN EN EL ANÁLISIS DE CREDIBILIDAD Y SU UTILIDAD EN LA PRÁCTICA PERICIAL PSICOLÓGICA

Los procedimientos de análisis de la credibilidad de las declaraciones de menores posibles víctimas de agresiones sexuales fueron esbozados por primera vez por Arntzen (1970), en Alemania, y Trankell (1972), en Suecia. Posteriormente serían revisados y ampliados, entre otros, por Undeutsch (1982), Steller y Koehnken (1989). Aunque Undeutsch ha sido considerado el padre de estas técnicas, por ser el primero en publicarlas en inglés (Undeutsch, 1982) y difundirlas en el congreso internacional sobre credibilidad, auspiciado por la OTAN y celebrado en Maratea (Italia) en 1988. En castellano se darían a conocer unos pocos años después (Manzanero y Diges, 1992, 1993; Manzanero, 1996, 2001) y desde entonces se han realizado exhaustivos trabajos sobre su validez (para una revisión ver Manzanero, 2010).

En el momento actual, la técnica más utilizada en el contexto forense español para valorar la credibilidad del testimonio de menores presuntas víctimas de abuso sexual infantil es el Sistema de Análisis de la Validez de las declaraciones (Statement Validity Assessment; Steller y Köhnken, 1989; Raskin y Esplín, 1991). Esta técnica se compone de tres elementos principales: una entrevista al menor dirigida a obtener un testimonio lo más extenso y preciso posible; análisis del relato del niño bajo los criterios de realidad (CBCA); y aplicación de la Lista de Validez que pondera factores externos al relato.

En general, todos los procedimientos propuestos para el análisis de credibilidad emplean un conjunto de criterios para discriminar si la declaración es producto de un hecho experimentado por el menor, de la fantasía o de la sugestión. Hasta hace unos años comúnmente se había considerado que se trataba de criterios de realidad (Steller y Koehnken, op. cit. ), debido a que se había propuesto que su presencia indicaría que el relato era creíble. Sin embargo, las investigaciones realizadas durante la última década nos indican que este supuesto no es válido, aunque de esa forma se siguen considerando en entornos aplicados, de modo que la presencia de cada criterio se toma erróneamente por un indicador de veracidad. Por ejemplo, si las declaraciones aparecían completamente estructuradas se concluía que era un síntoma de poca credibilidad, sin tener en cuenta que la estructuración depende no solo del origen del relato sino también del número de veces que la víctima ha descrito los hechos, del tipo de preguntas que se utilicen en la toma de declaración, de la edad, de factores emocionales, etc. Así, hoy se considera más adecuado hablar de aspectos a observar en los relatos o criterios de observación, ya que lo fundamental en el análisis es establecer a qué se debe su ausencia o presencia. No se trataría pues de contar cuántos se cumplen, sino de establecer por qué. De hecho, todas las propuestas, sin excepción, proporcionan procedimientos complejos de análisis, además del listado de criterios.

Así, el procedimiento de análisis queda invalidado si únicamente se considera la presencia de los criterios en el relato, sin una valoración adecuada de los métodos utilizados para obtener las declaraciones, si no se contempla la declaración objeto de análisis en comparación con otras declaraciones de realidad confirmada, y si no se tienen en cuenta todos los factores de influencia. Así lo demuestran un gran número de estudios que han analizado si se cumple el supuesto de que las declaraciones reales se distinguen de las no reales de acuerdo con los criterios propuestos (por ejemplo, Manzanero y Diges, 1994; Manzanero, 2009, 2004; Porter y Yuille, 1996; Sporer y Sharman, 2006; Vrij, Akehurst, Soukara y Bull, 2004) y que coinciden en que cuando comparamos relatos reales de otros que no lo son, se encuentran pocas diferencias en su contenido y cuando estas aparecen no siempre son en la dirección esperada. De este modo, Sporer (1997) afirmó que las supuestas diferencias entre declaraciones reales y falsas son una mera hipótesis de trabajo sobre la que no se puede especificar porqué se dan, cuáles son los procesos psicológicos que las sustentan, ni las condiciones que hacen que puedan aparecer o no en una declaración.

¿Invalidan estos resultados estas técnicas de análisis de credibilidad? Yuille (1988) realizó un estudio con 49 niños de 6 a 9 años en el que cada niño relataba dos sucesos, uno verdadero y otro inventado, después de dos días para repasar y crear las historias. Posteriormente obtuvo sus declaraciones de acuerdo con la técnica de SVA y analizaron los criterios de valoración de credibilidad de acuerdo con la técnica CBCA, para clasificar cada historia en verdadera, falsa o indeterminada, según las propuestas de Steller y Köhnken (1989). Los resultados del estudio mostraron que, aunque muchos niños (13) no fueron capaces de inventar una historia y algunas de las historias falsas consistían en sucesos reales modificados, el acierto en la clasificación de cada una fue de 90,9 por 100 para las historias verdaderas y del 74,4 por 100 para las falsas.

Steller, Wellershaus y Wolf (1988) realizaron un estudio similar al anterior, pero en este caso las historias que los niños relataban consistían en sucesos relacionados en mayor o menor grado con hechos médicos (comparables con las agresiones sexuales). Cuando se pidió a dos grupos de sujetos que clasificaran los relatos en verdaderos o falsos, los aciertos en la clasificación fueron superiores cuando se utilizaban los criterios de la técnica CBCA, en comparación a juicios de credibilidad realizados por evaluadores no entrenados en la técnica. No obstante, el porcentaje de errores cometidos en la clasificación utilizando los criterios de contenido fueron de un 22.3 por 100 para los relatos reales y de un 37.7 por 100 para los falsos.

Unos años después, Strömwall, Bengtsson, Leander y Granhag (2004) también analizaron los relatos de niños de 10 a 13 años mediante los criterios de contenido de la técnica CBCA. Los resultados mostraron que sólo se clasificaron correctamente un 54 por 100 de los relatos. De los 43 relatos reales solo 19 (44 por 100) fueron correctamente evaluados. De los 44 imaginados fueron correctamente identificados 28 (64 por 100). A partir de estos datos Strömwall y colaboradores concluyeron que la capacidad de los criterios de contenido para discriminar no resultaba significativa.

Estos estudios muestran que la técnica tiene problemas al utilizarla como un listado de “síntomas” para valorar la credibilidad de relatos reales y falsos, debido a que los porcentajes de error en las clasificaciones de los relatos superan lo deseable en contextos forenses. Wagenaar, Van Koppen y Crombag (1993) argumentaron que para considerar culpable a una persona se requerirían evidencias con un valor diagnóstico de al menos un 99,6 por 100. Considerando estos argumentos, Rassin (1999) en un artículo donde analizaba la validez científica de la técnica CBCA y su aplicación a un contexto forense afirmaba que un sistema judicial que funcione adecuadamente no debería tolerar más de un 0,4 por 100 de falsos positivos, que impliquen que un inocente ha sido declarado culpable.

Los errores de discriminación de los procedimiento de análisis de credibilidad basados en el contenido de la declaración, además, podrían incrementarse en la medida en que los profesionales que los aplican no tengan la especialización necesaria. Para la aplicación de estos procedimientos se requiere de amplios conocimientos sobre los procesos perceptivos y de memoria, tanto desde el punto de vista de la psicología cognitiva como desde los factores que afectan a la memoria de los testigos. Además, es necesario el trabajo experimental en el área ya que el conocimiento de la metodología experimental es lo que nos permitirá tanto analizar los datos de las investigaciones al respecto como el dominar la formulación y falsación de hipótesis, metodología experimental empleada por estas técnicas. De otra forma, tratar de aplicar los criterios como si de una regla se tratara, sin considerar los factores que concurren en el caso concreto objeto de examen, aumentará la subjetividad de la valoración.

En este sentido, hay que señalar que no estamos ante pruebas estandarizadas en el sentido psicométrico del término (uniformidad en el proceso de aplicación, corrección e interpretación y utilización de puntuaciones baremadas para interpretar los resultados). No existe una regla de decisión respecto a considerar cuántos criterios determinan que una declaración sea calificada como creíble o no creíble. Es decir, no se puede establecer una relación entre cantidad de criterios y credibilidad . Y tampoco existe una regla que precise el peso que cada criterio debe recibir. En definitiva la responsabilidad última de la valoración de la credibilidad del testimonio recae en la formación y experiencia del perito.