Extracción Automática de Argumentos en Sentencias Judiciales: Una Revisión

Es evidente que determinar el precedente judicial para un caso concreto es una ardua tarea que implica el estudio a profundidad de una gran cantidad de textos jurisprudenciales, tanto para los funcionarios judiciales y administrativos en la resolución de conflictos, como para los abogados y usuarios de la administración de justicia que constantemente buscan argumentos en pro de sus intereses. Es así como se reconoce la necesidad de procesar este cúmulo de información de una forma sencilla y ágil. Los profesionales de la rama judicial constantemente buscan precedentes en sentencias previas que sirvan como soporte para sus casos en curso, lo que involucra tareas como: buscar, seleccionar, entender y resumir documentos entre un gran número de sentencias que aumentan constantemente.

El documento está estructurado de la siguiente manera: en la sección 2 se presenta la revisión sistemática en donde se expone el método utilizado para identificar, evaluar e interpretar los estudios relacionados con el desarrollo del documento. La sección 3 hace énfasis en el desarrollo como tal del trabajo, en donde se exponen los conceptos relacionados con minería de argumentos y uso de ontologías en el contexto legal y trabajos relacionados.

Identificación del Problema y Formulación de Preguntas de Investigación

Esta actividad tiene como finalidad evaluar e identificar la problemática para, consecuentemente, formular la o las preguntas de investigación que serán respondidas como resultado del proceso de investigación.

Tabla 1. Preguntas y palabras clave

CaracterísticaPregunta
Entidades, sentencia, ontologías, detección automática, búsqueda¿Es posible resumir e identificar los argumentos de una sentencia de manera automática?
Estructura argumentativa, argumento, detección automática, minería

Criterios de Inclusión y Exclusión de Artículos

  • Inclusión: Estudios enfocados a minería de argumentos y estructuras argumentativas.
  • Inclusión: Estudios que contengan información sobre extracción de información para documentos legales.

Minería de Argumentos

La argumentación puede ser definida como el proceso mediante los cuales los argumentos son construidos, intercambiados y evaluados, sin olvidar su relación con otros argumentos, cada uno de los cuales compromete un grupo de premisas de tal forma que sirvan como soporte para una idea, idea que usualmente es llamada conclusión [10]. La argumentación también puede ser vista como una cadena de razonamiento, en donde una conclusión puede ser usada como premisa para derivar a nuevas conclusiones [11].

La minería de argumentos se centra en la detección de los argumentos y sus relaciones, y no en analizar o establecer la validez de la argumentación. Se encarga de identificar aquellas secciones del texto que parecen funcionar como argumentos (desde un punto de vista semántico o lingüístico); tal que la detección automática de argumentos es capaz de apoyar procesos como el resumen automático de documentos [12] o aumentar las capacidades de las bases de datos jurídicas, generando procesos de extracción de información automática, poniendo a disposición de los profesionales judiciales nueva información a medida de que se alimenta la base de datos [10], [13].

Al realizar un análisis de los procesos para la detección automática de argumentos en [10], [13], [14]; es posible identificar una secuencia de procesos tal como se muestra en la Figura 1.

Figura 1. Secuencia de procesos para la minería de argumentos

Definición de la estructura argumentativa – Segmentación – Identificación de características – Identificación de la estructura

  • Definición de la estructura argumentativa: En este punto es necesario identificar las relaciones que existen entre las proposiciones de un argumento [10]. Este proceso se apoya en el estudio de teorías argumentativas como las propuestas por [15], [16], y tiene como propósito generar una estructura en la que se clasificarán las secciones (según la teoría seleccionada) identificadas con el proceso de minería, como lo muestra la Figura 2.
  • Identificación de la estructura: Al identificar y analizar las características de los segmentos, es posible determinar si estos se tratan de conclusiones o premisas que forman un argumento (si tomamos como ejemplo la estructura de la Figura 2), al igual de cómo se relacionan con otros argumentos identificados.

Como se mencionó antes, la minería de argumentos puede apoyar procesos más complejos como la generación de resúmenes de manera automática. Los resúmenes ayudan a organizar grandes volúmenes de documentos, de modo que en el contexto legal, encontrar sentencias relevantes para un caso específico se facilite de manera significativa. Frecuentemente, los documentos legales son resumidos manualmente por expertos del dominio en el ámbito judicial. Además, hay que tener en cuenta el riesgo que representa la existencia del error humano, lo que puede llevar a una mala clasificación de los textos [17].

Trabajos Relacionados

En cuanto a los trabajos relacionados, [13] estudia el reconocimiento de estructuras argumentativas en textos cortos, para lo cual empieza por definir una estructura de anotación, basada en la teoría de estructuras argumentativas de Freeman [16], [19], la cual consiste en organizar los argumentos en una estructura de grafo, en donde cada nodo representa las proposiciones encontradas en el texto.

Clasificadores comparados en [13]

En [10] se enfoca el trabajo en la detección de estructuras argumentales, proceso apoyado por los esquemas argumentativos propuestos por [15], en donde las premisas y conclusiones son reconocidas como elementos básicos de los argumentos, formando una estructura en donde se pueden evidenciar patrones de razonamiento.

En [22] se identifican dos estrategias metodológicas para el desarrollo de ontologías y uso de conocimiento léxico:

  1. Metodología descendente (top-down): Esta tiene en cuenta la estructura contextual del dominio y basa su estructura en el criterio y conocimiento de expertos. La construcción de la ontología empieza con el modelado de conceptos de alto nivel, para luego ser depurada por expertos del dominio, dando como resultado una ontología de alta calidad.
  2. Estrategia ascendente (bottom-up): Usa un enfoque de análisis lingüístico para poblar y definir un modelo incremental de la estructura conceptual de manera semiautomática, usando técnicas de procesamiento de lenguaje natural. La principal ventaja en comparación con la metodología descendente es la capacidad de descubrir conocimiento que puede ser agregado al modelo de la ontología a una escala mucho mayor, además de que puede ser implementada para el apoyo en la depuración y expansión de ontologías existentes. La principal desventaja de este enfoque resulta del alto nivel de detalle, lo que dificulta detectar aspectos comunes entre los conceptos relacionados, lo que puede aumentar el riesgo de inconsistencias.

Es común encontrar trabajos relacionados con el uso y aplicación de ontologías para el procesamiento de documentos jurídicos, en especial para la detección de entidades o reconocimiento de términos legales (por ejemplo [25], [26], [27], [28], [29]). Los autores usan pruebas sobre las hipótesis para, en primer lugar, detectar aquellas frases formadas por dos o más palabras que puedan tener algún significado (posiblemente legal) al ser combinadas.