Fundamentos del Tratamiento Documental y la Recuperación de Información

Conceptos Fundamentales en Información y Documentación

1. La Cadena Documental: Definición y Operaciones Básicas

Todas las operaciones que se desarrollan en las bibliotecas y centros de documentación se agrupan en tres funciones básicas: de entrada, de tratamiento y de salida de la información. Esto es lo que se denomina cadena documental.

A las funciones de entrada le corresponden las operaciones de:

  • Selección documental.
  • Adquisición.

A las de tratamiento:

  • Análisis documental.
  • Búsqueda documental.

A las de salida:

  • Difusión.

Todas las operaciones y funciones se suceden en un orden y cada operación depende de la anterior.

Destaca el tratamiento documental, ya que es la más importante. Al tratamiento documental le corresponden dos operaciones generales: el análisis documental y la búsqueda documental.

El análisis documental está relacionado con las operaciones de almacenamiento de la información, por eso se encuentra estrechamente vinculado con las actividades de selección y adquisición.

La búsqueda documental está relacionada con la difusión de la información.

2. El Análisis Documental

2.1. Definición, Concepto y Alcance

Definición:

El análisis documental es: “la descripción y representación de los datos que caracterizan el documento”.

Según José R. Pérez Álvarez-Ossorio, “el análisis documental está constituido por el conjunto de operaciones necesarias para extraer la información contenida en los documentos y acondicionarla para su almacenamiento y posterior recuperación”.

De esta definición podemos extraer dos conceptos clave:

  1. “Extraer la información contenida en los documentos”:
    • Información relativa a los aspectos físicos o formales.
    • Información relativa a su contenido.
  2. “Acondicionarla para su almacenamiento y posterior recuperación”:
    • La información relativa a los aspectos físicos o formales se lleva a cabo mediante el análisis físico o formal.
    • La información relativa a su contenido se hace por medio del análisis de contenido.

Consideraciones sobre el alcance:

  1. Existen dos grandes corrientes. Una, que María Pinto llama integradora; y otra, que la misma autora denomina restringida. La corriente integradora es la que admite como integrantes del análisis documental tanto las operaciones del análisis formal como las operaciones de contenido. La corriente restringida es aquella que solo considera operaciones del análisis documental las del análisis de contenido, es decir, la indización y el resumen.
  2. Pocos autores consideran la referencia bibliográfica como actividad propia del análisis documental. Sin embargo, es evidente que en los sistemas de información y documentación se elaboran referencias bibliográficas, bien para incluirlas en bibliografías, bien para acompañar a los resúmenes, y esta operación como tal forma parte del análisis de los documentos, aunque su grado de análisis sea reducido.
  3. Otro problema es el que se origina al intentar situar con precisión la catalogación bibliográfica entre las operaciones del análisis documental. En la catalogación ocurren operaciones de análisis físico, como son todas las relacionadas con la catalogación descriptiva, pero también se llevan a cabo operaciones de análisis de contenido. La catalogación no se sitúa ni en el análisis formal ni en el análisis de contenido, ya que participa de características de los dos. Algunos autores han acuñado un nuevo término para referirse al asiento bibliográfico que corresponde al análisis formal: “catalogación descriptiva”.

2.2. Fines y Objetivos del Análisis Documental

2.2.1. Fines
2.2.1.1. La Recuperación de la Información

Se puede considerar que el fin último del análisis documental es la recuperación de la información. No solo hay que recuperar la información, sino que hay que conseguir que esa información recuperada responda a dos principios básicos del análisis documental, que son: precisión y exhaustividad.

  1. Precisión: Medida cuantitativa que Pérez Álvarez-Ossorio define como: relación entre el número de documentos relevantes recuperados y el número total de documentos recuperados (en porcentaje). La existencia de documentos no relevantes es lo que se denomina ruido, que es una medida que se aplica a los documentos recuperados.
  2. Exhaustividad: Es la relación entre el número de documentos relevantes recuperados y el número total de documentos relevantes de una base de datos. La existencia de documentos relevantes no recuperados se denomina silencio.
2.2.1.2. La Identificación

El análisis documental debe permitir la identificación exacta de la información, es decir, que el usuario pueda determinar si el documento le interesa o no. También debe permitir identificar los documentos con datos semejantes o, aparentemente semejantes.

2.2.2. Objetivos

El objetivo del análisis documental es almacenar la información contenida en los documentos. Esta información debe ser ordenada de una manera consistente. Para alcanzar esto, el análisis documental realiza dos funciones: a) la descripción y, b) la representación, dando lugar a un doble tipo de análisis documental: análisis físico o formal y análisis de contenido.

3. Tipos de Análisis Documental

Hay dos tipos de análisis documental: análisis físico o formal y análisis de contenido.

3.1. El Análisis Físico o Formal

El análisis formal examina el documento desde el punto de vista físico. Tiene como objetivo describir los aspectos externos que permiten identificar los documentos. Las operaciones del análisis formal comprenden dos actividades precisas: a) la elaboración de referencias bibliográficas; b) la catalogación descriptiva.

3.1.1. La Elaboración de Referencias Bibliográficas

Conjunto mínimo de datos que permite la identificación de una publicación o de una parte de la misma. Se destacan dos ideas:

  • La referencia está formada por los datos mínimos necesarios. La norma UNE 50-104-94 establece como datos mínimos obligatorios: el autor, el título, el año y el ISBN.
  • La referencia identifica una publicación o una parte de la misma, y puede usarse para: monografías, publicaciones en serie, partes de monografías, capítulos de monografías, artículos de publicaciones en serie, patentes. Los elementos que componen la referencia bibliográfica y el orden en que se disponen han sido objeto de normalización: norma ISO 690; y norma UNE 50-104-94.

La referencia bibliográfica se utiliza fundamentalmente en tres ocasiones:

  • Para elaborar bibliografías.
  • Para proceder a los resúmenes documentales en los boletines de resúmenes o abstracts, o en las revisiones críticas de un documento.
  • En los documentos, para hacer referencia a otros documentos, ya sea en el pie de página o al final del texto.
3.1.2. La Catalogación Descriptiva

Operación que consiste en describir el conjunto de datos formales con que se registra o identifica un documento de acuerdo a unas normas. Se materializa en los siguientes elementos:

  • Los puntos de acceso descriptivos. El punto de acceso es un mecanismo que permite acceder a la información de los asientos o registros bibliográficos. El glosario de la ALA lo define, en primer lugar, como “nombre, término o código por el que se puede buscar e identificar un registro bibliográfico”; y, en segundo lugar, como “en sistemas de búsqueda y almacenamiento de información por ordenador, campo que permite tener acceso a un registro o fichero”. El encabezamiento sirve para ser usado, en un sistema manual, como dato para la ordenación.
  • La descripción bibliográfica, es decir, el conjunto de datos bibliográficos con que se registra o identifica un documento, de acuerdo con unas reglas. A diferencia de la referencia bibliográfica, en la descripción bibliográfica sí se registran todos los datos posibles para la identificación del documento. Forma parte de un registro o asiento bibliográfico completo, y está formada por el conjunto de datos necesarios para describir un documento. No se utiliza por sí misma.

El asiento bibliográfico se puede definir como: “registro o descripción de una unidad bibliográfica o documental de acuerdo a unas normas”.

El asiento bibliográfico se redacta con las reglas de catalogación, la lista de encabezamientos de materia y la CDU, dando lugar a la catalogación bibliográfica de una obra.

La catalogación bibliográfica se define como: “redacción del asiento bibliográfico, de acuerdo con unas normas”. Las operaciones llevadas a cabo en la redacción del asiento bibliográfico son tres: 1) la catalogación descriptiva; 2) indización alfabética; 3) indización sistemática o clasificación.

Así pues, un asiento catalográfico se puede definir como: “asiento bibliográfico perteneciente a una colección, en el que se indica el número de registro dentro de esa colección, así como su localización física por medio de la signatura topográfica”.

3.2. El Análisis de Contenido

Examina el documento desde el punto de vista de su contenido, es decir, es el proceso intelectual de la representación de la información contenida en un documento. Tiene como objetivo representar los aspectos internos por medio de dos funciones diferentes: debe facilitar su conocimiento en profundidad y permitir su localización. Para facilitar su conocimiento en profundidad se usa el resumen documental. Para facilitar la localización se desarrolla la indización, que puede ser alfabética o sistemática.

3.2.1. El Resumen Documental

Es la representación abreviada y precisa del contenido de un documento, sin interpretación o crítica alguna y sin mención expresa del autor del resumen. Su longitud es variable. Se distinguen tres tipos de resúmenes: resumen indicativo; resumen indicativo-informativo; y resumen informativo.

El autor del resumen o documentalista que lo elabore deberá tener siempre presente el objetivo de proporcionar al lector la base necesaria para decidir la conveniencia, o no, de leer el artículo.

3.2.2. La Indización

Operación que consiste en representar el contenido de un documento mediante un término o conjunto de términos o signos que especifica los temas que trata, con el fin de ayudar a su almacenamiento y posterior recuperación.

En esta definición destacan tres elementos:

  • La indización consiste en representar el contenido de los documentos, es decir, la materia de que trata un documento.
  • La representación se hace mediante un conjunto de signos, términos o números, lo que da lugar a la indización alfabética o indización sistemática.
  • Esos términos deben permitir la recuperación del documento; esta es la finalidad de la indización: permitir la recuperación.

3.3. Analogías y Diferencias entre Indización y Resumen

El usuario necesita saber de qué trata el documento y conocer sus aportaciones y resultados. En función de esta doble necesidad se desarrollan las dos principales operaciones del análisis de contenido: la indización y el resumen.

Dentro del análisis de contenido hay dos tipos de operaciones diferentes:

  • Las operaciones de descripción característica o indización.
  • Las operaciones de descripción sustancial u operación de resumir.
3.3.1. Analogías
  1. Las dos operaciones pertenecen al mismo tipo de análisis, al análisis de contenido, y analizan o tratan la información contenida en un documento.
  2. Ambos, la indización y el resumen, ponen de manifiesto el contenido esencial de los documentos originales.
  3. Identifican y seleccionan los principales elementos conceptuales de esos documentos y los representan (la diferencia está en la manera de representarlos).
  4. Los resultados de ambas operaciones, los índices y los resúmenes, son representaciones del documento original de una forma diferente, y actúan como intermediarios entre el creador de la información y el usuario.
3.3.2. Diferencias
  1. Nivel del análisis: Existen cuatro niveles de análisis que permiten representar el contenido de los documentos, y que son, según Courrier:
    • Campos científicos o clases.
    • Temas.
    • Conceptos.
    • Explicaciones.

    Los tres primeros se pueden conseguir mediante indización, mientras que el cuarto solo es conseguido mediante resumen.

    Por medio del resumen se expresa algo más que los conceptos tratados en el documento; se expresa toda la información relativa a las relaciones entre los conceptos.

    Para explicar realmente el contenido de un documento, solo el resumen permite transmitir toda la información deseable.

  2. Finalidad:
    • La indización permite el almacenamiento y posterior recuperación de la información.
    • El resumen permite el conocimiento en profundidad del documento.
  3. Lenguaje:
    • La indización usará el lenguaje de indización como instrumento para representar el contenido de un documento.
    • El resumen usa el lenguaje natural.
  4. El control lingüístico:
    • En el resumen no existe ningún tipo de control lingüístico.
    • En la indización se dan, dependiendo del sistema, diferentes controles, ya sean semánticos o del vocabulario, morfológicos o sintácticos.