Fundamentos de la Sociedad de la Información: Documentación y Recuperación del Conocimiento
Sociedad de la Información y el Conocimiento
Definiciones Clave
- Datos: Conjunto discreto de factores objetivos sobre un hecho real.
- Información: Mensaje con forma de documento o comunicación audible o visible.
- Conocimiento: Mezcla de experiencia, valores e información que sirve para la incorporación de nuevas experiencias e información, y es útil para la acción.
Fuentes de Información
Recursos informativos, documentos digitales u objetos digitales:
- Fuente de referencia (diccionario) + Tecnologías web = diccionarios.com
- Documento primario (revista) + Tecnologías web = hipertext.net
- Documento secundario (bibliografía) + Tecnologías web = Bibliografía nacional en línea.
Concepto y Evolución Histórica
Siglo XIX: Se observa un aumento de academias científicas, revistas de ciencias y artes, aumento del número de periódicos, invención de la fotografía y el cinematógrafo, e inicio de la globalización con el telégrafo y la radiodifusión. Esto supone un aumento exponencial de la información publicada.
La Documentación nace para dar respuesta a este aumento, aplicando métodos científicos a su organización y circulación.
Otlet y La Fontaine
Fundaron la Société des Études Sociales et Politiques de Bruselas y la Oficina Internacional de Bibliografía Sociológica. Crearon la primera versión de la CDU (Clasificación Decimal Universal), publicada en 1904.
La primera descripción teórica de la disciplina como tal la realiza Otlet en 1934 con la publicación de Traité de Documentation.
- Objeto (Libro): Cualquier elemento que sirve para indicar o reproducir un pensamiento bajo una forma.
- Método (Proceso Documental): Registro del pensamiento humano en elementos materiales. Incluye conservación, circulación, utilización, catalogación, descripción y análisis.
La documentación ha evolucionado adaptándose especialmente a las NTICs (Nuevas Tecnologías de la Información y la Comunicación).
Definición (Codina, 2000): Conjunto de ciencias y técnicas documentales al servicio de:
- La producción de informaciones de actualidad.
- El incremento de su calidad.
- Su almacenamiento y conservación.
- Su difusión y reutilización.
El Proceso Documental
Tiene una doble finalidad: facilitar la recuperación y uso por parte de los usuarios y garantizar la conservación.
Fases del Proceso Documental
- Entrada: Selección, adquisición, registro.
- Tratamiento: Análisis formal, análisis de contenido.
- Salida: Catálogos, boletines de sumarios y de novedades.
- Mantenimiento: Tareas administrativas, gestión, planificación.
Principios según Galdón
Los principios que rigen la documentación en los medios fueron expresados por Galdón:
- Teleológicos:
- Verificativo: Comprobación de la veracidad de los textos y referencias que se valoran y difunden.
- Explicativo: Valoración y potenciación de la comunicabilidad y carácter aclaratorio de los textos y referencias cuya veracidad se ha comprobado.
- Editorial: La causa adicional secundaria de la actividad documental periodística, por la cual esta se orienta a la fundamentación de opiniones e ideas desde la perspectiva particular de análisis marcada por los principios editoriales.
- Formales y Circunstanciales:
- Perdurabilidad: Fijar la utilidad futura y grado de permanencia de los textos y referencias en la elaboración de la información periodística.
- Adecuación funcional: Tratamiento específico de cada tarea y medio documental.
- Limitativo: Conjunto de circunstancias reales que limitan su ejercicio y utilización de medios.
Funciones de la Documentación Informativa
La documentación informativa se muestra necesaria para la práctica del periodismo dadas sus siguientes funciones:
- Función preparatoria: Proporcionar a los redactores conocimientos sobre las personas, instituciones, temas o países objeto. Esta función contribuye a paliar la superficialidad informativa.
- Función crítico-verificadora: Suministrar información pertinente sobre fuentes y temas tratados para comprobar sus intereses y fiabilidad; grado de exactitud y veracidad de las declaraciones ajenas.
- Función completiva: Se actualiza cuando se buscan y proporcionan los antecedentes y relaciones necesarios para completar la información de mera actualidad y superficial, y poder así hacer una síntesis. Contribuye a suprimir la superficialidad noticiosa.
- Función lingüístico-clarificadora: Poner a disposición diccionarios, usos y normas, fuentes iconográficas, etc., para que puedan utilizarlos en aras de una elaboración textual y gráfica correcta, precisa y clara. Palia la falta de entendimiento y comprensión.
- Función modélico-narrativa: Suministrar artículos con formas de expresión claras y estructuras narrativas para facilitar el trabajo de los informadores, sobre todo cuando deban comunicar ideas sobre realidades complejas.
- Función orientadora: Fundamentación adecuada de los principios editoriales propios y el conocimiento de las necesidades informativas reales de los ciudadanos. Contribuye a la formación de un diálogo reflexivo y racional y evita la imposición autoritaria de los deseos e ideas.
- Función de actualización científica: Facilitar a los informadores los textos pertinentes para que puedan estar al día sobre el desarrollo de su misión específica. Rompe diversas barreras al mismo tiempo.
- Función informativa propia: Dimensión del fondo documental como fuente principal en la elaboración de cronologías, dossiers temáticos, informes, perfiles biográficos y otros contenidos. Elaboración que se realiza en el servicio de documentación, y convierte a los documentadores en redactores especializados; se rompen las barreras de la fragmentación, trivialización y despersonalización de la realidad.
Centros de Documentación
- Centros especializados en documentos o fuentes de información documental primarias: Su objetivo es conseguir un fondo documental, conservarlo, organizarlo y ponerlo a disposición de los usuarios. Ejemplos: Archivos y bibliotecas.
- Centros especializados en la difusión de información referencial: No suelen ofrecer el acceso al documento primario. Al ser su especialización la información documental referencial, no suelen poseer fondos primarios, sino solamente secundarios.
- Centros especializados en servicios:
- Centros de depósito: Se centran en una temática concreta con la finalidad de elaborar una colección documental como fondo de documentos primarios. Ejemplo: Instituto de Estudios Islámicos y del Oriente Próximo (IEIOP).
- Centros de análisis: Analizan todos los documentos que de un área se publican a nivel mundial y elaboran grandes bases de datos con información referencial y de análisis de esa temática.
- Centros de análisis de información: No ofrecen ni el documento primario ni la información referencial. Elaboran documentos de carácter secundario de un área y se ofrecen a la comunidad científica correspondiente. Ejemplo: Observatorio Nacional de las Telecomunicaciones y de la Sociedad de la Información.
- Centros de datos: Muy especializados, se encargan de recoger datos sobre océanos, terremotos, huracanes, movimientos planetarios, etc., y ofrecerlos a la comunidad científica internacional.
- Centros de difusión selectiva de información (DSI): Proporcionan información documental a sus usuarios en función de su perfil.
Búsqueda y Recuperación de Información
Buscar información: Proceso donde un conjunto de datos o documentos son «interrogados» para encontrar ítems que puedan ayudar a satisfacer las necesidades de información de un usuario.
Procedimiento de Búsqueda y Lenguajes de Información
El modelo de las 6 habilidades para la recuperación de información:
- Definición de la tarea.
- Estrategias de búsqueda de información.
- Localización y acceso.
- Uso de información.
- Síntesis.
- Evaluación.
Lenguajes de Interrogación
- Operadores booleanos: Y (AND – genera precisión), O (OR – genera exhaustividad), NO (NOT – genera precisión), XOR (OR exclusivo – exhaustividad).
- Operadores de proximidad: Adyacencia, distancia, párrafo, frase.
- Truncamiento: Abierto, cerrado.
- Limitadores de campo: (Genera precisión).
- Rangos.
- Paréntesis: (Neutro, para agrupar).
Evaluación de la Recuperación de Información
Posibles problemas en el proceso de búsqueda:
- Errores materiales en la transcripción del dato o en la pregunta del usuario.
- Deficiencias en la interacción del usuario y el sistema.
- Descripción inadecuada de los contenidos.
- Retraso en la carga de novedades al sistema.
Métricas de Evaluación:
- Exhaustividad: Porcentaje de documentos relevantes recuperados en una búsqueda con respecto al total de documentos relevantes en la base de datos. (Exhaustividad = Documentos Relevantes Recuperados / Total Documentos Relevantes). Un bajo nivel de exhaustividad genera silencio documental.
- Precisión: Porcentaje de documentos relevantes recuperados en una búsqueda con respecto al total de los documentos recuperados. (Precisión = Documentos Relevantes Recuperados / Total Documentos Recuperados). Un bajo nivel de precisión genera ruido documental.
Principio que guía una búsqueda: Debe alcanzar alta exhaustividad, recuperando casi todo aquello que es relevante, y manteniendo una alta precisión, rechazando una gran proporción de lo que no se desea. Cuando esto ocurre, los valores de la búsqueda se dice que son próximos a 1 (100%).
Realidad de una búsqueda: Exhaustividad y precisión suelen variar inversamente; a mayor precisión, menor exhaustividad y viceversa.
- Exhaustividad «perfecta»: Recuperando toda la base de datos (precisión nula).
- Precisión «perfecta»: Conociendo y recuperando previamente un documento que sabemos que se adecua a lo que buscamos (exhaustividad nula).
Métodos y Herramientas de Búsqueda
- Motores de búsqueda (Ej: Google): Base de datos generada automáticamente por exploración cíclica de la red realizada por un robot (crawler). Se indizan todas las páginas de todos los servidores explorados. Se actualiza automáticamente cuando la página vuelve a explorarse. Se indiza el texto (todo o parte) de cada página encontrada. La búsqueda se realiza sobre ese texto. Puede buscarse sobre un tema del que no se tengan conocimientos previos.
- Directorios (Ej: Yahoo antiguo): Bases de datos de sitios web con descripciones cortas, organizadas por categorías, creadas por editores profesionales, voluntarios o autores de sitios web. Se actualiza si lo hace el autor o el reseñador de la página. La búsqueda se hace sobre las descripciones. Se busca seleccionando menús sucesivos o consultando la base de datos de descripciones. Se requiere un conocimiento mínimo del tema que se busca.
- Servicios de búsqueda híbridos: Asociación de un motor de búsqueda y un directorio.
- Metabuscadores: Permiten, con una interfaz y estrategia de búsqueda únicos, lanzar una búsqueda sobre varios motores. Útiles cuando un buscador concreto no encuentra nada sobre un tema determinado.
- Multibuscadores: Agrupan en una misma página formularios para realizar búsquedas en diversos motores.
Herramientas Específicas de Búsqueda
Directorios, Índices o Catálogos de Recursos
Organizados por temas o disciplinas. Parten de unas categorías básicas, con referencias cruzadas (como en Yahoo!). Suelen incorporar un buscador que localiza términos. Si el buscador no encuentra nada, suele recurrir a un motor de búsqueda. Pueden ser genéricos o específicos.
Algunos directorios genéricos internacionales (históricos o actuales): Yahoo!, The WWW Virtual Library, Internet Public Library, EINet Galaxy, BUBL, Open Directory (DMOZ), LookSmart…
Motores de Búsqueda (Search Engines)
Exploran la red y construyen índices con las palabras significativas de cada página web (documentos HTML o en otros formatos, como PDF, MS-Word, etc.). La estructura de la base de datos y el lenguaje de interrogación es muy variable.
Partes de un Motor de Búsqueda:
- Spider, Crawler, Robot: Visita una página, la pasa al índice, sigue los enlaces.
- Índice, Base de Datos, Catálogo: Base de datos con las páginas encontradas o al menos los índices inversos que remiten al original.
- Software de búsqueda e Interfaz de búsqueda: Interactúa con el usuario para realizar la búsqueda.
Criterios para la Ordenación de los Resultados por Relevancia:
Diferentes en cada motor y a menudo secretos (para evitar que se compongan las páginas con este objetivo). Generalmente se basan en:
- Posición del término: Título, primeros párrafos de texto, etc.
- Frecuencia de aparición: (Pero un exceso puede determinar la exclusión).
- Otros criterios como: Número de enlaces que apuntan a la página (PageRank de Google, etc.), existencia de una reseña en el directorio (en los motores híbridos), aparición del término en elementos (históricamente relevante).
La Web Invisible o Profunda
- Web Visible: Páginas web, formadas fundamentalmente por texto, incluidas en los índices de los motores de búsqueda generalistas.
- Web Invisible o Profunda: Páginas con texto, ficheros u otro tipo de información, generalmente de alta calidad, disponible en la WWW que los motores de búsqueda generalistas no pueden recuperar e indizar por limitaciones técnicas o por elección deliberada (ej. bases de datos consultables vía formulario, contenido tras login).
Características:
- En realidad, no existen contenidos técnicamente invisibles, lo son para las herramientas de recuperación de información habituales (motores generalistas).
- Lo que es invisible hoy puede convertirse en visible mañana (con avances en la tecnología de rastreo).
Bases de Datos (BD)
Volúmenes de información digitalizada, en formato alfanumérico y/o gráfico, accesible a través del ordenador, en soporte electrónico, que son creadas, mantenidas y explotadas por un programa informático (SGBD, Sistema Gestor de Bases de Datos).
Tipos de SGBD y Bases de Datos
- Relacionales (SGBDR): Estructuran la información en tablas. Permiten operaciones algebraicas. Campos de extensión definida, sin subcampos y no repetibles.
- Documentales (SRI – Sistemas de Recuperación de Información): Formada por ficheros lineal, inverso y de palabras vacías. Permite operaciones booleanas y de proximidad. Campos de extensión variable, repetibles y con subcampos.
- Referenciales: Contienen los datos necesarios para identificar un documento, pero no el documento en sí (metadatos, resúmenes).
- Factuales (o a texto completo): Contienen los datos necesarios para identificar un documento y el documento en sí (o datos concretos).
Diferencias entre Bases de Datos Documentales (SRI) y Bases de Datos Relacionales (SGBDR)
- Los registros en los SRI son documentos (o representaciones) y no filas de una tabla.
- Los campos de los SRI tienen extensión variable.
- La longitud de los campos buscables no se limita necesariamente en los SRI como a veces ocurre en los SGBDR.
- Los SRI permiten una recuperación libre de la información (búsqueda en texto completo sin especificar campo).
- Los SRI son capaces de generar automáticamente índices en el interior de cada campo por cada elemento (por palabra, por campo completo, por términos, etc.).
- Los SRI son concebidos para almacenar y recuperar información textual (no estructurada o semi-estructurada).
- Los SGBDR están orientados hacia el procesamiento convencional de datos (estructuras muy definidas).
- Los SRI poseen, en general, mayor grado de rapidez que los SGBDR en la recuperación de aquellos registros que satisfacen las condiciones de búsqueda textual compleja.
Elementos de una Base de Datos
- Tablas: Solo aparecerán en las bases de datos relacionales en las que intervienen varios objetos de la realidad, cada uno descrito en una tabla. Para poder relacionar objetos, sus ocurrencias deben estar agrupadas en una tabla.
- Registros: Representación de una ocurrencia de un objeto de la realidad (una fila en una tabla relacional, un documento en una BD documental).
- Campo: Cada característica que define al objeto (una columna en una tabla relacional, un metadato en una BD documental).
Creación y Aplicación de Bases de Datos
Fases para el diseño de una base de datos:
- Estudiar las necesidades y características de los usuarios.
- Analizar el tipo de información a gestionar.
- Definir la cobertura temática, cronológica y/o geográfica.
- Seleccionar el programa informático (SGBD) y el soporte físico.
- Diseñar la estructura de campos (o el modelo de datos).
- Normalización del contenido (control de autoridades, vocabularios controlados, etc.).