Fundamentos de Estadística: Población, Muestra y Tipos de Datos
Conceptos Fundamentales de Estadística
Población, Subpoblación y Muestra
Se denomina población o universo al conjunto de personas o cosas a las que hace referencia una investigación estadística.
Encuesta Censal o Censo
Una encuesta censal o censo es aquélla que se realiza a todos los componentes de la población. Es el primer tipo de estadística del que se tiene noticia. Sin embargo, no es la forma más habitual de desarrollar encuestas debido a:
- La necesidad de limitar recursos y los elevados costes.
- La rapidez en la obtención de resultados.
Subpoblación
Una subpoblación es una parte de la población integrada por un conjunto de elementos que presentan alguna característica común. Ejemplo: los hospitales de Madrid (no se puede generalizar a toda la nación).
Muestra y Encuestas Muestrales
Una muestra es una parte de la población cuyos elementos se eligen de modo que sean representativos de todo el colectivo. Las encuestas basadas en muestras se denominan encuestas muestrales. Ejemplo: hospitales públicos y privados, por provincias, por gastos, etc.
Ventajas de las Encuestas Muestrales:
- Ahorro considerable tanto monetario como de tiempo.
- Permite afinar la calidad de los datos al ser un menor número de datos, lo que incrementa la fiabilidad.
Desventajas de las Encuestas Muestrales:
- Trabajar con información parcial, lo que puede generar errores en los resultados.
Tipos de Caracteres Estadísticos
Caracteres Cuantitativos (Variables)
Los caracteres cuantitativos, expresados mediante números, reciben el nombre de variables y se representan habitualmente mediante mayúsculas (X, Y, …). Los resultados de la observación de una variable se denominan valores y se designan por las correspondientes letras minúsculas (x1, x2, …; y1, y2, …).
Dependiendo de los valores que puedan presentar, se distinguen a su vez dos tipos de variables:
- Discretas: Variables que solo pueden tomar un número finito o infinito numerable de valores aislados. Ejemplo: número de asignaturas matriculadas, número de empleados (1, 2, 3…).
- Continuas: Variables que pueden tomar cualquiera de los infinitos valores de uno o varios intervalos de la recta real. Ejemplo: tiempo diario de estudio, altura, etc.
Caracteres Cualitativos (Atributos)
Los caracteres cualitativos, expresados mediante palabras, reciben el nombre de atributos. Los resultados de la observación de un atributo se denominan modalidades o categorías. Ejemplo: estudios de grado realizados, sexo, estado civil.
Clasificación de las Estadísticas según el Estudio
Según el número de caracteres estudiados:
- Estadísticas Univariantes: Son aquéllas que se obtienen cuando se estudia un único carácter.
- Estadísticas Multivariantes: Analizan de forma conjunta varios caracteres, opción que resulta adecuada cuando puede existir alguna relación en su comportamiento.
Según la óptica del estudio:
- Estadísticas Temporales o de Corte Longitudinal: Cuando se toma el tiempo como referencia y se analiza la evolución temporal de una o varias variables.
- Estadísticas de Corte Transversal: Aparecen cuando se abandona la óptica temporal y el estudio se efectúa sobre distintos individuos o unidades espaciales en un momento del tiempo concreto.
- Datos de Panel: Se corresponden con situaciones en las que se dispone de datos que combinan ambas perspectivas, longitudinal y transversal.
Organismos e Instituciones Estadísticas Clave
Instituto Nacional de Estadística (INE)
El INE es el principal productor de estadísticas para fines estatales. Se ocupa de la coordinación y planificación del Sistema Estadístico Nacional. Además, el INE debe proponer normas metodológicas. Asimismo, son competencia del INE las relaciones en materia estadística con los organismos internacionales especializados y, en particular, con la Oficina de Estadística de la Unión Europea (EUROSTAT).
EUROSTAT
EUROSTAT es un organismo dependiente de la Comisión Europea, cuya misión fundamental es proporcionar a las instituciones europeas estadísticas fiables y comparables entre países y regiones miembros de la Unión Europea, países candidatos y países de la Asociación Europea de Libre Comercio (AELC).
Otros Organismos Internacionales
Entre otros organismos relevantes se encuentran la ONU (cuya División de Estadística coordina UNdata), la OIT (Organización Internacional del Trabajo), la OCDE (Organización para la Cooperación y el Desarrollo Económicos) y la OMS (Organización Mundial de la Salud).
Tipos de Registros y Encuestas en España
Se distinguen principalmente dos tipos: el tipo censal (Padrón y Censo) y el tipo muestral (EPA y EPF).
¿Puede el Padrón sustituir al Censo?
No son fuentes de información sustitutivas, ya que difieren entre sí en cuanto a su finalidad y contenido.
El Padrón Municipal
El Padrón es un registro administrativo donde constan los vecinos de un municipio, y constituye prueba de residencia en el municipio y del domicilio habitual en el mismo. Toda persona que viva en España está obligada a inscribirse. Es un registro permanentemente actualizado de los residentes en un municipio. La elaboración de los padrones es responsabilidad de los ayuntamientos, con la coordinación y supervisión del INE. La revisión de los padrones se realiza a 1 de enero de cada año. Los padrones municipales constituyen el documento base para la elaboración del Censo Electoral.
Los Censos Demográficos
Los Censos Demográficos constituyen el proyecto estadístico de mayor envergadura que deben acometer periódicamente las oficinas de estadística de cualquier país. Permiten determinar el número de habitantes, viviendas y edificios del Estado y sus distintas áreas geográficas, así como conocer características demográficas y sociales de la población. Se realizan cada 10 años (próximo: 1 de noviembre de 2011; último: 2001).
Encuesta de Población Activa (EPA)
La EPA tiene como objetivo conocer la actividad económica en lo relativo a su componente humano, proporcionando datos sobre las principales categorías poblacionales en relación con el mercado de trabajo (ocupados, parados, activos e inactivos). Tiene una periodicidad trimestral (muestreo) y está dirigida a la población que reside en viviendas familiares. Para garantizar que la situación laboral de las personas que integran la muestra represente adecuadamente a la de toda la población española de 16 y más años, el proceso de selección es aleatorio y se realiza en dos etapas: en la primera se eligen al azar zonas geográficas de los municipios (denominadas secciones censales), y en la segunda etapa, viviendas de las zonas seleccionadas previamente. Las familias colaboran durante seis trimestres consecutivos.
Encuesta de Presupuestos Familiares (EPF)
La EPF tiene como objetivo proporcionar información sobre la naturaleza y destino de los gastos de consumo de los hogares para el conjunto nacional y para las comunidades autónomas. La variable central de la encuesta es el gasto de consumo. Es una encuesta muestral de periodicidad anual. Se colabora durante un periodo de dos años, y cada hogar debe informar sobre todos los bienes y servicios consumidos.
Propiedad de la Media: Descomponibilidad
Si se divide una población de tamaño N en p subpoblaciones de tamaños N1, N2, …, Np, y medias X̄1, X̄2, …, X̄p (donde X̄ representa la media), la media poblacional se relaciona con las medias de las subpoblaciones mediante la expresión:
[Fórmula de la media poblacional en función de las medias de las subpoblaciones, que estaba representada por una imagen y texto informal]
Demostración: Efectuaremos la comprobación para el caso de dos subpoblaciones. Para ello, representemos por (xi, ni) la distribución poblacional y designemos por ni1 y ni2 la frecuencia absoluta de Xi en cada subpoblación; estas frecuencias están relacionadas mediante la expresión: ni1 + ni2 = ni.
El tamaño de las subpoblaciones será N1 = Σ ni1 y N2 = Σ ni2, y las respectivas medias vendrán dadas por las expresiones:
[Fórmulas de las medias X̄1 y X̄2, y la fórmula extendida de la media poblacional, que estaban representadas por texto informal y una imagen]
Nota: Las fórmulas matemáticas específicas para la propiedad de descomponibilidad de la media no pudieron ser representadas directamente en este formato. Se recomienda consultar un texto de estadística para las expresiones completas.