Conceptos Estadísticos Clave: Variables, Índices, Series Temporales y Muestreo
Conceptos Estadísticos Fundamentales
Variable Aleatoria
Una variable aleatoria es una función que asigna un valor numérico a cada suceso del espacio muestral. Puede ser:
- Variable aleatoria discreta: Si puede tomar un número (numerable), finito o infinito de posibles valores.
- Variable aleatoria continua: Si puede tomar un número infinito (no numerable) de valores, normalmente definidos en un intervalo.
Propiedades de los Números Índice
- Existencia: Tiene un valor finito y distinto de cero.
- Identidad: Coincidiendo el período base y el actual, el valor índice es la unidad.
- Inversión: El valor ha de ser invertible al intercambiar los periodos entre sí.
- Proporcionalidad: Si las magnitudes experimentan una variación, el índice también.
- Homogeneidad: Un número índice no puede estar afectado por el cambio en las unidades de medida.
- Propiedad cíclica o circular: Determina la igualdad entre un número índice de períodos base sucesivos y otro con el periodo inicial de base y el último como periodo de estudio.
- Propiedad cíclica o circular modificada: Se desprende de la propiedad cíclica y de inversión.
Componente Estacional de una Serie Temporal
La estacionalidad recoge las oscilaciones a corto plazo (inferiores a un año). Se produce por efecto de algún periodo de tiempo que influye en las series (estaciones del año, días de la semana, etc.). Las razones de la estacionalidad son de tipo físico-natural (tiempo meteorológico, ciclos biológicos, etc.) o de tipo institucional (vacaciones escolares, horarios comerciales, etc.).
Muestreo Opinático o Subjetivo
En el muestreo opinático o subjetivo, el investigador selecciona él mismo (o pide a un experto en el tema que está estudiando) un conjunto de unidades que él piensa que van a ser representativas de toda la población objeto de estudio. Este método simplifica el diseño de la muestra y el trabajo de campo. Como todos los muestreos no probabilísticos, tiene el inconveniente de introducir sesgos subjetivos que invalidan el trabajo.
Factor Cíclico y Estacionalidad de una Serie Temporal
- Factor cíclico: Recoge las oscilaciones de carácter periódico y a medio plazo. Se considera que el periodo de cada ciclo es superior a un año. Es frecuente encontrarlo en las series económicas y se debe a los cambios en la actividad económica.
- Estacionalidad: Recoge las oscilaciones a corto plazo (menos de un año) y se produce por efecto de algún periodo de tiempo en la serie. Las razones de la estacionalidad son de tipo físico-natural o de tipo institucional.
Tendencia y Variaciones Cíclicas de una Serie Temporal
- Tendencia: Es el componente que indica la dirección en la que se mueve la serie en el largo plazo.
- Variaciones cíclicas: Recogen las oscilaciones de carácter periódico y a medio plazo. Se considera que el ciclo es un período superior a un año. Es un componente frecuente en las series económicas y se debe a los cambios en la actividad económica.
Sucesos Disjuntos y Suceso Complementario
- Sucesos disjuntos: Dados dos sucesos A y B de un experimento aleatorio, son disjuntos si su intersección es el conjunto vacío. La ocurrencia del suceso A excluye la ocurrencia de B. Ejemplo: en el lanzamiento de un dado, A = obtener número par, B = obtener número impar, A ∩ B = conjunto vacío.
- Suceso complementario: El suceso complementario de A es otro suceso que ocurre cuando no ocurre A. Es el suceso compuesto por los sucesos de E que no pertenecen a A. Ejemplo: en un lanzamiento de un dado, A = obtener número par, Ā = obtener número impar.
Población y Marco Estadístico
- Población: Es el conjunto de elementos que cumplen ciertas propiedades y entre los que se quiere estudiar un fenómeno.
- Marco estadístico: Es la lista que nos permite identificar cada una de las unidades de la población. Es el conjunto de información (ficheros, directorios, etc.) que permite identificar, sin duda alguna, a todos los individuos que componen la población.
Características Fundamentales de un Experimento Aleatorio
- Se puede repetir indefinidamente en las mismas condiciones.
- Cualquier mínima modificación en las condiciones iniciales puede modificar completamente el resultado final del experimento.
- Se puede dar el conjunto de posibles resultados del experimento, pero no se puede predecir previamente un resultado particular.
- Si el experimento se repite un gran número de veces entonces aparece algún modelo de regularidad estadística en los resultados obtenidos.
Suceso Elemental, Suceso Compuesto y Espacio Muestral
- Espacio muestral: Es el conjunto formado por todos los sucesos o resultados posibles en un experimento aleatorio.
- Sucesos elementales: Son los que están formados por un solo resultado del experimento.
- Sucesos compuestos: Son los que están formados por dos o más resultados del experimento, es decir, por dos o más sucesos elementales.
Requisitos de un Buen Cuestionario
- Las preguntas deben de ser fáciles de entender, buscando respuestas claras para mejor tratamiento informático.
- Deben tener la extensión adecuada para mantener la atención del encuestado.
- Se deben evitar preguntas tendenciosas, para no obtener respuesta errónea por suponer algo a priori.
- Las preguntas pueden ser tales que las respuestas estén cerradas o precodificadas, o bien abiertas, en este caso hay que buscar respuesta que sea fácil codificar.
- Se debe hacer una encuesta piloto, para descubrir posibles deficiencias.
Muestreo por Cuotas
Fijada una característica poblacional de la que se conozca la proporción de individuos que la poseen (edad, sexo de los individuos, etc.), el investigador facilitará al encuestador el número de individuos que presentando la característica, tiene que entrevistar, y el número de entrevistas que tiene que realizar a unidades que no presenten la característica. Este es el tipo de muestreo no probabilístico más utilizado; las cuotas se suelen introducir en algunas o en todas las fases del muestreo.
Variaciones Estacionales de una Serie Temporal
Variaciones estacionales: Componente de la serie temporal que recoge las oscilaciones periódicas que se producen en periodos de repetición iguales e inferiores a un año.
Problemas que Afectan a un Marco Estadístico
El marco estadístico puede enfrentar varios problemas que afectan a la calidad y confiabilidad de los datos recopilados. Algunos de los principales problemas son:
- Sesgo de selección: Ocurre cuando la muestra utilizada en la recopilación de datos no es representativa de la población objetivo.
- Error de muestreo: Cuanto mayor sea el tamaño de la muestra, menor será el error de muestreo.
- Sesgo de no respuesta: Cuando individuos o grupos de individuos se niegan a participar en la encuesta, puede introducir un sesgo en los resultados.
- Errores de medición: Estos errores pueden afectar la precisión y la validez de los datos.
- Sesgo de respuesta.
- Falta de actualización.
- Problemas de confidencialidad y privacidad.
- Falta de estandarización.
Muestreo por Conglomerados
El muestreo por conglomerados o muestreo por racimos, es un procedimiento de muestreo probabilístico en que los elementos de la población son seleccionados al azar de forma natural por agrupaciones (clusters). Los elementos de muestreo de la población se seleccionan de manera individual, uno cada vez. Un conglomerado consta de elementos heterogéneos, tantos y tanta diversidad como exista en la población, mientras que los distintos conglomerados son homogéneos entre sí.
Deflación de una Serie Económica
Deflactar es eliminar el componente de subida de precios que es inherente a toda serie temporal que viene referida a un valor monetario (ventas de una empresa, depósitos y créditos bancarios…). La utilidad más importante que tienen los índices de precios, aparte de describir el comportamiento de los precios en un periodo de tiempo, es la de deflactar series cronológicas o temporales valoradas en unidades monetarias.
Experimento Determinístico y Experimento Aleatorio
- Experimento determinista: Es aquel que si se repiten las mismas condiciones iniciales, se garantiza el mismo resultado. Ejemplo: al calentar agua, siempre hierve a los 100 grados.
- Experimento aleatorio: Es aquel que si repetimos con las mismas condiciones iniciales, no garantiza los mismos resultados. Ejemplo: cuando tiramos una moneda al aire no sabemos si saldrá cara o cruz.
Muestreo Estratificado y Muestreo por Conglomerados
- Muestreo estratificado: Es una forma de representación estadística que muestra cómo se comporta una característica o una variable en una población a través de hacer evidente el cambio de dicha variable en sus poblaciones o estratos en los que se ha dividido. Consiste en la división previa de la población en grupos que se suponen homogéneos respecto a la característica a estudiar y no se solapen.
- Muestreo por conglomerados: Es un procedimiento de muestreo probabilístico en el que los elementos de la población son seleccionados al azar de forma natural por agrupaciones (clusters). Los elementos de la población se seleccionan de manera individual, uno cada vez.
Marco Estadístico y sus Problemas
El marco estadístico es la lista que nos permite identificar a cada una de las unidades de la población. Es muy importante que la información reflejada en el marco coincida o sea lo más próxima posible a la población, que refleje todas y sólo todas las unidades muestrales, sin ausencias ni duplicaciones de elementos poblacionales. Los principales problemas que puede presentar son:
- Sesgo de selección
- Error de muestreo
- Sesgo de no respuesta
- Errores de medición
- Falta de actualización
- Problemas de confidencialidad y privacidad
- Falta de estandarización
Variaciones Estacionales y Variaciones Accidentales
- Variaciones estacionales: Es la componente de la serie temporal que recoge las oscilaciones periódicas que se producen en períodos de tiempo iguales e inferiores a un año.
- Variaciones accidentales: Es la componente de la serie temporal que recoge las fluctuaciones erráticas que se dan por la ocurrencia de fenómenos imprevisibles.
Muestreo de Conveniencia y Muestreo por Cuotas
Ambos son tipos de muestreos no probabilísticos.
- Muestreo de conveniencia: Deja al entrevistador la selección de los entrevistados, de forma que prime la rapidez y la reducción del coste. Es el tipo de muestreo más barato pero técnicamente el menos recomendable porque genera sesgos de todo tipo.
- Muestreo por cuotas: Una vez fijada la característica poblacional que se conozca la proporción de individuos que la poseen, el investigador facilitará al encuestador el número de individuos que presentando la característica tiene que entrevistar y el número de entrevistas que tiene que realizar a individuos que no presenten la característica. Es el tipo de muestreo no probabilístico más utilizado.
Inconvenientes del Cálculo de la Tendencia por Medias Móviles
El método de las medias móviles se utiliza para calcular tendencias sin tener que ajustarse a una función previa, pero tiene dos inconvenientes principales:
- Pérdida de información (cuanto más largo sea el período u orden de la media móvil más información se pierde).
- Decisión arbitraria del número de períodos utilizados para calcularla.
Tipos de Sucesos Aleatorios
- Suceso seguro: Coincide con el suceso elemental, ya que al realizar el experimento aleatorio se obtendrá con seguridad uno de los posibles resultados o sucesos elementales.
- Suceso imposible: No tiene elementos en el espacio muestral, no sucederá nunca.
- Suceso complementario o suceso contrario: El suceso complementario de A es el suceso compuesto por los sucesos elementales del espacio muestral E que no pertenecen a A.
- Sucesos incompatibles, disjuntos o mutuamente excluyentes: Su intersección es el conjunto vacío.
- Sucesos independientes.
Situaciones para Preferir un Estudio Muestral sobre uno Censal
- Cuando la población sea tan grande que el censo exceda las posibilidades del investigador por su coste económico u organizativo.
- Cuando la población sea lo suficientemente uniforme para que cualquier muestra proporcione una buena representación de ésta.
- Cuando el proceso de investigación o medida de cada elemento sea destructivo o degenerativo.
- Cuando lo exija una economía de coste.
- Por economía de tiempo.
- Por calidad.
Ramas de la Estadística
Las ramas son tres:
- Estadística descriptiva o deductiva: Que nos enseña a tratar y resumir las observaciones de una población o colectivo estudiado en su integridad.
- Cálculo de las probabilidades: Rama de las matemáticas que nos proporciona las herramientas conceptuales que son necesarias para abordar con éxito la inferencia estadística.
- Inferencia estadística: Tiene por objetivo inferir o generalizar de la información obtenida en una muestra, resultados válidos para la población a la que pertenece. Todo ello con unos niveles de confianza y seguridad.
Concepto de Deflactación
Deflactar es eliminar el componente de subida de precios que es inherente a toda serie temporal que viene referida a un valor monetario (ventas de una empresa, los depósitos y créditos bancarios). La utilidad más importante que tienen los índices de precios, aparte de describir el comportamiento de los precios en un periodo concreto), es la de deflactar series cronológicas o temporales valoradas en unidades monetarias.
Muestreo Aleatorio Simple y Muestreo Sistemático
- Muestreo aleatorio simple: Es un conjunto de muestra elegida de población más grande, cada individuo se elige al azar y por pura casualidad. En este tipo de muestreo cualquier individuo tiene la misma probabilidad de ser elegido en cualquier etapa del proceso. Es un tipo de muestreo probabilístico, puede ser muestreo aleatorio simple restricto o muestreo aleatorio simple irrestricto o sin reemplazamiento.
- Muestreo sistemático: Es un tipo de muestreo aplicable cuando los elementos de la población sobre la que se ha realizado el muestreo están ordenados. Este muestreo se basa en tomar muestras de una forma directa y ordenada a partir de una regla determinística, también llamada sistemática.
Concepto de Atributo
Cuando los parámetros o características de la población no son susceptibles de medirse numéricamente, reciben el nombre de atributos (el color de pelo, sexo, profesión, etc.), también pueden llamarse variables de tipo cualitativo. Los atributos, a diferencia de las variables, presentan modalidades o categorías, pueden ser ordenables (p.ej. la satisfacción) y no ordenables (que no permiten un orden) como por ejemplo la nacionalidad. El atributo más simple es el que sólo presenta dos modalidades (presencia/ausencia, favorable/desfavorable, etc.)
Probabilidad a Posteriori o Frecuencial
Es un tipo de probabilidad experimental, se define como el límite de la frecuencia relativa cuando el número de experimentos realizados tiende a infinito.
P(A)= limx→∞ 𝑛𝐴 / 𝑛
Axiomas de Kolmogorov
- Axioma 1: P(A)≥0 para todo suceso A de E, es decir, la probabilidad de un suceso en un experimento es siempre menor o igual que 0.
- Axioma 2: P(E)=1, es decir, la probabilidad de todos los sucesos de un experimento es igual a 1.
- Axioma 3: Si A,B,C,… es una sucesión de sucesos mutuamente excluyentes de E, la probabilidad asociada a la unión de todos ellos (que en un experimento ocurra cualquiera de ellos), es igual a la suma de sus probabilidades. P (A ∪ B ∪ C )= P(A)+P(B)+P(C).