Fundamentos de Estadística: Conceptos Clave y Tabulación de Datos
Objetivos Generales
Aplicar técnicas y métodos estadísticos descriptivos que permitan interpretar y describir conjuntos de datos, especialmente aquellos referidos a las áreas contable, administrativa y financiera.
Analizar situaciones problemáticas en el ámbito de la estadística descriptiva, con el fin de tomar decisiones adecuadas cuando estas sean requeridas.
Validar y analizar la información estadística desde un punto de vista crítico.
Las decisiones sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden tomarse de manera inteligente solo con la ayuda del análisis estadístico. Los hombres y mujeres de negocios, en su eterna búsqueda de la rentabilidad, consideran que la estadística es esencial en el proceso de toma de decisiones.
La estadística también es muy útil para evaluar las oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de personal y los fabricantes encuentran en ella oportunidades.
Definición de Estadística
“Conjunto de datos y procedimientos para obtener, describir e interpretar un conjunto de datos, de manera que permitan tomar decisiones y predecir fenómenos que pueden expresarse en forma cuantitativa.”
Ramas Principales de la Estadística
- Estadística Descriptiva: Consiste en la recopilación de datos a partir de la observación de una muestra con el propósito de describir las características del fenómeno estudiado.
- Estadística Inferencial: Utiliza métodos que permiten hacer generalizaciones a todo el universo o población en cuestión. Estas generalizaciones tendrán un cierto grado de incertidumbre que será posible evaluar si la muestra es seleccionada con métodos probabilísticos que tienen su origen en los juegos de azar.
Conceptos Fundamentales en Estadística
Población y Censo
Población (Universo): Es el conjunto de todos los elementos que presentan una característica común. Los elementos que integran una población pueden corresponder a personas, objetos o entidades abstractas.
Censo: Recuento de una o más características en una población, con un propósito meramente descriptivo.
Ejemplo:
Las sucursales de una tienda de retail a lo largo del país. Se quiere analizar el perfil de los clientes en la Región Metropolitana. ¿Cuál será la población? ¿Cómo se debe realizar el censo?
La población corresponderá a todas las sucursales de la tienda a lo largo del país. El censo será la medición de todas las variables relevantes para el análisis en todas las sucursales del país. Estas variables pueden incluir características de cada cliente como el sexo, edad, nivel de ingresos, comuna de residencia, estado civil, profesión, etc.
Muestra y Encuesta
Muestra: Es cualquier subconjunto de la población que busca representarla en su totalidad, es decir, se trata de extrapolar o generalizar los resultados de la muestra a la población. Para que la extrapolación anterior sea válida desde el punto de vista estadístico, la muestra debe ser seleccionada aleatoriamente de la población.
Encuesta: Significa medir en una muestra una o más características. Tiene por objeto describir una situación específica existente, explicar relaciones entre diferentes variables y superar la simple enumeración.
Ejemplo:
Se quiere analizar el perfil de los clientes de una empresa financiera de la Región Metropolitana. ¿Cuál será la muestra? ¿Cómo se debe realizar la encuesta?
La muestra será un número determinado de clientes por sucursal dentro de la Región Metropolitana, sin considerar el total de clientes, ya que eso constituye la población o el universo en estudio. Incluso se pueden considerar solo algunas sucursales (esto constituye otra muestra para las sucursales). La encuesta se deberá realizar a los clientes escogidos de la muestra y se preguntarán características socioeconómicas de cada uno, por ejemplo: sexo, edad, nivel de ingresos, estado civil, profesión, etc.
Atributos y Variables
Atributos: Características o datos cualitativos, no mensurables, pero sí contabilizables.
Variables: Características o datos cuantitativos, mensurables que se describen numéricamente.
Ejemplo:
Profesión: Ingeniero, Contador, Técnico
Estado civil: Soltero, Casado, Separado, Viudo
Sexo: Masculino, Femenino
Variables Discretas y Continuas
Variables Continuas: Son aquellas que pueden tomar cualquier valor real dentro de cierto rango. Se identifican fácilmente si, al ir de un valor a otro, pasan por un número infinito de valores intermedios.
Variables Discretas: Son aquellas que toman solo valores enteros. Se identifican fácilmente si, al pasar de un valor a otro, no existe ningún valor intermedio.
Datos Cronológicos y No Cronológicos
Cuando el tiempo de ocurrencia de la característica en estudio constituye un elemento importante, se dice que el conjunto de datos es una *serie cronológica*. En cambio, si en el estudio estadístico no interesa el momento en que se produjeron las observaciones, se dice que los datos forman una *serie no cronológica*.
Series de Datos Unidimensionales y Bidimensionales
Unidimensionales: Cuando se estudia solamente el comportamiento de una variable o atributo, se dice que la serie de datos es *unidimensional*.
Bidimensionales: Cuando se estudian dos variables o dos atributos, o una variable y un atributo, se dice que la serie de datos es *bidimensional*.
Glosario de Términos Estadísticos
- Estadística:
- Conjunto de métodos y procedimientos para obtener, describir e interpretar un conjunto de datos, de manera que permitan tomar decisiones y predecir fenómenos que pueden expresarse en forma cuantitativa.
- Estadística Descriptiva:
- Consiste en la recopilación de datos a partir de la observación de una muestra con el propósito de describir las características del fenómeno estudiado.
- Estadística Inferencial:
- Utiliza métodos que permiten hacer generalizaciones a todo el universo o población en cuestión.
- Población:
- Es el conjunto de todos los elementos que presentan una característica común.
- Censo:
- Recuento de una o más características en una población.
- Muestra:
- Es un subconjunto de la población, es decir, corresponde a un cierto número de elementos de la población que poseen determinadas características.
- Encuesta:
- Significa medir en una muestra una o más características.
- Atributos:
- Características o datos cualitativos, no mensurables, pero sí contabilizables.
- Variables:
- Características o datos cuantitativos, mensurables que se describen numéricamente. Se dividen en variables continuas y discretas.
- Variables Continuas:
- Son aquellas que pueden tomar cualquier valor real dentro de cierto rango.
- Variables Discretas:
- Son aquellas que toman solo valores enteros.
- Parámetro:
- Es una medida descriptiva de la población total de todas las observaciones de interés para el investigador.
- Serie Cronológica:
- Corresponde a una serie de datos cuando el tiempo de ocurrencia de la característica en estudio constituye un elemento importante.
- Serie No Cronológica:
- Corresponde a la serie en la cual no interesa el momento de ocurrencia de las observaciones.
- Series Unidimensionales:
- Es cuando se estudia solamente el comportamiento de una variable o atributo.
- Series Bidimensionales:
- Es cuando se estudian dos variables o dos atributos, o una variable y un atributo.
Distribución de Frecuencias: Conceptos y Simbología
La tabla de frecuencias tiene como finalidad presentar de forma ordenada los valores que toman las diferentes características, de tal modo que el analista pueda tener una visión de conjunto de los datos de clasificación. En ella se indica el número de veces que se repite el atributo o variable.
Definamos la simbología a utilizar en una tabla de distribución:
- N:
- Tamaño de la población.
- n:
- Tamaño de la muestra.
- xi:
- Característica cuantitativa observada i en cada unidad investigada.
- ni:
- Frecuencia absoluta. Número de veces que se repite cada valor de la variable i.
- hi =
:
- Frecuencia relativa de la marca de clase i.
- Nj =
ni:
- Frecuencia absoluta acumulada descendente hasta la marca de clase j.
- Hj =
hi:
- Frecuencia relativa acumulada descendente hasta la marca de clase j.
- m:
- Número de intervalos en que se tabulan los datos o número de valores diferentes que toma la variable.
- yi:
- Marca de clase para cada intervalo, o los diferentes valores que toma la variable.
- yi-1:
- Límite inferior del intervalo i.
- yi:
- Límite superior del intervalo i.
Tabulación por Valor
Este tipo de tabulación agrupa la muestra según los distintos valores que toma la variable. Para ello, es necesario que las variables no tomen muchos valores diferentes dentro de la muestra.
Tabulación por Intervalo
La tabulación por intervalo es adecuada cuando las observaciones toman muchos valores dentro de la muestra, por lo que es necesario agruparlos mediante intervalos.