La investigación cuya finalidad es: el análisis o experimentación de situaciones para el descubrimiento de nuevos hechos, la revisión o establecimiento de teorías y las aplicaciones prácticas de las mismas, se basa en los principios de Observación y Razonamiento y necesita en su carácter científico el análisis técnico de Datos para obtener de ellos información confiable y oportuna. Este análisis de Datos requiere de la Estadística como una de sus principales herramientas, por lo que los investigadores de profesión y las personas que de una y otra forma la realizan requieren además de los conocimientos especializados en su campo de actividades, del manejo eficiente de los conceptos, técnicas y procedimientos estadísticos.

 

ESTADISTICA

Es el conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales.

Es un valor calculado a partir de los datos de una muestra, que cuantifica una característica de ella.

1. ESTADISTICA DESCRIPTIVA

Proporciona las herramientas para organizar, simplificar, representar y resumir la información básica a partir de un conjunto de datos, para la toma de decisiones más efectiva. Además es el método de obtener de un grupo de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por éstos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una población o de una muestra. Para esto se utilizan las tablas y gráficos de frecuencias absolutas y relativas; los estimadores de las medidas de tendencia central, la dispersión, el sesgo y la Kurtosis. 

1.1 TABLAS DE FRECUENCIAS : Es una tabla resumen en la que se disponen los datos divididos  en grupos ordenados numéricamente llamados clases. El número de observaciones que pertenecen a determinadas clases se denomina frecuenias de clase; el punto medio de cada clase se llama marca de clase y la longitud de una clase se conoce como intervalo de clase.

- Frecuencia Absoluta es el número de observaciones iguales o semejantes que se encuentran dentro de un intervalo de clase.

- Frecuencia Relativa es el cociente que resulta de dividir la frecuencia absoluta de una clase para la suma total de frecuencias de todas las clases de unat tabla de frecuencias.

1.1.2 REPRESENTACION GRÁFICA: La representación gráfica de una distribución de frecuencias depende del tipo de datos que la constituyan. Dentro de ellas tenemos:

- Gráfico de Barras: Es una representación de una distribución de frecuencias; esta gráfica se la puede realizar tanto para datos no agrupados y para datos  agrupados; es así para datos no agrupados se grafica poniendo en el eje X la variable y en el eje Y las frecuencias.

- Histograma: Es una representación por áreas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.

- Poligono de  Frecuencias: Es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse uniendo los puntos medios de los techos de los rectángulos del histograma.

- Gráfica Circular: Este método circular es el más usual; por lo tanto este es un diagrama en forma de círculo, es útil para visualizar las diferencias en frecuencia entre algunas categorias de nivel nominal.


1.2 MEDIDAS DESCRIPTIVAS

Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cuál se agrupan los datos, se asocie una medida que haga referencia a la variabilidad que refleje dicha fluctuación.

Los estadisticos nos van a orientar sobre cada uno de estos niveles de información; valores alrededor de los cuales se agrupa la muestra, mayor o menor fluctuación alrededor de los valores, para ello se tomará en  cuenta ciertos valores que marcan ciertas posiciones de una distribución de frecuencias así como su simetría y su forma.

Tenemos las más comunes:

  • La tendencia central.
  •  La dispersión o variación con respecto a este centro;
  •  Los datos que ocupan ciertas posiciones.
  •  La simetría de los datos.
  • La forma en la que los datos se agrupan.

1.2.1 ESTADíSTICOS DE TENDENCIA CENTRAL

Es un indicador numérico que representa el comportamiento que se considera más representativo de un grupo de valores. Las medidas más utilizadas son: media aritmética, mediana y la moda.

1.2.1.1 MEDIA ARITMETICA   

Conocida también como media o promedio; es unamedida descriptiva que se calcula sumando los valores numéricos y dividiendo         

Media muestral

 

1.2.1.2 MEDIANA

Es el valor medio de los datos después de ordenar de manera ascendente o descendente, si el número de datos es impar, la mediana es el dato central; pero si la serie es par la mediana es el promedio de los dos datos centrales.De esta manera se obtiene que el  50% de las observaciones se encuentran por arriba  de la mediana y el 50% por debajo de ella.  Sus fórmulas son:

Series simples

Serie para datos sin agrupar:

Datos agrupados:

1.2.1.3 MODA

Es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite. Cuando existen dos valores que se repiten con mayor frecuencia la distribución se denomina bimodal y si tenemos más de dos valores que tienen la mayor frecuencia la distribución es multimodal.Su fórmula es:

Datos agrupados:


1.2.2 MEDIDAS DE DISPERSION

Las medidas de tendencia central o de posición nos indica donde se sitúa un grupo de datos. Los de variablidad o dispersión nos indican si estos están próximos entre si o por el contrario está muy dispersos. Entre estas medidas tenemos:

  • Rango
  • Desviación estándar
  • Varianza 
  • Coeficiente de variación de Pearson

1.2.2.1 RANGO  ( R )

Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos, es fácil de calcular y sus unidades son las mismas que las de la variable. Posee algunos inconvenientes; no utiliza todas las observaciones (solo 2 de ellas),  también puede verse afectada por alguna observación extrema.

Su fórmula es:           R   =  Dato máximo  -  Dato mínimo

Cuando se trata de datos agrupados, el rango se obtienen restando el límite inferior de la clase más pequeña del límite superior de la clase mayor.

1.2.2.2 DESVIACION ESTÁNDAR

Es la diferencia entre el valor de un dato y el valor de la media de su distribución, también mide la variabilidad de las observaciones con respecto a la media, es igual a la raíz cuadrada de la varianza. Esta medida de dispersión siempre es positiva. Su fórmula es.

 

1.2.2.3 VARIANZA

Mide la distancia existente entre los valores de la serie y la media. La varianza siempre será mayor que cero. Mientras más cerca se encuentren los valores de cero, estos valores estan más concentrados alrededor de la media; además es el cuadrado de la desviación estándar. Su ecuación es:

Datos simples

Varianza de la muestra:

1.2.2.4 COEFICIENTE DE VARIACIÓN DE PEARSON  ( CV )

Se calcula como cuociente entre la desviación estándar y la media, multiplicado por 100

Coeficiente de variación para una muestra:

Coeficiente de variación para una población:

 

 

 


1.2.3     MEDIDAS DE POSICION

Las medidas de posición o localización dividen la distribución en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra. Éstas son:

Cuartiles: Divide a la población o muestra en cuatro partes iguales.

Deciles: Divide a la población en diez partes iguales.

Percentiles: Divide a la población en cien partes iguales.

1.2.3.1 SIMETRIA DE DATOS

Sabemos cómo calcular valores alrededor de los cuales se distribuyen las observaciones de una variable sobre una muestra y sabemos cómo calcular la dispersión que ofrecen los mismos con respecto al valor  central. Nos proponemos dar un paso más allá en el análisis de la variable. En primer lugar, nos vamos a plantear el saber si los datos se distribuyen de forma simétrica con respecto a un valor central, o si bien la gráfica que representa la distribución de frecuencias es de una forma diferente del lado derecho que del lado izquierdo.

 

Entonces se observa que un valor positivo significa una acumulación de medidas superior a la media y un valor negativo que la acumulación es inferior. El valor cero indica una simetría perfecta.

1.2.3.2 MEDIDA DE APUNTAMIENTO; CURTOSIS

La curtosis es una medida del apuntamiento, que nos indicará si la distribución es muy apuntada o poco apuntada. Este coeficiente lo vamos a denotar por K.

 

a) Leptocúrtica (concentración al centro): Si el grado de apuntalamiento de una distribución es mayor que el de la distribución normal.
b) Mesocúrtica (distribuidos simétricamente): Si el grado de apuntalamiento de una distribución es igual que el de la distribución normal.
c) Platicúrtica (aplanada).Si el grado de apuntalamiento de una distribución es menor que el de la distribución normal.

También de esta manera podemos ver cuando las medidas de tendencia central son símetricas. 

Una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.

 

 

 

 

 

 

 

 

Buy Bitcoins with Credit Card

Formulario de Ingreso