Apuntes resumidos de estadística

TEMA 1: “ORÍGENES DE LA INVESTIGACIÓN SOCIAL”. 21 FEBRERO 2012.

ESTADÍSTICAS: Recolección de datos. El origen de la investigación social se encuentra en ellas. La investigación social como tal nace en Europa. Entre el siglo XVIII y el XIX, las técnicas de investigación social se modernizan. ¿Por qué el estudio de sus orígenes? Para analizar su estado actual de desarrollo y su relación entre las partes, comprender su terminología y prever su desarrollo.

-ASPECTOS A CONSIDERAR.

· XVI-XVIII:

o Conocer la población como finalidad.

o Tamaño de la población medida en vecinas.

o La información primaria la dan las autoridades (alcalde y cura).

· A parir de XVIII:

o Unidad elemental es la persona.

o Sólo defectos de elaboración impiden una cobertura total.

-ASPECTOS GENERALES.

· Investigación social /estadísticas /estadísticas sociales (presentación cuantificada de los fenómenos de carácter económico, social o política);

· Estadística como colección de datos hasta el siglo XIX;

· Censos (estadísticas oficiales): Instrumento necesario e imprescindible para conocer y profundizar en la realidad social.

-ESCUELAS.

· ESTADÍSTICA UNIVERSITARIA:

Se centra en la descripción de las cosas notables en un Estado. Su objetivo es conocer y comparar los diferentes países. Nace con SECKENDORFF. En el siglo XIX esta tradición experimentó una división: ciencia política y la administración pública.

o CONRING (estudia anatomía de España).

o G. ACHENWALL (da definición de estadística: conjunto de lo que es realmente notable en un estado, su constitución en el sentido más general y la exposición de su constitución).

· ARITMÉTICOS POLÍTICOS:

Se basa en su ámbito investigador (es más pragmática). Propulsan la demografía.

o J. GRAUNT: Primer intento de aplicar un razonamiento propiamente estadístico a datos demográficos.

o PETTY: Precursor de los censos de población. Se centra en Estadística política y económica. Precursor del registro general.

· AUTORES DESTACADOS FUERA DE LAS ESCUELAS:

o Y. SINCLAIR:

Utiliza técnicas cuantitativas en los estudios rurales. Colaboró en el clero escocés. Los cuestionarios que utiliza contienen más 100 preguntas. El fallo es que elige la parroquia como unidad y el clero como informador.

o J. HOWARD:

Se preocupa por la situación de los marginados sociales. Detalla estadística descriptiva de todas las cárceles del país con sus presos. Los datos se comprobaron con entrevistas personales y observación.

o QUELET:

Incorpora a la investigación sociológica las técnicas estadísticas. Es considerado el padre de la sociología cuantitativa. Combina cálculo de probabilidades con la realidad social. La perfección de una ciencia se puede medir por la facilidad con que se puede aplicar el cálculo matemático. Aplica el cálculo de probabilidades para explicar la constancia en el tiempo determinados fenómenos.

o F. LE PLAY:

Incorpora el espíritu empirista de su profesión con las investigaciones sociales. Emplea la observación participante, el estudio de las cosas particulares y las técnicas cuantitativas. Sus conclusiones son más útiles para el estadista y el reformador que para el científico. “Su formación de procedimientos metodológicos es única para su época”.

o C. BOOTH:

Su objetivo era mostrar a la mitad de Londres como vivía la otra.

Utilizaba la información del censo y la observación directa. Seguía 4 pasos:

a) Formulación de un programa constructivo de reformas sociales.

b) Mejora de las condiciones actuales.

c) Medir y comparar condiciones.

d) Despertar el deseo de participar en la solución de problemas sociales.

o MARX:

Interés en obtener información de los propios trabajadores. 1ª encuesta por correo (la participación fue muy baja.

o GALLUP, CROSSLEY, ROOPER:

Investigación de mercados / sondeos preelectorales. Predicción con éxito. Impulsaron encuesta por muestreo. Una muestra pequeña pero bien elegida refleja la realidad social mejor que ninguna encuesta. Acertaron quien ganaría las elecciones EEUU.

o P. LAZARSFELD:

Estudió la conducta de voto mediante encuesta por muestreo. Aplicación de

la encuesta panel. Análisis de datos de encuesta: Tablas cruzadas / tipologías.

-EL CASO ESPAÑOL.

Estadísticas anteriores al siglo XVIII. “Trabajos de los políticos españoles.

Censos S. XV realizado por juegos. S.XVII reparto forzoso de juro. Siglo XVIII censos por individuos. Siglo XIX institucionalización de la estadística oficial que se crea en la Comisión General de Estadística. 1862 primera revista.

-GÉNESIS DE LA PROBABILIDAD.

· Concepto de probabilidad – juegos de azar.

· S.XVI Cardano: Concepto de la ley de azar.

· G. Galilei: Casos probables al lanzar tres dados.

· XVII – XIX: Época de oro de la teoría de probabilidad.

· LA PLAS, QUASON, GAUS.

-ESTADÍSTICA COMO CIENCIA.

Cómo obtener conclusiones de la investigación empírica mediante modelos matemáticos.

· PROBLEMAS QUE RESUELVE:

-Descripción de datos.

-Análisis de la muestra.

-Contraste de hipótesis

-Medición de la relación entre variables.

-predicción.

ESTADÍSTICA

“Es la colección de métodos para obtener, resumir, presentar, interpretar, analizar y actuar sobre hechos numéricos relacionados con la actividad de interés”

Nexo común

(Cálculo de probabilidades)

Estadística descriptiva Estadística diferencial

Rama de la estadística que se ocupa de describir Rama de la estadística que se ocupa

determinadas características de un conjunto de de obtener información de las características

actos. (generalmente una muestra) de la población a través de la información que

proporciona una muestra.

TEMA 1.1. EL PROCESO DE INVESTIGACIÓN SOCIAL. 13-21 MARZO 2012

-PROCESO DE INVESTIGACIÓN SOCIAL.

1) ¿QUÉ se quiere hacer? (PROBLEMA que nos llama la atención para que sea analizado)

2) ¿Por DÓNDE empiezo? (DEFINICIÓN del problema de investigación)

3) ¿PARA QUÉ queremos investigar? (OBJETIVOS a lo largo de la investigación)

4) ¿Por dónde CONTINÚO? (Formulación de la hipótesis)

5) ¿CÓMO SE BUSCA o se pregunta lo que se desea averiguar? (TIPO de investigación)

6) ¿A QUIENES investigamos, cuantos, como se les elige? (MUESTRA)

7) ¿CÓMO SE RECOGEN los datos? (METODOLOGÍA)

8) ¿QUÉ HAGO con los datos? (ANÁLISIS de los datos)

9) ¿CÓMO SABER si los datos recogidos son buenos y merecen ser creídos?

(CONTROL de calidad-validez y fiabilidad)

10)¿CUÁNDO CONCLUYE la investigación? (INFORME de la investigación)

11)¿CUÁNTO TIEMPO Y DINERO voy a necesitar? (DURACIÓN Y COSTE)

-PROYECTO DE INVESTIGACIÓN.

Es lo que se antepone a la realización de la investigación y el documento que se presenta a la instancia que la encarga o convoca (alcance y desarrollo/garantía de los que se va a hacer/cómo/cuándo y con qué recursos).

o Necesidad del proyecto:

-Valor de contrato, medio para acordar y evaluar objetivamente la investigación

antes de realizarla (viabilidad y efectividad).

-Evita desajustes que puede producir incremento de esfuerzos/coste/tiempo.

-Previene de posibles problemas y compara diferentes ofertas/proyectos.

o Responde a una necesidad:

Porque hay una demanda y una población como objeto de estudio que será el

campo de investigación. Permite objetivar la propuesta de la investigación y

permite ser evaluado.

o Pasos a seguir en un proyecto de investigación:

1. DEFINICIÓN DEL PROBLEMA: ¿Existe un problema teórico o practico?

¿se puede investigar? ¿su estudio aporta algo? -> Selección de un tema + Planteamiento teórico + Objetivos de investigación + Revisión de la bibliografía + Elaboración de un marco teórico + Justificar la investigación.

2. OPERACIONALIZACIÓN DEL PROBLEMA:

Formulación de hipótesis (supuestos que el investigador hace sobre el comportamiento de variables) + operacionalización de conceptos teóricos.

3. DISEÑO DE LA INVESTIGACIÓN:

v Diseños en función del CONTROL.

o Preexperimentales: Control mínimo.

o Experimentales puros: Su característica distintiva es que los sujetos participantes son distribuidos de forma aleatoria entre los grupos de intervención y el que actúa como control. Control de la variable, ambiente y sujetos. El investigador manipula la variable.

o Cuasiexperimentales: La principal diferencia con los estudios experimentales puros reside en que no hay aleatorización en la distribución del factor que se analiza. Los grupos ya están formados. El investigador u otras circunstancias no aleatorias determinan qué sujetos recibirán la medida que va a evaluarse y quiénes no.

v Diseños en función del TIEMPO.

o Seccionales-Transversales:

La recogida de información se limita a un solo momento temporal.

o Longitudinal: Se limita a diferentes momentos en el tiempo:

§ De tendencia.

§ De cohorte.

§ De panel.

v Diseños en función de la PROFUNDIDAD.

o Exploratorios:

No se identifican con las variables.

o Descriptivos: (Encuesta, observación…)

Se identifican con variables clave y se puede proceder a su descripción.

o Explicativos:

Causas por razones, cómo se relacionan las variables.

o Predictivos:

Se sabe qué va a ocurrir. Son variables estables en el tiempo.

4. ANÁLISIS DE LA INFORMACIÓN OBTENIDA:

Análisis de los datos + Interpretación final de los resultados.

5. INFORME DE INVESTIGACIÓN:

¿A quién va dirigido? ¿Cuál será el formato? ¿Hay que hacer presentaciones?

6. OTROS ASPECTOS A TENER EN CUENTA:

Principales partidas de coste + Tiempo empleado + Calendario de actuaciones +

Si se necesitan ayudas externas + Viabilidad de la investigación.

- Comprobar la validez del diseño:

· Validez INTERNA:

Posibilidad de establecer relaciones de causalidad entre variables dependientes e independientes. Una vez que se ha eliminado el efecto de otras variables y se ha controlado el efecto de posibles variables extrañas. Corresponde a los estudios explicativos. Se puede controlar a priori y a posteriori. Hace referencia a esa relación causal entre variables.

· Validez EXTERNA:

Hacemos referencia a la posibilidad de generalización de los resultados obtenidos (posibilidad de hacer inferencias). Debemos tener en cuenta ese proceso de aleatorización de la formación de variables.

· Validez CONSTRUCTO:

Hacemos referencia al grado de adecuación conseguido de ese concepto (o conceptos) clave en esa investigación. En función de la definición de ese concepto se nos abren alternativas diferentes. Tenemos que operacionalizar ese concepto de forma adecuada (está relacionado con el planteamiento de las hipótesis). Se requiere una operacionalización múltiple.

· Validez ESTADÍSTICA:

Relacionada con el poder y la adecuación de la técnica de análisis de datos que se aplica a nuestro estudio. Hace referencia al tamaño muestral, técnicas de análisis multivariables. Para mayor validez, mayor nº de muestra o mayor homogeneidad.

-INFORME DE INVESTIGACIÓN.

Documento donde se recoge el proceso de investigación, los resultados y las conclusiones. Importante a quién va dirigido y su conocimiento, el material que se utilizará en las presentaciones. Debe aparecer:

- Coste total y por partes.

- Tiempo empleado por etapas.

- Calendario de anotaciones.

· Cuadro: Se plasma el tiempo realizado.

Aparecen etapas en filas y en columnas los meses divididos por semanas.

· Diagrama.

TEMA 2: “EL USO DE FUENTES DOCUMENTALES Y ESTADÍSTICAS”. 27 MARZO – 11 ABRIL.

TIPOS DE DATOS.

- Primarios:

Datos que se han cogido para la investigación por el propio investigador (diseña la inv.)

- Secundarios:

Datos que están ahí, recogidos por personas ajenas a la investigación. Todo dato secundario ha sido primario en algún momento, por tanto son los datos que se basan en datos primarios.

OBJETIVOS.

- Destacar el interés de los datos secundarios.

- Comprender el significado de datos secundarios.

ASPECTOS A CONSIDERAR EN UNA INVESTIGACIÓN.

- El empleo de datos secundarios se ajusta a la estrategia metodológica para resolver problemas de investigación.

- Analizar los objetivos de investigación desde diversas perspectivas.

- Plantearnos la credibilidad de la fuente de información.

- Credibilidad de los datos secundarios.

VENTAJAS DE LOS DATOS SECUNDARIOS.

Generación ideas; Posibilidad de plantear diseños de investigación; Construcción de marcos muestrales; Comprensión del pasado; Accesibilidad, no recreatividad; Replicación y análisis; Barato, rápido y de fácil acceso; A veces el único disponible.

INCONVENIENTES DE LOS DATOS SECUNDARIOS.

Disponibilidad de las fuentes y tiempo de consecución; Problema de investigación-búsqueda de datos; Evaluación de los datos-Calidad de los datos; Problemas de interpretación; Desajustes en la unidad de medida, tiempo, datos desactualizados, fuente, metodología…

CENSOS	-Incluyen toda la población. -Posibilidad de desagregación.	-Alto coste.
REGISTROS	Actualización frecuente.	-Disponible para poblaciones concretas -Pocas variables. -Consulta restringida.
ENCUESTAS	-Menor coste. -Información instantánea. -Mayor nº de variables. -Verificación de datos.	-Errores muestreo. -Dificultades de desagregación por el tamaño de la muestra. -Necesidad de marco muestral.

FUENTES

- Centros productores y bancos de datos -Prensa diaria y especializada

- Fuentes estadísticas españolas -Organismos europeos e internacionales

- Organismos estatales -Bancos de datos.

- Admon. Autonómica -Elaboración encuestas y datos sociológicos

- Admon. Local -Anuarios y recopilaciones estadísticas

- Centros institucionales -Bancos de datos en internet

- Empresas privadas -Centros de documentación

- Bibliotecas -Libros y publicaciones periódicas

TEMA 3: ANÁLISIS DESCRIPTIVO DE UNA VARIABLE.

Estadística Descriptiva: Conjunto de procedimientos necesarios para recoger, clasificar, representar y resumir un conjunto de observaciones.

Estadística Inferencial: Verificación de características de la población (a partir de las muestras representativas de la población).

Muestra (n): Conjunto de la población para analizar un estudio. Debe ser representativa de la población.

Muestreo: Procedimiento estadístico para poder realizar la selección de la muestra (cómo seleccionar a los individuos teniendo en cuenta la información disponible).

Población (N): Conjunto de todos los elementos que cumplen ciertas propiedades específicas al iniciar una investigación o estudio. La población puede ser observada de dos formas posibles: mediante un censo, que consiste en observar a todos los individuos de la población. O mediante la muestra (n), subconjunto de la población que se extrae de ella para obtener información.

Tamaño de la población: Número de individuos que la componen y atendiendo al tamaño clasificaremos las poblaciones en finitas o infinitamente grandes.

Análisis de datos: Conjunto de operaciones a las que el investigador tratará los datos con la finalidad de alcanzar los objetivos. Este conjunto de operaciones no pueden definirse de forma rígida. Es importante planificar los principales aspectos del plan de análisis en función de la verificación de las hipótesis formuladas ya que estas definiciones condicionarán las fases posteriores: Recogida de información.

Plan de análisis estadístico: El plan de análisis estadístico es una etapa definida antes de la recolección de datos. El diseño del cuestionario y también la muestra dependen de la complejidad del análisis.

Estrategia de análisis:

· Análisis exploratorio:

Obtención de medidas resumen y gráficos para el conjunto de datos. Permite la identificación de datos atípicos, extremo o perdidos; descripción; chequeo de supuestos para análisis posteriores; identificación de diferencias entre grupos.

· Análisis univariado:

Primer paso para conocer las distribuciones de frecuencias, permite generar nuevas hipótesis de investigación. Detección de casos atípicos.

o VARIABLES CUALITATIVAS.

Son aquellas que se refieren a una cualidad, no aparecen de forma numérica, sino como categorías o atributos (color de ojos, sexo, profesión, etc.)

¾ Nominal: Clasifica a los sujetos en categorías sin orden.

¾ Ordinal: Clasifica y ordena.

o VARIABLES CUANTITATIVAS.

Son aquellas que se expresan mediante cantidades numéricas con las que podemos realizar operaciones aritméticas.

¾ Discretas: Toman cualquier variable.

¾ Continuas: Pueden tomar cualquier valor dentro de un intervalo.

FRECUENCIAS DE UNA VARIABLE CUALITATIVA.

Consideremos una población estadística de n individuos, descrita según una variable X, cuyas modalidades se denotan mediante x₁, x₂,…, xk.

· Frecuencia absoluta (n_i): Es el número de veces que aparece x_ien la muestra elegida.

· Frecuencia relativa (f_i): Es la proporción de veces que aparece x_i en la muestra elegida.

Es el cociente entre la frecuencia absoluta y el total de

elemento o tamaño que mide la proporción de un valor

dentro de un total.

En muchas ocasiones la frecuencia relativa se expresa en % y representa el porcentaje de individuos que presentan la categoría xi en la muestra. Su cálculo se reduce a multiplicar f_i por 100. Se debe cumplir:

Tabla de frecuencias.

Es donde la información de la variable cualitativa es representada y tiene la siguiente forma:

DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE CUANTITATIVA DISCRETA.

· Frecuencia ABSOLUTA ACUMULADA (suma de frecuencias absolutas) (N_i) del valor x_i, es el número de individuos de la muestra cuyo valor es igual o inferior a x_i. Se representa mediante “N_i” y se calcula:

· Frecuencia RELATIVA ACUMULADA (suma de frecuencias relativas) (F_i) del valor x_i, es la proporción de individuos de la muestra cuyo valor es igual o inferior a x_i. Se representa mediante “F_i” y se calcula:

DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE CUANTITATIVA CONTINUA.

En el caso cuantitativo continuo, se presenta la dificultad de la gran cantidad de valores diferentes que puede tomar la variable, lo que hace que una tabla de frecuencias convencional como las que acabamos de presentar en los casos anteriores no sea útil. La tabla de frecuencias, en este caso, tiene la siguiente estructura:

Se recurre a definir unas clases o intervalos que deben generar una partición de la población, es decir, la medida de la variable en cada individuo pertenecerá a una y sólo una de las clases o intervalos. Habitualmente se construyen con el límite inferior cerrado y el límite superior abierto y haciendo que coincidan el límite superior de un intervalo con el límite inferior del siguiente.

· Marca de clase del intervalo i: Lo representamos mediante el valor x_i, a un punto representativo del intervalo, normalmente al punto medio del intervalo:

· Frecuencia absoluta del intervalo i, es el número de individuos de la muestra cuyo valor de la variable pertenece al intervalo i. La frecuencia absoluta se representa mediante ni.

· Frecuencia relativa del intervalo i, es la proporción de individuos de la muestra cuyo valor de la variable pertenece al intervalo i. La frecuencia relativa se representa mediante fi y se calcula como:

· Frecuencia absoluta acumulada del intervalo i, es el número de individuos de la muestra cuyo valor de la variable pertenece al intervalo i y a los anteriores. La frecuencia absoluta se representa mediante Ni y se calcula como

· Frecuencia relativa acumulada del intervalo i, es la proporción de individuos de la muestra cuyo valor de la variable pertenece al intervalo i y a los anteriores. La frecuencia relativa acumulada se representa mediante Fi y se calcula como

REPRESENTACIONES GRÁFICAS.

Se clasifican según la naturaleza de la variable. Conclusiones tienen que ser = a los hechos.

· Variables tipo cualitativo.

o Diagrama de rectángulos.

En el eje de las abscisas (eje X) se representan las diferentes categorías que toma la variable, mientras que en el eje de las ordenadas (eje Y), sobre cada una de las categorías, se levanta una línea perpendicular de altura igual a la frecuencia (absoluta o relativa) correspondiente a dicha categoría.

o Gráfico de sectores.

El gráfico de sectores consta de un círculo en el que a cada categoría se asigna un sector de área proporcional a la frecuencia de la categoría.

o Pictogramas. (Para cualitativas y cuantitativas).

Divide los rectángulos del diagrama según datos del histograma.

o Cartogramas.

Se sombrea mapas.

o Polígono de frecuencias.

Se obtiene uniendo los extremos superiores de los rectángulos.

· Variables tipo cuantitativas discretas.

Para representar la información de una variable cuantitativa discreta también son adecuados el diagrama de barras, el polígono de frecuencias y el gráfico de sectores.

o Diagrama de frecuencias acumuladas.

Se representan en el eje de abscisas los distintos valores de la variable y sobre cada uno de ellos levantamos una perpendicular cuya longitud sea la frecuencia (absoluta o relativa) acumulada correspondiente a ese valor. En el extremo de cada barra trazamos un segmento horizontal hasta cortar la barra inmediatamente a su derecha.

o Diagrama de tallos y hojas.

En el diagrama de tallos y hojas los datos puntuales se agrupan de tal modo que podemos visualizar la forma de la distribución; mientras que mantenemos la individualidad de los datos puntuales.

· Variables tipo cuantitativas continuas.

o Histograma.

Se representan las frecuencias mediante áreas. Sobre cada intervalo de clase levantamos un rectángulo cuya área sea igual (o proporcional) a la frecuencia (absoluta o relativa) del mismo.

o Polígono de frecuencias.

Se obtiene uniendo los puntos medios de las bases superiores de cada rectángulo del histograma.

o Polígono de frecuencias acumuladas.

En el eje de abscisas (x) representamos los intervalos de clase. Sobre el extremo superior de cada intervalo se levanta una línea vertical de longitud la frecuencia (absoluta o relativa) acumulada del mismo. Uniendo los extremos superiores de cada línea, se obtiene el polígono de frecuencias acumuladas.

o Gráfico-caja o Box-plot.

Una representación gráfica alternativa al histograma para las variables de tipo continuo es el llamado box-plot o gráfico-caja.

MEDIDAS DE CENTRALIZACIÓN, DISPERSIÓN Y FORMA:

Resumen la información proporcionada por las distribuciones de frecuencias a un solo valor o a un número pequeño de valores para facilitar la comparación entre los distintos conjuntos de datos.

· Medidas de centralización y localización:

Indican valores respecto a los cuales los datos parecen agruparse. Las más usuales son:

o Media Aritmética.

Cociente entre la suma de todos los datos y el número de ellos. Si los

datos están agrupados, se multiplica la variable por su frecuencia relativa.

Si los datos no están agrupados:

o Moda.

Llamamos moda a aquel valor de la variable que se presenta con mayor frecuencia; es decir, el de mayor frecuencia absoluta. (Es el valor que más se repite). La moda no tiene porqué ser única. Así podemos tener distribuciones plurimodales: bimodales, trimodales, etc.

o Mediana.

Llamamos mediana al valor de la variable X que divide al conjunto de datos en dos partes iguales; es decir, tal que el número de datos de la muestra que quedan a su izquierda (valores más pequeños) es igual al número de valores que quedan a su derecha (valores más grandes).

Si la distribución es del tipo I y N es impar, existe un único valor de la variable en el centro de la distribución. Si N es par, la mediana es la media aritmética de los dos valores centrales.

Si la distribución es de tipo II, se realiza la tabla en la que aparecen las frecuencias absolutas acumuladas, observamos el primer valor de la variable para el que la frecuencia absoluta acumulada iguale o supere a N/2 y se procede como en el caso anterior.

Cálculo de la mediana de una variable continua.

(a) Dividimos el número de observaciones n entre 2.

(b) Llevamos el valor n /2 a la columna de frecuencias absolutas acumuladas N_i.

acumulada de un cierto intervalo de clase [ak,ak+1), y por tanto la mediana

será el extremo superior del mismo, ak+1.

(d) Si n/2 no se encuentra en la columna de las Ni, estará comprendido entre

dos valores Nky Nk+1, que corresponderán a las frecuencias absolutas

acumuladas de dos intervalos [ak-1,ak) y [ak,ak+1), respectivamente.

Por tanto, la mediana estará en el intervalo [ak,ak+1).

o Cuartiles.

Son los 3 valores de la variable que dividen las observaciones en 4 partes =.

Primer Cuartil (Q1): Es el valor de la variable que deja la cuarta parte de las observaciones inferiores o iguales a él y las tres cuartas partes superiores a él. Para su cálculo se siguen los mismos pasos que para el cálculo de la mediana, pero en vez de tomar n/2, se toma n/4.

Segundo Cuartil (Q2): Es el valor de la variable que deja inferiores o iguales a él las dos cuartas partes (la mitad) de las observaciones. Este cuartil también se llama mediana.

Tercer Cuartil (Q3): Es el valor de la variable que deja inferiores o iguales a él las tres cuartas partes de las observaciones y superior a él la cuarta parte. Su cálculo se efectúa de forma análoga al de la mediana pero considerando 3n/4.

o Deciles.

Se define el decil k-ésimo como el valor de la variable que deja inferiores o iguales a él las k/10 partes de las observaciones. La técnica empleada para su cálculo es la misma que se sigue para el cálculo de la mediana o de los cuartiles, tanto en la caso de variables agrupadas como no agrupadas.

Se denotan por Dk (k=1,2,...,9).

o Centiles o Percentiles.

Se define el centil k-ésimo como el valor de la variable que deja inferiores o iguales a él las k/100 partes de las observaciones. Su cálculo es análogo al de la mediana, los cuartiles y los deciles.

· Medidas de dispersión.

Las medidas de dispersión nos indican si esas observaciones o valores están próximas entre sí o si por el contrario están muy dispersas.

o Varianza.

Diferencia promedio que hay entre cada uno de los valores respecto a su punto central. El valor resultante siempre será positivo.

o Desviación Típica.

Definimos la desviación típica como la raíz cuadrada de la varianza.

o Rango o Recorrido.

Llamamos rango o recorrido a la diferencia entre el valor más grande que toma la variable (máximo) y el valor más pequeño (mínimo).

o Rango Intercuartílico.

Se define el rango intercuartílico como la diferencia entre el cuartil superior o tercer cuartil (Q3) y el cuartil inferior o primer cuartil (Q1). (R_i = Q₃ – Q₁)

o Rango Semintercuartílico.

Diferencia entre el tercer cuartil y el primer cuartil, dividido entre 2.

o Coeficiente de Variación de Pearson.

Llamamos coeficiente de variación al cociente entre la desviación típica y la media aritmética multiplicado por 100.

ANTROPOLOGÍA

Buscar este blog

Apuntes resumidos de estadística

Etiquetas

Comentarios

Publicar un comentario

Entradas populares de este blog

DURKHEIM, "El suicidio" (RESUMEN)

Levi-Strauss y los intercambios matrimoniales. Críticas a Levi-Strauss. Parentesco.

Antropología económica: el KULA y el principio de solidaridad