TEMA 1: “ORÍGENES DE LA
INVESTIGACIÓN SOCIAL”. 21
FEBRERO 2012.
ESTADÍSTICAS:
Recolección de datos. El origen de la investigación social se encuentra en
ellas. La investigación social como tal nace en Europa. Entre el siglo XVIII y
el XIX, las técnicas de investigación social se modernizan. ¿Por qué el estudio de sus orígenes? Para
analizar su estado actual de desarrollo y su relación entre las partes,
comprender su terminología y prever su desarrollo.
-ASPECTOS
A CONSIDERAR.
·
XVI-XVIII:
o
Conocer la población como
finalidad.
o
Tamaño de la población medida
en vecinas.
o
La información primaria la
dan las autoridades (alcalde y cura).
·
A parir de XVIII:
o
Unidad elemental es la
persona.
o
Sólo defectos de elaboración
impiden una cobertura total.
-ASPECTOS
GENERALES.
·
Investigación social
/estadísticas /estadísticas sociales (presentación cuantificada de los
fenómenos de carácter económico, social o política);
·
Estadística como colección de
datos hasta el siglo XIX;
·
Censos (estadísticas
oficiales): Instrumento necesario e imprescindible para conocer y profundizar
en la realidad social.
-ESCUELAS.
·
ESTADÍSTICA
UNIVERSITARIA:
Se centra en la descripción de las cosas notables en un Estado. Su
objetivo es conocer y comparar los diferentes países. Nace con SECKENDORFF. En el siglo XIX esta tradición
experimentó una división: ciencia política y la administración pública.
o
CONRING (estudia anatomía de España).
o
G.
ACHENWALL (da definición de estadística: conjunto
de lo que es realmente notable en un estado, su constitución en el sentido más
general y la exposición de su constitución).
·
ARITMÉTICOS
POLÍTICOS:
Se basa en su ámbito investigador (es más pragmática). Propulsan
la demografía.
o
J.
GRAUNT: Primer intento de aplicar un razonamiento
propiamente estadístico a datos demográficos.
o
PETTY: Precursor de los censos de población. Se centra en Estadística
política y económica. Precursor del registro general.
·
AUTORES
DESTACADOS FUERA DE LAS ESCUELAS:
o
Y.
SINCLAIR:
Utiliza técnicas cuantitativas en los estudios rurales. Colaboró
en el clero escocés. Los cuestionarios que utiliza contienen más 100 preguntas.
El fallo es que elige la parroquia como unidad y el clero como informador.
o J. HOWARD:
Se preocupa por la situación de los marginados sociales. Detalla
estadística descriptiva de todas las cárceles del país con sus presos. Los
datos se comprobaron con entrevistas personales y observación.
o
QUELET:
Incorpora a la investigación sociológica las técnicas estadísticas.
Es considerado el padre de la sociología cuantitativa. Combina cálculo de
probabilidades con la realidad social. La perfección de una ciencia se puede
medir por la facilidad con que se puede aplicar el cálculo matemático. Aplica
el cálculo de probabilidades para explicar la constancia en el tiempo
determinados fenómenos.
o
F. LE PLAY:
Incorpora el espíritu empirista de su profesión con las
investigaciones sociales. Emplea la observación participante, el estudio de las
cosas particulares y las técnicas cuantitativas. Sus conclusiones son más
útiles para el estadista y el reformador que para el científico. “Su formación
de procedimientos metodológicos es única para su época”.
o
C. BOOTH:
Su objetivo era mostrar a la mitad de Londres como vivía la otra.
Utilizaba la información del censo y la observación directa.
Seguía 4 pasos:
a) Formulación de un programa constructivo de reformas sociales.
b) Mejora de las condiciones actuales.
c) Medir y comparar condiciones.
d) Despertar el deseo de participar en la solución de problemas
sociales.
o MARX:
Interés en obtener información de los propios trabajadores. 1ª
encuesta por correo (la participación fue muy baja.
o GALLUP, CROSSLEY, ROOPER:
Investigación de mercados / sondeos preelectorales. Predicción con
éxito. Impulsaron encuesta por muestreo. Una muestra pequeña pero bien elegida
refleja la realidad social mejor que ninguna encuesta. Acertaron quien ganaría
las elecciones EEUU.
o
P.
LAZARSFELD:
Estudió la conducta de voto mediante encuesta por muestreo.
Aplicación de
la encuesta panel. Análisis de datos de encuesta: Tablas cruzadas
/ tipologías.
-EL CASO ESPAÑOL.
Estadísticas
anteriores al siglo XVIII. “Trabajos de los políticos españoles.
Censos S. XV
realizado por juegos. S.XVII reparto forzoso de juro. Siglo XVIII censos por
individuos. Siglo XIX institucionalización de la estadística oficial que se
crea en la Comisión General de Estadística. 1862 primera revista.
-GÉNESIS DE LA PROBABILIDAD.
·
Concepto de probabilidad –
juegos de azar.
·
S.XVI Cardano: Concepto de la
ley de azar.
·
G. Galilei: Casos probables
al lanzar tres dados.
·
XVII – XIX: Época de oro de
la teoría de probabilidad.
·
LA PLAS,
QUASON, GAUS.
-ESTADÍSTICA
COMO CIENCIA.
Cómo obtener conclusiones de la
investigación empírica mediante modelos matemáticos.
·
PROBLEMAS
QUE RESUELVE:
-Descripción
de datos.
-Análisis de
la muestra.
-Contraste de
hipótesis
-Medición de
la relación entre variables.
-predicción.
ESTADÍSTICA
“Es la colección de métodos para obtener,
resumir, presentar, interpretar, analizar y actuar sobre hechos numéricos
relacionados con la actividad de interés”
Nexo común
(Cálculo
de probabilidades)
Estadística
descriptiva Estadística diferencial
Rama de la estadística que se ocupa de describir Rama de la estadística que se ocupa
determinadas características de un conjunto de de obtener información de las
características
actos. (generalmente una muestra) de la población a través
de la información que
proporciona una
muestra.
TEMA 1.1. EL PROCESO DE
INVESTIGACIÓN SOCIAL. 13-21
MARZO 2012
-PROCESO DE INVESTIGACIÓN SOCIAL.
1)
¿QUÉ se
quiere hacer? (PROBLEMA que nos llama la atención para que sea analizado)
2)
¿Por
DÓNDE empiezo? (DEFINICIÓN del problema de investigación)
3)
¿PARA QUÉ
queremos investigar? (OBJETIVOS a lo largo de la investigación)
4)
¿Por
dónde CONTINÚO? (Formulación de la hipótesis)
5)
¿CÓMO SE
BUSCA o se pregunta lo que se desea averiguar? (TIPO de investigación)
6)
¿A
QUIENES investigamos, cuantos, como se les elige? (MUESTRA)
7)
¿CÓMO SE
RECOGEN los datos? (METODOLOGÍA)
8)
¿QUÉ HAGO
con los datos? (ANÁLISIS de los datos)
9)
¿CÓMO
SABER si los datos recogidos son buenos y merecen ser creídos?
(CONTROL
de calidad-validez y fiabilidad)
10)¿CUÁNDO CONCLUYE la investigación? (INFORME de la investigación)
11)¿CUÁNTO TIEMPO Y DINERO voy a necesitar? (DURACIÓN Y COSTE)
-PROYECTO DE INVESTIGACIÓN.
Es lo que se antepone a la realización de la investigación y el
documento que se presenta a la instancia que la encarga o convoca (alcance y
desarrollo/garantía de los que se va a hacer/cómo/cuándo y con qué recursos).
o
Necesidad del proyecto:
-Valor de contrato, medio para acordar y
evaluar objetivamente la investigación
antes de
realizarla (viabilidad y efectividad).
-Evita desajustes que puede producir incremento
de esfuerzos/coste/tiempo.
-Previene de posibles problemas y compara
diferentes ofertas/proyectos.
o
Responde a una necesidad:
Porque
hay una demanda y una población como objeto de estudio que será el
campo de
investigación. Permite objetivar la propuesta de la investigación y
permite
ser evaluado.
o Pasos a seguir en un proyecto de
investigación:
1.
DEFINICIÓN
DEL PROBLEMA: ¿Existe un
problema teórico o practico?
¿se puede investigar? ¿su estudio aporta algo?
-> Selección de un tema + Planteamiento teórico + Objetivos de investigación
+ Revisión de la bibliografía + Elaboración de un marco teórico + Justificar la
investigación.
2.
OPERACIONALIZACIÓN
DEL PROBLEMA:
Formulación de hipótesis (supuestos que el investigador hace sobre
el comportamiento de variables) + operacionalización de conceptos teóricos.
3.
DISEÑO DE
LA INVESTIGACIÓN:
v Diseños en función del CONTROL.
o Preexperimentales: Control
mínimo.
o Experimentales puros: Su característica distintiva es que los sujetos
participantes son distribuidos de forma aleatoria entre los grupos de
intervención y el que actúa como control. Control
de la variable, ambiente y sujetos. El investigador manipula la variable.
o Cuasiexperimentales: La principal
diferencia con los estudios experimentales puros reside en que no hay
aleatorización en la distribución del factor que se analiza.
Los grupos ya están formados. El investigador u otras circunstancias no
aleatorias determinan qué sujetos recibirán la medida que va a evaluarse y
quiénes no.
v Diseños en función del TIEMPO.
o Seccionales-Transversales:
La
recogida de información se limita a un solo momento temporal.
o Longitudinal: Se limita a diferentes momentos en el tiempo:
§ De tendencia.
§ De cohorte.
§ De panel.
v Diseños en función de la
PROFUNDIDAD.
o Exploratorios:
No se
identifican con las variables.
o Descriptivos: (Encuesta,
observación…)
Se identifican con variables clave
y se puede proceder a su descripción.
o Explicativos:
Causas por
razones, cómo se relacionan las variables.
o Predictivos:
Se sabe qué va
a ocurrir. Son variables estables en el tiempo.
4.
ANÁLISIS
DE LA INFORMACIÓN OBTENIDA:
Análisis de los datos + Interpretación final de
los resultados.
5.
INFORME
DE INVESTIGACIÓN:
¿A quién va dirigido? ¿Cuál será el formato? ¿Hay que hacer
presentaciones?
6.
OTROS
ASPECTOS A TENER EN CUENTA:
Principales partidas de coste + Tiempo empleado
+ Calendario de actuaciones +
Si se necesitan ayudas externas + Viabilidad de la investigación.
-
Comprobar
la validez del diseño:
·
Validez INTERNA:
Posibilidad de establecer relaciones de
causalidad entre variables dependientes e independientes. Una vez que se ha
eliminado el efecto de otras variables y se ha controlado el efecto de posibles
variables extrañas. Corresponde a los estudios explicativos. Se puede controlar
a priori y a posteriori. Hace referencia a esa relación causal entre variables.
·
Validez EXTERNA:
Hacemos referencia a la posibilidad de
generalización de los resultados obtenidos (posibilidad de hacer inferencias).
Debemos tener en cuenta ese proceso de aleatorización de la formación de variables.
·
Validez CONSTRUCTO:
Hacemos referencia al grado de adecuación
conseguido de ese concepto (o conceptos) clave en esa
investigación. En función de la definición de ese concepto se nos abren
alternativas diferentes. Tenemos que operacionalizar ese concepto de forma
adecuada (está relacionado con el planteamiento de las hipótesis). Se requiere
una operacionalización múltiple.
·
Validez ESTADÍSTICA:
Relacionada con el poder y la adecuación de
la técnica de análisis de datos que se aplica a nuestro estudio. Hace
referencia al tamaño muestral, técnicas
de análisis multivariables. Para mayor validez, mayor nº de muestra o mayor
homogeneidad.
-INFORME DE
INVESTIGACIÓN.
Documento donde se recoge el proceso
de investigación, los resultados y las conclusiones. Importante a quién va
dirigido y su conocimiento, el material que se utilizará en las presentaciones.
Debe aparecer:
-
Coste total y por partes.
-
Tiempo empleado por etapas.
-
Calendario de anotaciones.
·
Cuadro: Se plasma el tiempo realizado.
Aparecen etapas en filas
y en columnas los meses divididos por semanas.
·
Diagrama.
TEMA 2: “EL USO DE FUENTES
DOCUMENTALES Y ESTADÍSTICAS”. 27
MARZO – 11 ABRIL.
TIPOS DE
DATOS.
-
Primarios:
Datos que se han cogido para la
investigación por el propio investigador (diseña la inv.)
-
Secundarios:
Datos que están ahí,
recogidos por personas ajenas a la investigación. Todo dato secundario ha sido
primario en algún momento, por tanto son los datos que se basan en datos
primarios.
OBJETIVOS.
-
Destacar el interés de los datos secundarios.
-
Comprender el significado de datos secundarios.
ASPECTOS A CONSIDERAR EN UNA
INVESTIGACIÓN.
-
El empleo de datos secundarios se ajusta a la estrategia
metodológica para resolver problemas de investigación.
-
Analizar los objetivos de investigación desde diversas
perspectivas.
-
Plantearnos la credibilidad de la fuente de información.
-
Credibilidad de los datos secundarios.
VENTAJAS
DE LOS DATOS SECUNDARIOS.
Generación ideas; Posibilidad de plantear diseños de investigación;
Construcción de marcos muestrales; Comprensión del pasado; Accesibilidad,
no recreatividad; Replicación y análisis; Barato, rápido y de fácil acceso;
A veces el único disponible.
|
INCONVENIENTES DE LOS DATOS SECUNDARIOS.
Disponibilidad de las fuentes y
tiempo de consecución; Problema de investigación-búsqueda de datos;
Evaluación de los datos-Calidad de los datos; Problemas de interpretación;
Desajustes en la unidad de medida, tiempo, datos desactualizados, fuente,
metodología…
|
CENSOS
|
-Incluyen toda la
población.
-Posibilidad de
desagregación.
|
-Alto coste.
|
REGISTROS
|
Actualización frecuente.
|
-Disponible para poblaciones
concretas
-Pocas variables.
-Consulta
restringida.
|
ENCUESTAS
|
-Menor coste.
-Información instantánea.
-Mayor nº de variables.
-Verificación de datos.
|
-Errores muestreo.
-Dificultades de
desagregación por el tamaño de la muestra.
-Necesidad de
marco muestral.
|
FUENTES
-
Centros productores y bancos de
datos -Prensa diaria y
especializada
-
Fuentes estadísticas
españolas -Organismos europeos e
internacionales
-
Organismos estatales -Bancos
de datos.
-
Admon. Autonómica -Elaboración
encuestas y datos sociológicos
-
Admon. Local -Anuarios
y recopilaciones estadísticas
-
Centros institucionales -Bancos de
datos en internet
-
Empresas privadas -Centros
de documentación
-
Bibliotecas -Libros
y publicaciones periódicas
TEMA 3: ANÁLISIS DESCRIPTIVO DE UNA VARIABLE.
Estadística Descriptiva: Conjunto de
procedimientos necesarios para recoger, clasificar, representar y resumir un
conjunto de observaciones.
Estadística Inferencial: Verificación de
características de la población (a partir de las muestras representativas de la
población).
Muestra (n): Conjunto de la población para
analizar un estudio. Debe ser representativa de la población.
Muestreo: Procedimiento estadístico para poder
realizar la selección de la muestra (cómo seleccionar a los individuos
teniendo en cuenta la información disponible).
Población (N): Conjunto de todos los elementos
que cumplen ciertas propiedades específicas al iniciar una investigación o
estudio. La población puede ser observada de dos formas posibles: mediante un censo, que consiste en observar
a todos los individuos de la población. O mediante la muestra (n), subconjunto de la población que se extrae de
ella para obtener información.
Tamaño de la población: Número de individuos
que la componen y atendiendo al tamaño clasificaremos las poblaciones en finitas
o infinitamente grandes.
Análisis de datos: Conjunto de operaciones
a las que el investigador tratará los datos con la finalidad de alcanzar los
objetivos. Este conjunto de operaciones no pueden definirse de forma rígida. Es
importante planificar los principales aspectos del plan de análisis en función
de la verificación de las hipótesis formuladas ya que estas definiciones
condicionarán las fases posteriores: Recogida de información.
Plan de análisis estadístico: El plan de
análisis estadístico es una etapa definida antes de la recolección de datos. El
diseño del cuestionario y también la muestra dependen de la complejidad del
análisis.
Estrategia de análisis:
·
Análisis exploratorio:
Obtención de medidas resumen y
gráficos para el conjunto de datos. Permite la identificación de datos
atípicos, extremo o perdidos; descripción; chequeo de supuestos para análisis
posteriores; identificación de diferencias entre grupos.
·
Análisis univariado:
Primer paso para conocer las
distribuciones de frecuencias, permite generar nuevas hipótesis de
investigación. Detección de casos atípicos.
o
VARIABLES CUALITATIVAS.
Son aquellas que se refieren a una cualidad, no aparecen de forma numérica,
sino como categorías o atributos (color de ojos, sexo, profesión, etc.)
¾
Nominal: Clasifica a los sujetos en
categorías sin orden.
¾
Ordinal: Clasifica y ordena.
o
VARIABLES CUANTITATIVAS.
Son aquellas que se expresan mediante cantidades numéricas
con las que podemos realizar operaciones aritméticas.
¾
Discretas: Toman cualquier variable.
¾
Continuas: Pueden tomar cualquier valor
dentro de un intervalo.
¾
FRECUENCIAS DE UNA VARIABLE CUALITATIVA.
Consideremos una población estadística de n individuos, descrita
según una variable X, cuyas modalidades se denotan mediante x1, x2,…,
xk.
·
Frecuencia absoluta (ni):
Es el número de veces que aparece xi
en la muestra elegida.
·
Frecuencia relativa (fi):
Es la proporción de veces que
aparece xi en la muestra elegida.
Es el cociente entre la frecuencia
absoluta y el total de
elemento o tamaño que mide la proporción
de un valor
dentro de un total.
En muchas
ocasiones la frecuencia relativa se expresa en % y representa el porcentaje de
individuos que presentan la categoría xi en la muestra. Su cálculo se reduce a multiplicar
fi por 100. Se debe cumplir:
Tabla de
frecuencias.
Es donde la información de la variable cualitativa es representada y tiene
la siguiente forma:
DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE
CUANTITATIVA DISCRETA.
·
Frecuencia ABSOLUTA ACUMULADA (suma de frecuencias absolutas) (Ni) del valor xi,
es el número de individuos de la muestra cuyo valor es igual o inferior a xi.
Se representa mediante “Ni” y
se calcula:
·
Frecuencia RELATIVA ACUMULADA (suma de frecuencias relativas) (Fi) del valor xi,
es la proporción de individuos de la muestra cuyo valor es igual o inferior a xi.
Se representa mediante “Fi” y se calcula:
DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE
CUANTITATIVA CONTINUA.
En el caso cuantitativo continuo, se presenta la dificultad
de la gran cantidad de valores diferentes que puede tomar la variable, lo que hace
que una tabla de frecuencias convencional como las que acabamos de presentar en
los casos anteriores no sea útil. La tabla de
frecuencias, en este caso, tiene la siguiente estructura:
Se recurre a definir unas clases
o intervalos que deben generar una partición de la
población, es decir, la medida de la variable en cada individuo pertenecerá a
una y sólo una de las clases o intervalos. Habitualmente se construyen con el límite inferior
cerrado y el límite superior abierto y haciendo que coincidan el límite superior de un intervalo
con el límite inferior del siguiente.
·
Marca de clase del intervalo i: Lo
representamos mediante el valor xi, a un punto representativo del
intervalo, normalmente al punto medio del intervalo:
·
Frecuencia absoluta del intervalo i, es el número de individuos de la muestra cuyo valor de la variable
pertenece al intervalo i. La frecuencia absoluta se representa mediante ni.
·
Frecuencia relativa del intervalo i, es la proporción de individuos de la muestra cuyo valor de la variable
pertenece al intervalo i. La frecuencia relativa se representa mediante fi y se
calcula como:
·
Frecuencia absoluta acumulada del
intervalo i, es el número de individuos de la muestra cuyo valor de la
variable pertenece al intervalo i y a los anteriores. La frecuencia absoluta se
representa mediante Ni y se calcula como
·
Frecuencia relativa acumulada del
intervalo i, es la proporción de individuos de la muestra cuyo valor de
la variable pertenece al intervalo i y a los anteriores. La frecuencia relativa
acumulada se representa mediante Fi y se calcula como
REPRESENTACIONES GRÁFICAS.
Se clasifican según la naturaleza de la variable. Conclusiones tienen que
ser = a los hechos.
·
Variables tipo
cualitativo.
o
Diagrama de rectángulos.
En el eje de las abscisas (eje X) se
representan las diferentes categorías que toma la variable, mientras que en el
eje de las ordenadas (eje Y), sobre cada una de las categorías, se levanta una
línea perpendicular de altura igual a la frecuencia (absoluta o relativa)
correspondiente a dicha categoría.
o
Gráfico de sectores.
El gráfico de sectores consta de un
círculo en el que a cada categoría se asigna un sector de área proporcional a
la frecuencia de la categoría.
o Pictogramas.
(Para cualitativas y cuantitativas).
Divide los rectángulos del diagrama
según datos del histograma.
o Cartogramas.
Se sombrea mapas.
o Polígono de frecuencias.
Se obtiene uniendo los extremos
superiores de los rectángulos.
·
Variables tipo cuantitativas
discretas.
Para representar la información de una variable cuantitativa discreta
también son adecuados el diagrama de barras, el polígono de frecuencias y el gráfico de sectores.
o Diagrama de frecuencias acumuladas.
Se representan en el eje de abscisas los distintos
valores de la variable y sobre cada uno de ellos levantamos una perpendicular
cuya longitud sea la frecuencia (absoluta o relativa) acumulada correspondiente
a ese valor. En el extremo de cada barra trazamos un segmento horizontal hasta
cortar la barra inmediatamente a su derecha.
o Diagrama de tallos y hojas.
En el diagrama de tallos y hojas los datos
puntuales se agrupan de tal modo que podemos visualizar la forma de la
distribución; mientras que mantenemos la individualidad de los datos puntuales.
·
Variables tipo cuantitativas continuas.
o
Histograma.
Se representan las frecuencias
mediante áreas. Sobre cada intervalo de clase levantamos un rectángulo cuya
área sea igual (o proporcional) a la frecuencia (absoluta o relativa) del mismo.
o
Polígono de frecuencias.
Se obtiene uniendo los puntos medios
de las bases superiores de cada rectángulo del histograma.
o
Polígono de frecuencias acumuladas.
En el eje de abscisas (x)
representamos los intervalos de clase. Sobre el extremo superior de cada
intervalo se levanta una línea vertical de longitud la frecuencia (absoluta o relativa)
acumulada del mismo. Uniendo los extremos superiores de cada línea, se obtiene el
polígono de frecuencias acumuladas.
o
Gráfico-caja o Box-plot.
Una representación gráfica alternativa al histograma para
las variables de tipo continuo es el llamado box-plot o gráfico-caja.
MEDIDAS DE CENTRALIZACIÓN, DISPERSIÓN Y FORMA:
Resumen la información proporcionada por las
distribuciones de frecuencias a un solo valor o a un número pequeño de valores
para facilitar la comparación entre los distintos conjuntos de datos.
·
Medidas de centralización y localización:
Indican valores respecto a los cuales los datos parecen agruparse. Las más
usuales son:
o
Media Aritmética.
Cociente entre la suma de todos los datos y el número de ellos. Si los
datos están
agrupados, se multiplica la variable por su frecuencia relativa.
Si los datos no están agrupados:
o
Moda.
Llamamos moda a aquel valor de la
variable que se presenta con mayor frecuencia;
es decir, el de mayor frecuencia absoluta. (Es el valor que más se
repite). La moda no tiene porqué ser única. Así podemos tener distribuciones plurimodales:
bimodales, trimodales, etc.
o
Mediana.
Llamamos mediana al valor de la variable X que
divide al conjunto de datos en dos partes iguales; es decir, tal que el número
de datos de la muestra que quedan a su izquierda (valores más pequeños) es
igual al número de valores que quedan a su derecha (valores más grandes).
Si la distribución es del tipo I y N es impar,
existe un único valor de la variable en el centro de la distribución. Si N es
par, la mediana es la media aritmética de los dos valores centrales.
Si la distribución es de tipo II, se realiza la
tabla en la que aparecen las frecuencias absolutas acumuladas, observamos el
primer valor de la variable para el que la frecuencia absoluta acumulada iguale
o supere a N/2 y se procede como en el caso anterior.
Cálculo de la mediana de una variable continua.
(a) Dividimos el número de observaciones n entre 2.
(b) Llevamos el valor n /2 a la columna de frecuencias absolutas acumuladas Ni.
(c) Si este valor se encuentra en la tabla, es que n/2 será la frecuencia absoluta
acumulada
de un cierto intervalo de clase [ak,ak+1), y por tanto la mediana
será
el extremo superior del mismo, ak+1.
(d) Si n/2 no se encuentra en la columna de las Ni, estará comprendido entre
dos
valores Nky Nk+1, que corresponderán a las frecuencias absolutas
acumuladas
de dos intervalos [ak-1,ak) y [ak,ak+1), respectivamente.
Por
tanto, la mediana estará en el intervalo [ak,ak+1).
o
Cuartiles.
Son los 3 valores de la variable que dividen las
observaciones en 4 partes =.
Primer Cuartil (Q1): Es el valor de la variable que deja la cuarta parte de
las observaciones inferiores o iguales a él y las tres cuartas partes
superiores a él. Para su cálculo se siguen los mismos pasos que para el cálculo
de la mediana, pero en vez de tomar n/2, se toma n/4.
Segundo Cuartil (Q2): Es
el valor de la variable que deja inferiores o iguales a él las dos cuartas
partes (la mitad) de las observaciones. Este cuartil también se llama mediana.
Tercer Cuartil (Q3): Es
el valor de la variable que deja inferiores o iguales a él las tres cuartas
partes de las observaciones y superior a él la cuarta parte. Su cálculo se
efectúa de forma análoga al de la mediana pero considerando 3n/4.
o
Deciles.
Se define el decil k-ésimo como el valor de la variable que deja inferiores o
iguales a él las k/10 partes de las observaciones. La técnica empleada para su
cálculo es la misma que se sigue para el cálculo de la mediana o de los
cuartiles, tanto en la caso de variables agrupadas como no agrupadas.
Se denotan por Dk (k=1,2,...,9).
o
Centiles o Percentiles.
Se define el centil k-ésimo como el valor de la variable que deja inferiores o
iguales a él las k/100 partes de las observaciones. Su cálculo es análogo al de la mediana, los cuartiles y
los deciles.
·
Medidas de dispersión.
Las medidas de
dispersión nos indican si esas observaciones o valores están próximas entre sí
o si por el contrario están muy dispersas.
o
Varianza.
Diferencia promedio que hay entre cada uno de los valores
respecto a su punto central. El valor resultante siempre será positivo.
o Desviación Típica.
Definimos la desviación típica como la
raíz cuadrada de la varianza.
o
Rango o Recorrido.
Llamamos rango o recorrido a la diferencia entre el valor más grande que
toma la variable (máximo) y el valor más pequeño (mínimo).
o
Rango Intercuartílico.
Se define el rango intercuartílico como la diferencia entre el cuartil
superior o tercer cuartil (Q3) y el cuartil inferior o primer cuartil (Q1).
(Ri = Q3 – Q1)
o
Rango Semintercuartílico.
Diferencia entre el tercer cuartil y el primer
cuartil, dividido entre 2.
o
Coeficiente de Variación de Pearson.
Llamamos coeficiente de variación al cociente entre la desviación típica y
la media aritmética multiplicado por 100.
Comentarios
Publicar un comentario