jueves, 17 de septiembre de 2009

Muestreo

Población
Población o universo va a ser cualquier colección finita de personas u otro tipo de elementos que poseen ciertas características en común. Los elementos de la población son las unidades de las que se busca información y se determinan en función de los objetivos del estudio.

La delimitación de la población o universo se hace en términos de contenido es decir, el tipo de elementos constitutivos ( Ej., estudiantes, hogares, etc.) extensión que se refiere a la atribución espacial asociada a los elementos ( Ej., estudiantes de cierta universidad fabricas de ciertos productos) tiempo para referirse a el momento en que se hace el estudio.


Definición Operacional:
Niños de la calle.- Vivir en la calle
Niños en la calle.- Viven en casa

Cuestionario:
Preguntas Identificación: Domicilio, nombre, TEL
Preguntas Estructura: Geográficas, Admon, muestral

Admon.- las de interés para el estudio
Muestral.- Elementos que se pueden codificar

Preguntas de introducción, esenciales y patrones, integra preguntas de todo tipo, nombre, género, etc. Empezar con preguntas sencillas al igual que al final y en medio las de interés para que tenga confianza en dar las respuestas y luego de ahí las mas comprometedoras.

Preguntas:
Abiertas
Cerradas dicotomicas, opción múltiple o de una sola respuesta, o de opción múltiple no concluyentes (se pueden seleccionar varias)

Ej. Dicotomicas: Trabajas? Respuesta es afirmativa se pasa a otra parte del cuestionario
Ej. Opción Múltiple: se cuenta el número de sujetos, es la suma del total

Deben ser sencillas si entrar a juicios de valor ya que si no se pierde el valor de la pregunta.
Hay que evitar poner 2 preguntas en una . También tomar el nivel de cultura de la gente para las preguntas.

Tipos de Encuesta
Cara a Cara, Correo, Internet, teléfono ( las de TEL, o Internet son mas baratas pero las respuestas son menores o menos reales, y por lo tanto tienen sesgo.



Muestreo Simple Aleatorio para Medias y Totales

Se tiene una población de N unidades y se toma una muestra con las siguientes características:

Tamaño de la muestra n

Las unidades se seleccionan sin reemplazo, lo que equivale a selecciones sucesivas e independientes con probabilidades para cada extracción iguales a: 1/ (N-i) i igual a 1,2,…n-1 (Muestras con las mismas unidades en distinto orden se consideran iguales), por lo cual el numero total de muestras dado por todas las formas de seleccionar n unidades de N en total esta dado por:

Notación: N tamaño de la población, n tamaño muestra yi el valor de la variable estudiada en la iesima unidad de la muestra o de la población, Y el total de la población.



El estimador mas conveniente de la media poblacional es la media muestral.
La media muestral es estimador insesgados de la media poblacional.


Intervalos de Confianza para Medias y Totales

Supongamos que:

Ejemplo: En una biblioteca se han puesto 130 estantes de tamaños semejantes. El número de libros de 15 estantes seleccionados al azar fue registrado de la siguiente manera:
28,23,25,33,31,18,22,29,30,22,26,20,21,28,25

Estime el total de libro en la biblioteca y calcule un intervalo de confianza de 95% para el total.

Media muestral 25.4 (promedio de los datos)
N=130, n=15
Estimador población total = Media muestral* N= 3302
Y el valor de s2=19.257143
Z.975=1.96
Entonces s=4.3992961
Intervalo de confianza:
Y esto es 3302+- 27153572 y el intervalo es: (3030,3574)



Muestreo Aleatorio Simple


Tamaño de la muestra

No depende del tamaño de la población, depende de la hoseneidad( para determinar tamaño muestra) dispersión datos (entre mas variables población objetivo grande muestreo) también depende de buscar menor error y mayor población.
Hay que tener conocimiento aproximado de la varianza de las variables de interés para determinar la precisión que se desea alcanzar (Nivel de confianza o probabilidad asociada ( 90, 95,99%)
Tamaño de la población ( interviene pero no es lo más importante ( en mercadeo 68%)
Formula que relaciona los 4 elementos anteriores.

Calculo del tamaño de la muestra
Donde: S^2 varianza; Z Normal; d Precisión

De los datos del ejemplo anterior:
Z95=1.96; S^2= 14.3323 d=5

Si quieres mucha precisión con S^2 grande se necesita una muestra grande.

Ejemplo:

Una muestra aleatoria de 9 registros de hospital es seleccionada para estimar la cantidad promedio de deuda sobre 484 cuentas abiertas. Estime la media , cantidad promedio de deuda y establezca un intervalo de confianza del 90%

n=9, N= 484
33.5 32 52 43 40 41 45 42.5 39

Media 40.88888889 S^2 = 35.67361111



Muestreo Proporcional

Tengo una muestra N y una proporción con una característica que busco. “A” los tiene y es la característica que nos interesa.


Lo que nos interesa es la proporción.


Propiedades del estimador P

Análisis de la Varianza del estimador de P

P = K / 2K entonces P = 1/2

Tamaño de la Muestra


(En caso de una población no acotada)
Observación: d no tiene nada que ver con Z

Ej1

Z = 1.96
d = precisión absoluta de 2 puntos porcentuales ie .02
P = 20%
Q =80%
no= ( 1.96)^2 ( .2) (.8) / (.02)^2 = 1537

Ej 2

Si no tengo idea del valor de P tomo el valor máximo de la varianza ie P = .5 entonces
no = 2401

Ej 3
N = 10,000 no = 80 p= .25 z= 1.96 d=.03
n=741

Con p =.1 d =.05 entonces el error relativo es del 50%


Ej 4
Supongamos una pregunta si fuma alguien o no entonces es una pregunta dicotómica

N = 10000
n=400 entonces pest = a/n = 0.25
a=100





Muestreo Estratificado

Este se utiliza cuando es más conveniente dividir a la población en subpoblaciones o estratos. Y estos se forman en función de variables altamente correlacionadas con las variables en estudio, como nivel socioeconómico, tamaño localidad, giro de empresa, etc. Los elementos en cada estrato se procura que sean homogéneos con respecto a las características que se investigan para tener mayor eficiencia en ele diseño.

Las ventajas son: reducir el error de muestreo, se gana en precisión, obtener estimaciones separadas del total, permite hacer compensaciones en diseños de muestreo como conglomerados para lograr un mejor optimo en recursos.


Notación:



El estimador de la media de y coincidiría con el estimador de la media de de yst solo en el caso de que se cumpla la siguiente relación de proporcionalidad:


Si se utiliza muestreo aleatorio simple en todos los estratos, la varianza del estimador de la media total yh tiene la expresión siguiente:
El estimador del total Yst se obtiene mediante la multiplicación del estimador de la media total por el tamaño de la población:

La varianza del estimador del total se calcula mediante el producto del cuadrado del tamaño de la población total por la varianza de la media.
Al tener la población dividida en estratos, la variación total de la característica de interés se puede atribuir a la variación dentro de los estratos y la variación entre estratos.

Afijación de la Muestra

Para calcular el tamaño de la muestra n y distribuir este tamaño de muestra entre los L estratos. El tamaño de muestra para cada estrato se designara por nh.
Si n es conocida, diremos que una buena afijación es aquella que nos proporcione máxima precisión para un nivel de confianza dado y con el mínimo costo. (Minimizar la varianza para un costo dado o minimizar el costo para una varianza dada)

El costo es una variable no incluida en lo anterior por lo cual se incluirá con la función siguiente:


Co es el costo fijo (renta de local, equipo, personal de planta)
Ch es el costo variable por entrevista en el estrato h


Asignación de igual numero en cada estrato

La forma mas simple para asignar el tamaño de muestra en cada estrato es dividir el tamaño total de la muestra entre los L estratos.

Entonces: nh=n/L es fácil pero es impractico pues tiene pobre eficiencia.
Y para este caso la varianza es:

Determinación del tamaño de Muestra total n para una Varianza fija D^2


Para obtener el tamaño de la muestra n se parte de la formula que relaciona precisión, confianza y varianza:

se despeja la varianza y se asignan valores a la precisión d y al coeficiente de confianza Z^2(1-α/2) la varianza queda igualada a una constante que llamaremos D2, la varianza deseada.

Y de esta relación se despeja n al poner en forma explicita V(yst) según el criterio de afijación igual para cada estrato.
Afijación proporcional al tamaño del estrato

Se parte de una relación de proporcionalidad que iguala la razón del tamaño del estrato respecto al tamaño de la población con la razón del tamaño de muestra en el estrato respecto al tamaño total de la muestra.

Quedando de la siguiente manera : nh= (n)Nh/N

La varianza de la media de yst cuando se considera este criterio de afijación proporcional es:

El tamaño de muestra total n, suponiendo una varianza deseada D^2 es:Ejemplo:

Suponga que los siguientes datos corresponden a la muestra nh=8, nh=5 y nh=6 de tres estratos de tamaño Nh=90, Nh=40 y Nh=55
Estime las medias de los 3 estratos y del total
Estime las varianzas de cada estrato y del total

Estrato 1 12, 17, 19, 13, 15,13,20,17
Estrato 2 22,24,25,21,28
Estrato 3 31,37,39,32,32,31

Media estrato 1 126/8=15.75
Media estrato 2 120/5=24
Media estrato 3 202/6=33.66

Media total= 90/185 ( Media est 1)+ 40/185 (Media est 2) + 55/185 (Media est 3)
= 7.66+5.189+10.009=22.86036

Var estrato1 =8.78 , var estrato 2 = 7.5; var estrato 3 = 11.866

Varianza total= .50-.05=.45366

Ejemplo 2

Suponga que 600 granjas avicolas se han estratificado de acuerdo a su tamaño, de la siguiente manera:

Afije una muestra de tamaño n=50 proporcional al tamaño del estrato
Estimacion de la media total
Estime el total de aves que ponen a la venta diariamente
Calcule la varianza del estimador de la media total

La afijacion de la muestra

Nh= (Nh/ N)*n

n1=350/600 *50= 29.16 osea 29
n2=175/600 *50=14.58 osea 15
n3=75/600 * 50 = 6.25 osea 6

El estimador de la media es 350/600*40+175/600*160+75/600*520= 135
El estimador del total es N*estimado de la media= 600*135=81000
La varianza del estimador de la media es=.995-.0829= .9126563


Afijación Óptima

Si se incorpora una función de costo (cuando se conoce la cantidad que cuesta levantar un cuestionario en cada estrato.

Donde Co representa costos fijos y Ch el costo de levantar un cuestionario en el estrato h.

Sea C1 al costo total de levantamiento del cuestionario, entonces:

Dado un presupuesto fijo C1 se pretende distribuir n en los L estratos de manera que la varianza de la media poblacional sea minima. Se supone muestreo aleatorio simple en cada estrato.

Usando Lagrange se minimiza la varianza sujeta a las restricciones de costo y se deriva esta función respecto a nh, ( una en especial y el caso se generaliza para cualquier h, y se iguala a cero, quedando la derivada de la siguiente manera:

Tamaño de Muestra total para una varianza deseada D^2 en Afijación Optima

Si la parte del costo variable esta limitado por un presupuesto C1 como se estableció anteriormente, la afijación de la muestra es:

Afijación de Neyman

Este es el caso particular de la afijación optima en el que el costo de cada entrevista es igual en todos los estratos es decir, Ch=C para toda h.

Quedando la formula para el tamaño de muestra por estrato:


El estimador de la varianza de la media es menor mediante el muestreo estratificado con afijación proporcional al compararla con la varianza del estimador de la media resultante del muestreo aleatorio simple.


Muestreo por Conglomerados


Sea yij el valor de la variable en el i esimo conglomerado y la j esima observación.
M el número de conglomerados en la población, m el número de conglomerados en la muestra; Ni tamaño del iesimo conglomerado, ni tamaño de la muestra en el i esimo conglomerado.

Se seleccionan por MAS los m conglomerados y también los ni elementos en los conglomerados de la muestra.

Y total de la población (parámetro de interés)



Muestreo Sistemático (para extracción)

Población cumple que N=kn entonces k=N/n
N total de la población , n muestra.
1-Calculamos el valor de k
2-Extraemos un numero aleatorio A tal que 1<=A<=K
3.-Obtenemos A,A+k, A+2k,…A+(n-1)K

No hay comentarios:

Publicar un comentario