Muestreo y tipos.
MUESTREO.
En ocasiones en que no
es posible o conveniente realizar un censo (analizar a todos los elementos de
una población), se selecciona una muestra, entendiendo por tal una parte representativa
de la población. El muestreo es por lo tanto una herramienta de la investigación
científica, cuya función básica es determinar que parte de una población debe
examinarse, con la finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr
una representación adecuada de la población, en la que se reproduzca de la
mejor manera los rasgos esenciales de dicha población que son importantes para
la investigación. Para que una muestra sea representativa, y por lo tanto útil,
debe de reflejar las similitudes y diferencias encontradas en la población, es
decir ejemplificar las características de ésta.
Los errores más comunes
que se pueden cometer son:
1.- Hacer conclusiones
muy generales a partir de la observación de sólo una parte de la población, se
denomina error de muestreo.
2.- Hacer
conclusiones hacia una Población mucho más grandes de la que originalmente se tomó
la muestra. Error de Inferencia. En la estadística se usa la palabra población
para referirse no sólo a personas sino a todos los elementos que han sido
escogidos para su estudio y el término muestra se usa para describir una
porción escogida de la población.
Las encuestas
por muestreo consisten en extraer de una población finita de N unidades,
subpoblaciones de un tamaño fijado de antemano. Si todas las unidades son
indistinguibles, el número de muestras de tamaño n viene dado por:
Por ejemplo,
si la población contiene 5 unidades A, B, C, D, E; existen 10 muestras
diferentes de tamaño 3, que son:
ABC, ABD,
ABE, ACD, ACE
ADE, BCD,
BCE, BDE. CDE
Debe notarse
que la misma letra no ocurre dos veces en la misma muestra; y, también, que el
orden de los elementos no tiene importancia, las seis muestras ABC, ACB, BAC,
BCA, CAB, CBA son consideradas como iguales.
El muestreo
aleatorio simple es un método de selección de n unidades sacadas de N, de tal
manera que cada una de las muestras tiene la misma probabilidad de ser elegida.
En la
práctica una muestra aleatoria simple es extraída de la siguiente forma:
Se numeran
las unidades de la población del 1 al N, y por medio de una tabla de números
aleatorios o colocando los números 1 a N en una urna, se extraen sucesivamente
n números. Las unidades que llevan estos números constituyen la muestra.
El método elegido
debe de verificar que en cualquier fase de la obtención de la muestra cada
individuo que no ha sido sacado previamente, tiene la misma
probabilidad de ser elegido.
Es fácil ver
que cada una de las NCn muestras tiene igual
posibilidad de obtenerse.
Cuando un
número ha sido sacado de la urna, éste no es reemplazado, ya que esto daría
lugar a que la misma unidad entrara en la muestra más de una vez. Por esta
razón el muestreo es descrito como sin reemplazo. El muestreo con reemplazo, es
totalmente factible, aunque rara vez es usado, ya que no se ve la conveniencia
de tener el mismo individuo dos veces en la misma muestra.
En este tipo
de muestreo, la población de N unidades es dividida en subpoblaciones de N1,
N2, …, NL unidades, respectivamente. Estas
subpoblaciones no se sobreponen y juntas forman la totalidad de la población,
por lo que
N1+
N2+ …+ NL = N
Las
subpoblaciones son llamados estratos. Para obtener un beneficio completo de la
estratificación se debe de conocer Nh. Una vez que han sido
determinados los estratos, se saca una muestra de cada uno, la extracción se
realiza de forma independiente en cada estrato. Los tamaños de la muestra
dentro de los estratos son representados por n1, n2, …, nL.
Si se toma
una muestra aleatoria simple en cada estrato, el procedimiento completo es
conocido como muestreo estratificado aleatorio.
La
estratificación es una técnica común. Hay muchas razones para realizarla; las
principales son:
· Si
se desea cierta precisión en alguna subdivisión, es necesario tratarla como si
fuera una “población” por sí sola.
· Las
conveniencias de tipo administrativo.
· La
diversidad de determinados grupos (por ejemplo, hoteles, hospitales, prisiones,
etc.) hace necesario un enfoque diferente al de las personas normales. O, por
ejemplo, las grandes compañías conviene separarlas en un estrato diferente,
para las pequeñas empresas se puede utilizar un tipo de muestreo por áreas.
· La
estratificación puede dar lugar a una ganancia en precisión de los estimadores
de la población. Esto ocurre cuando una población heterogénea es dividida en
subpoblaciones cada una de las cuales es internamente homogénea.
Este método
de muestreo consiste en lo siguiente: Supóngase que las N unidades de la
población se numeran en algún orden de 1 a N. Para seleccionar una muestra de n
unidades tomamos una al azar de las k primeras unidades, a continuación
elegimos la que viene k unidades siguientes y así sucesivamente. Por
ejemplo, si k =30 y la primera unidad elegida es la 19, las subsiguientes
unidades serán los números 49, 79, 109, etc. La selección de la primera unidad
determina la muestra completa. Este tipo de muestreo se llama muestra
sistemática de cada k-ésima unidad.
Las ventajas
de este método sobre el aleatorio simple son:
· Es
más fácil obtener la muestra y ejecutarlo con menos errores.
· Intuitivamente
aparece como más preciso que el muestreo simple aleatorio. En efecto,
estratifica la población en n sustratos, los cuales consisten en las primeras k
unidades, las segundas k unidades, etc. Eligiendo una unidad por estrato. La
diferencia está en que en el muestreo estratificado la unidad dentro de cada
sustrato se elige al azar, en este siempre está en la misma posición relativa.
Una variante
del muestreo sistemático consiste en escoger cada unidad en el centro del
estrato; esto es, en lugar de empezar la secuencia con un número al azar
escogido del 1 al k, tomamos el número inicial
como (k+1)/2si k es impar y (k+2)/2 si k es
par.
La población está
dividida en áreas lo más heterogéneas posibles internamente y lo más homogéneas
posibles entre sí. Selecciona al azar un conglomerado que será el que formará
la muestra.
Hay dos razones
principales para la extensa aplicación del muestreo por conglomerado. En muchos
países no hay listas completas ni al día de las personas, fincas, casas, etc en
una región geográfica grande. Sin embargo, a partir de mapas de la región, la
misma puede ser subdividida en segmentos de tierra con límites fácilmente
identificables en las zonas rurales, o en unidades de superficie como manzanas
en zonas urbanas. En EE.UU y Europa se toman a menudo estos conglomerados,
porque resuelven el problema de construir una lista de unidades de muestreo.
Aun cuando se
dispongan de listas consideraciones económicas pueden apuntar hacia la elección
de una unidad conglomerada mayor. Para un tamaño de muestra dado una unidad
pequeña usualmente da resultados más precisos que una unidad grande. Por
ejemplo, una simple muestra al azar de 600 casas cubre una ciudad más
uniformemente que 20 manzanas de 30 casas cada una. Pero obviamente se incurren
en más gasto seleccionando 600 casas al azar y viajando por ellas que
localizando 20 manzanas y la visita de todas las casas de las mismas. Cuando el
costo es contrapesado con la precisión, la unidad mayor puede ser superior. En
muchas decisiones prácticas el tipo de unidad puede tener alguna conveniencia o
desventaja especial. Por ejemplo elegir unidades pequeñas al muestrear una
cosecha puede introducir un sesgo debido a la incertidumbre de los límites
exactos de la unidad.
Cuadro comparativo de los tipos de muestreo
Muestreo
|
Características
|
Ventajas
|
Desventajas
|
Aleatorio
simple
|
Se selecciona
una muestra de tamaño n de una población de N unidades, cada elemento tiene
una probabilidad de inclusión igual y conocida de n/N.
|
Sencillo y de fácil
comprensión
Cálculo rápido de
medias y varianzas
Se basa en la
teoría
estadística,
y por tanto
existen
paquetes
informáticos
para
analizar los
datos
|
Requiere que
se
posea de
antemano un
listado
completo de
Toda la
población.
Cuando se
trabaja con
muestras
pequeñas es
posible que no
represente a
la
población
Adecuadamente.
|
Sistemático
|
Conseguir un
listado de los N elementos de la población
Determinar
tamaño
muestral n.
Definir un
intervalo k= N/n.
Elegir un
número aleatorio, r, entre 1 y k (r= arranque aleatorio).
Seleccionar
los elementos de la lista.
|
Fácil de aplicar.
No siempre es
necesario
tener un
listado de
toda la
Población.
Cuando la
población está
ordenada
siguiendo una
tendencia
conocida,
asegura
una cobertura
de
unidades de
todos
los tipos.
|
Si la
constante de
muestreo está
asociada con
el
fenómeno de
interés,
las
estimaciones
obtenidas a
partir de la
muestra pueden
contener sesgo
de
selección
|
Estratificado
|
En ciertas
ocasiones resultará
conveniente estratificar
la muestra según ciertas
variables de interés.
Para ello
debemos conocer
la composición
estratificada
de la
población objetivo a
hacer un muestreo. Una vez
calculado el
tamaño muestral
apropiado, este se reparte de manera proporcional
entre los distintos
estratos definidos en la población usando una simple regla de tres.
|
Tiende a asegurar
que la muestra represente
adecuadamente
a
la población
en función de
unas variables seleccionada.
Se obtienen estimaciones
más precisa
Su objetivo es conseguir una muestra lo más semejante
posible a la población
en lo que a la o
las variables estratificadoras
se refiere.
|
Se ha de conocer la
distribución
en la población de las variables
utilizadas para la estratificación.
|
Conglomerados
|
Se realizan
varias fases de muestreo sucesivas
(polietápico)
La necesidad
de listados de las unidades de una etapa se limita a aquellas unidades de
muestreo seleccionadas en la etapa anterior.
|
·
Es muy eficiente
cuando la
población es muy grande y dispersa.
·
No es preciso
tener un
listado de
toda la
población,
sólo de las unidades
primarias de muestreo.
|
·
Es muy eficiente
cuando la
población es
muy
grande y
dispersa.
·
No es preciso
tener un
listado de
toda la
población,
sólo de las
unidades
primarias de
muestreo.
|