Como encontrar el tamano de una muestra siguiendo algunos consejos prácticos

brunfortcatrene
Aug 19, 2023
6 min read

Los pasos que siguen son adecuados para calcular el tamaño de la muestra para datos continuos, es decir, datos que se contabilizan numéricamente. Esto no se aplica a datos categóricos, es decir, datos que se agrupan en categorías, como verde, azul, hombre, mujer, etc.

Como hemos podido ver, una consideración importante que hay que tener en cuenta a la hora de determinar el tamaño de la muestra es el tamaño de toda la población que se quiere estudiar. Una población es el grupo completo sobre el que se quiere sacar conclusiones. De la población se selecciona una muestra, utilizando muestras probabilísticas o no probabilísticas. El tamaño de la población puede ser conocido (como el número total de empleados de una empresa) o desconocido (como el número de propietarios de perros en un país), pero es necesario hacer una estimación aproximada, especialmente cuando se trata de un grupo de personas relativamente pequeño o fácil de medir.

como encontrar el tamano de una muestra

Download

El nivel de confianza se refiere al porcentaje de probabilidad o certeza de que el intervalo de confianza contendría el verdadero parámetro poblacional cuando se extrae una muestra aleatoria muchas veces. Se expresa como un porcentaje y representa la frecuencia con la que el porcentaje de la población que elegiría una respuesta se encuentra dentro del intervalo de confianza. Por ejemplo, un nivel de confianza del 99% significa que si se repite un experimento o una encuesta una y otra vez, el 99% de las veces los resultados coincidirán con los que se obtienen de una población.

Por su parte, los intervalos de confianza miden el grado de incertidumbre o certeza de un método de muestreo y el grado de incertidumbre de una estadística concreta. En términos sencillos, el intervalo de confianza indica el grado de seguridad de que los resultados de un estudio reflejan lo que se esperaría encontrar si fuera posible encuestar a toda la población estudiada. El intervalo de confianza suele ser una cifra más o menos (). Por ejemplo, si el intervalo de confianza es de 6 y el 60% de la muestra elige una respuesta, puede estar seguro de que si hubiera preguntado a toda la población, entre el 54% (60-6) y el 66% (60+6) habría elegido esa respuesta.

En este caso podemos analizar cómo encontrar un tamaño de muestra para un nivel de confianza y una amplitud dados (por ejemplo, 95% CL, 6% de amplitud) para una desviación estándar de la población desconocida.

Si no sabe qué tamaño de muestra necesita, calcúlelo antes de utilizar la herramienta de Análisis de Datos (utilizando los métodos indicados en los puntos anteriores). La herramienta de Análisis de Datos puede ayudarle a extraer una muestra, pero no puede ayudarle a decidir el tamaño. Por qué? Hay muchos factores humanos que intervienen en la selección del tamaño de la muestra, como el presupuesto, las investigaciones anteriores (puede utilizar un tamaño de muestra de investigaciones anteriores) y las tablas construidas a partir de investigaciones anteriores.

En estadística el tamaño de la muestra se le conoce como aquel número determinado de sujetos o cosas que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población.

Imagina que quieres saber qué porcentaje de la población brasileña entre 15 y 65 años fuma. O cuantos minutos por día ven la televisión. Obviamente, lo ideal sería preguntar a todos los miembros de la población (136 millones) pero eso es extremadamente costoso. Por ello normalmente optamos por encuestar a una parte de la población, lo que se conoce como una muestra. Como una muestra no contiene a todos los individuos, inevitablemente vamos a cometer cierto error en nuestras estimaciones. Cuanto más pequeña sea la muestra, ese error va a ser potencialmente mayor.

Podemos simplificar un poco más esta expresión. Antes de hacer la encuesta no sabemos qué proporción de fumadores vamos a encontrar (para eso hacemos la encuesta). Pero sí podemos ponernos en el peor caso. Observa que la cantidad p(1-p) resulta 0 tanto si p=0 como si p=1. Es decir, si todo el mundo fuma o no fuma, la muestra que necesitamos es prácticamente nula. El peor caso se produce cuando la población es lo más diversa posible (p=0.5), es decir, cuando la mitad de la gente fuma.

Después de realizar procedimientos significativos en los datos muestreados, puede sumar todos los porcentajes de daño individuales de cualquier importe erróneo. Si la suma de porcentajes de daño es menor o igual a los Daños máximos tolerables (%) reportada por Analytics, puede considerar que los importes del campo de muestra como totalidad no tienen errores significativos para el nivel de confianza especificado.

Supongamos que los Daños máximos tolerables (%) reportados por Analytics cuando calculó el tamaño de la muestra para la tabla eran 92,30 %. Como el porcentajes de daño total de 49 % es menor que 92,30 %, puede considerar que los importes en el campo de muestra como totalidad no tienen errores significativos para el nivel de confianza especificado.

Los patólogos son los cuidadores de las muestras de tejido y deben ejercer un buen juicio al usarlos. Las muestras nos permiten realizar un diagnóstico correcto. Pero también podemos usar las muestras para realizar pruebas adicionales, como la inmunotinción, que puede identificar dónde se inició un tumor. Esto es realmente muy valioso en el tratamiento del cáncer que se ha diseminado desde otra parte del cuerpo, denominado metástasis.

Su patólogo también se asegurará de que las muestras para biopsia se usen para identificar otros factores que afectan su tratamiento y recuperación. Estos pueden incluir cambios genéticos que podrían guiar opciones de tratamiento o predecir su probabilidad de recuperación. Por ejemplo, en el cáncer de mama, los patólogos usan la muestra de biopsia para identificar receptores de hormonas, como los receptores de estrógeno (estrogen receptor, ER) y progesterona (progesterone receptor, PR), y el receptor 2 del factor de crecimiento epidérmico humano (human epidermal growth factor receptor 2, HER2). En la medida en que identificamos características más precisas del cáncer a partir de la muestra para biopsia, podemos identificar un número cada vez mayor de pacientes que podrían beneficiarse con las nuevas terapias dirigidas, que son más eficaces.

Las leyes federales requieren que los laboratorios almacenen las muestras de forma segura durante un período determinado de tiempo. Por ejemplo, los portaobjetos para citología, como las pruebas de Papanicolaou, generalmente se almacenan durante al menos 5 años. Otros tipos de portaobjetos con tinciones de tejido se conservan en general durante 10 años o más. Los bloques de parafina (material en el que normalmente se procesan los tejidos) se retienen durante al menos 10 años. Es posible que en algunos estados se requieran períodos de almacenamiento aún más largos.

Un aspecto fundamental en el diseño de estudios clínicos es la determinación del tamaño de muestra apropiado. Si el tamaño de muestra es muy pequeño, el estudio tendrá baja potencia estadística (AMC 49 (4):203-204) y en consecuencia, las estimaciones serán menos precisas y la probabilidad de encontrar diferencias significativas entre tratamientos o grupos será menor. Por otra parte, si el tamaño de muestra es muy grande, se estará haciendo un mal uso de recursos de investigación y sometiendo a pruebas a más pacientes de los estrictamente necesarios.

Con frecuencia interesa estimar una proporción, por ejemplo la prevalencia de una determinada patología. Para calcular el tamaño de muestra en éstos casos, se debe tener una idea de la proporción que se espera encontrar en la población, lo que puede obtenerse de la literatura. Adicionalmente,se debe definir el nivel de confianza deseado y el error máximo permitido.

Suponga que se desea estimar la prevalencia de otitis media en niños de edad preescolar en el área de influencia de un determinado centro médico. Se establece un nivel de confianza del 90%y un error máximo permitido del 3%(d = 0.03). Para tener una idea de la prevalencia esperada se acude a la revisión de Sierra-HHernández y colaboradores (2004),que indica que esa patología representa el 18%(p = 0.18) de las consultas médicas de la población de interés. Si se supone que la población es infinita o suficientemente grande, el tamaño de muestra se obtiene como:

Una vez hacemos clic en el botón, aparece el cuadro de diálogo. Debemos entonces elegir el objetivo Encontrar el tamaño de la muestra, y seleccionamos luego la prueba de t para dos muestras independientes. Tomamos como hipótesis alternativa Media 1 Media 2. El valor de alfa es 0.05. La potencia deseada es 0.9. Suponemos que nuestras muestras tienen igual tamaño, de modo que la ratio N1/N2 es igual a 1. En lugar de seleccionar parámetros de entrada detallados, seleccionamos la opción tamaño del efecto y escribimos el valor 0.2 (efecto débil).

XLSTAT es una potente herramienta tanto para investigar el tamaño muestral requerido para un análisis, como para calcular la potencia de una prueba. Obviamente, si el usuario tiene más información acerca de las muestras o las poblaciones, puede dar detalles de los parámetros de entrada, en lugar de limitarse a usar el tamaño del efecto.

Tanto la versión estándar de Analytics como Analytics 360 aplican segmentos después de aplicar filtros de informe y al acabar el muestreo, lo que significa que un segmento puede incluir un menor número de sesiones que las incluidas en la muestra total.

Para ver como se distribuye algunas de las características de la muestra con respecto a la variable que se esta midiendo, podemos recurrir a la famosa campana de Gauss o Student que refleja la curva normal de distribución cuya característica principal es la de ser unimodal donde la media, mediana y la moda siempre coinciden. 2ff7e9595c

BECKETTE

Como encontrar el tamano de una muestra siguiendo algunos consejos prácticos

como encontrar el tamano de una muestra

Recent Posts

Comments