descargar 149.07 Kb.
|
EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007 EXPERIMENTOS FACTORIALES COMPLETOS CONTENIDO1. Diseño factorial de dos factores2. Diseño factorial de dos factores 3. Comparaciones múltiples 1. Diseño factorial completo de 2 factores Ul ingeniero decide probar los tres materiales de la cubierta, único factor controlable a tres niveles de temperatura (15, 70 y 125 °F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías a cada combinación de material de la cubierta y temperatura, y las 36 pruebas se ejecutan al azar. En la tabla 1 se presentan el experimento y los datos resultantes de duración observada de las baterías. En este problema, el ingeniero desea contestar las siguientes preguntas: 1. ¿Qué efecto tienen el tipo de material y la temperatura sobre la duración de la batería? 2. ¿Existe una elección del material que dé por resultado una duración uniformemente larga sin importar la temperatura?
Tabla 1. Duración en horas para el ejemplo del diseño de una batería Esta última pregunta reviste particular importancia. Existe la posibilidad de hallar un material que no sea muy afectado por la temperatura. De ser así, el ingeniero puede hacer que la batería sea robusta a la variación de temperatura en el campo. Éste es un ejemplo del uso del diseño experimental estadístico para el diseño de un producto robusto (o consistente), un importante problema de ingeniería. Este diseño es un ejemplo específico del caso general de un diseño con dos factores (bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor A se encuentra en el i-ésimo nivel (i -1, 2,..., n). En general, los datos observados se verán como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio, de modo que éste es un diseño completamente aleatorizado. ![]() Tabla 2. Disposición general para un diseño bifactorial Las observaciones pueden describirse mediante el modelo estadístico lineal: ![]() En donde es el efecto medio general, i es el efecto del i-ésimo nivel del factor renglón A, j es el efecto del j-ésimo nivel del factor columna B, ()ij es el efecto de la interacción entre i y j, ijk es el componente del error aleatorio. Inicialmente se supone que ambos factores son fijos y que los efectos de tratamiento se definen como desviaciones de la media general, por lo tanto. ![]() ![]() En un diseño factorial de dos factores, tanto los factores (o tratamientos) de renglón como de columna tienen la misma importancia, específicamente el interés consiste en probar hipótesis acerca de la igualdad de los efectos de tratamiento de renglón, es decir: ![]() Y de la igualdad de los efectos de tratamiento de columna: ![]() También es interesante determinar sí los tratamientos de renglón y columna interaccionan. En otras palabras, resulta conveniente probar: ![]() A continuación, se muestra cómo pueden probarse estas hipótesis usando un análisis de variancia bifactorial o bidireccional (de dos factores o en dos sentidos). Análisis Estadístico del Modelo de Efectos FijosSea Yi..; el total de las observaciones bajo el i-ésimo nivel del factor A; Y.j. El total de las observaciones bajo el j-ésimo nivel del factor B, Yij. El total de las observaciones de la ij-ésima celda, e Y... el total general de todas las observaciones. Se definen ![]() ![]() La suma total de cuadrados corregida puede expresarse mediante: ![]() Porque los seis productos cruzados del segundo miembro de la ecuación anterior son iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una suma de cuadrados debida a los “renglones” o al “factor” A (SSA) en una suma de cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados debida a la interacción entre A y B (SSAB), y en una suma de cuadrados debida al error (SSE): Analizando el último término del miembro derecho de la Ecuación anterior es posible observar que es necesario tener al menos dos réplicas (n 2) para poder obtenerla suma de cuadrados del error. Simbólicamente, la Ecuación anterior puede expresarse mediante: ![]() Los grados de libertad asociados a cada suma de cuadrados son:
Esta descomposición del total de abn -1 grados de libertad para las sumas de cuadrados se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles, respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra. Los grados de libertad de la interacción simplemente corresponden a los grados de libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de las ab celdas hay n -1 grados de libertad entre las n réplicas, por lo tanto, hay ab(n -1) grados de libertad del error. Se observa que la suma de los grados de libertad de los términos del miembro derecho de la ecuación anterior es igual al total de los grados de libertad. Cada suma de cuadrados dividida entre sus grados de libertad produce una media de cuadrados. Los valores esperados de las medias de cuadrados son: ![]() Hay que notar, que si las hipótesis nulas, las cuales consisten en proponer que no hay efectos de tratamiento de renglón, columna e interacción, son verdaderas, entonces MSA, MSB, MSAB y MSE son estimadores de 2. Sin embargo, si por ejemplo existen diferencias entre los tratamientos de renglón, entonces MSA será mayor que MSE. En forma similar, si hay efectos de tratamiento de columna o interacción, las medias de cuadrados correspondientes serán mayores que MSE. Por lo tanto, para probar el significado de ambos efectos principales, así como de su interacción, simplemente deben dividirse las medias de cuadrados correspondientes entre la media de cuadrados del error. Valores grandes de estas razones implican que los datos no concuerdan con las hipótesis nulas. Si se considera que el modelo estadístico es adecuado y que los términos del error ijk son independientes con distribuciones normales con variancia constante 2, entonces las razones de las medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribución F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n -1) grados de libertad en el denominador. Las regiones críticas corresponden al extremo superior de la distribución F. Usualmente la prueba se presenta en una tabla de análisis de variancia como la que aparece en la tabla 2.
Tabla 2 ANOVA para el modelo bifactorial de efectos fijos Es posible obtener las fórmulas para calcular las sumas de cuadrados de la ecuación anterior. La suma total de cuadrados se calcula en forma usual mediante: ![]() Las sumas de cuadrados para los efectos principales son: ![]() Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los "subtotales": ![]() Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste en calcular SSAB mediante: ![]() La SSE se calcula por diferencia: ![]() Ejemplo: Más sobre el experimento de diseño de una batería. En la tabla 3 se presenta la duración efectiva (en horas) observada en el ejemplo de diseño de una batería descrito en la anterior Los totales de renglón y de columna se indican en los márgenes de la tabla; los números subrayados son los totales de celda.
Tabla 3. Duración (en horas) para el experimento de diseño de una batería Las sumas de cuadrados se calculan a continuación: ![]() ![]() ![]() El análisis de variancia aparece en la tabla 4. Se concluye que existe una interacción significativa entre el tipo de material y la temperatura porque F0.05,4.27 = 2.73. Además, también son significativos los efectos principales del tipo de material y de la temperatura, porque FO.O5.2.27 = 3.35.
Tabla 4. ANOVA para los datos de la duración de la batería Como auxiliar en la interpretación de los resultados de este experimento resulta útil la construcción de una gráfica de las respuestas promedio de cada combinación de tratamiento. Esta gráfica se muestra en la figura 1. ![]() Figura 1. Gráfica de respuesta vs temperatura El hecho de que las rectas no sean paralelas indica una interacción significativa. En general, a menor temperatura mayor duración, independientemente del tipo de material. Al variar la temperatura de baja a intermedia, la duración aumenta con el material tipo 3, mientras que disminuye con los materiales tipo 1 y 2, Cuando la temperatura varía de intermedia a alta, la duración disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1 esencialmente permanece sin cambio. Al parecer, el material tipo 3 da los mejores resultados si lo que se desea es menor perdida de duración efectiva al cambiar la temperatura. 3. Comparaciones MúltiplesSi el análisis de variancia indica que hay diferencia en el nivel medio de los renglones o columnas, resulta de interés llevar a cabo comparaciones entre las medias individuales de renglón o columna para descubrir las diferencias específicas para esto, los métodos de comparación múltiple analizados en él capitulo anterior resultan útiles. A continuación, se ilustra la aplicación de la prueba de intervalos múltiples de Duncan a los datos de duración de las baterías del ejemplo 1. Se recordará que en este experimento la interacción resultó significativa. Cuando esto ocurre, las diferencias en las medias de un factor (por ejemplo el A) pueden ser ocultadas por la interacción AB. Un enfoque consiste en fijar el factor B en un nivel específico, y aplicar la prueba de intervalos múltiples de Duncan a las medias del factor A en ese nivel. Para ilustrar esto, supongamos que en el ejemplo 1 se desea detectar diferencias en el nivel medio de los tres tipos de material. Como la interacción es significativa, las comparaciones se realizan en un solo nivel de la temperatura, por ejemplo el nivel 2 (70 grados). Se supone que el mejor estimador de la variancia del error es la MSE obtenida de la tabla del análisis de variancia. Además, se utiliza la suposición de que la variancia del error experimental es la misma en todas las combinaciones de tratamientos. Los promedios de los tres tipos de material, organizados en arden ascendente son: ![]() El error estándar de estos promedios o medias de tratamiento es: ![]() Ya que cada promedio se calcula mediante n = 4 observaciones. Usando la Tabla VII del Apéndice se obtienen los valores de r0.05(2, 27) = 2.91 y de r0.05(3, 27) = 3.06. Los intervalos mínimos significativos son: R2 = r0.05(2,27) ![]() R3=r0.05(3,27) ![]() Y las comparaciones proporcionan: 3 vs. 1 = 145.75 – 57.25 = 88.50 >39.75(R3) 3 vs. 2 = 145.75 – 119.75 = 26.00 <37.80(R2) 2 vs. 1 = 119.75 – 57.25 = 62.50 >37.80(R2) Este análisis indica que en el nivel de temperatura de 70 grados, el voltaje medio producido por los materiales 2 y 3 es el mismo y que el voltaje medio del material 1 es significativamente menor que el producido por los materiales tipo 2 y 3. Si la interacción resulta ser significativa, el investigador puede comparar las medias de todas las ab celdas para determinar en cuáles hay una diferencia significativa. En este análisis las diferencias entre las celdas incluyen tanto los efectos principales como el efecto de interacción. En el ejemplo 1 este método producirá 36 comparaciones entre todos los posibles pares de medias de nueve celdas. Variabilidad del modeloAplicando el procedimiento general a los datos del voltaje de las baterías del Ejemplo 1. Debe observarse que SSModelo = SSMaterial + SStemperatura + SSinteracción SSModelo = 10,683.72 + 39,118.72 + 9613.78 = 59,416.22 Y que R2 = SSModelo/SST = 59,416.22/77,646.97 = 0.765210 En otras palabras, cerca de 77% de la variabilidad en la caída del voltaje se explica por el tipo de material de las placas de la batería, por la temperatura y por la interacción entre el tipo de material y la temperatura. AComprobación de la idoneidad del Modelontes de poder adoptar las conclusiones del análisis de variancia, debe probarse la adecuación del modelo supuesto. Como antes, la herramienta principal es el análisis de residuos. Los residuos para el modelo factorial de dos factores son: ![]() Para los residuos del ejemplo 3.1 tenemos que:
![]() Tabla 5. Residuos para el ejemplo 1 ![]() Figura 2. Grafica de probabilidad normal e histograma de residuos para el ejemplo 1. ![]() Tabla 6. Residuos ![]() Figura 3. Gráfica de Residuos versus respuesta estimada Y ya que los valores ajustados son ![]() ![]() Los residuos de los datos de duración de las baterías del ejemplo 1 se muestran en la tabla 6. La gráfica de probabilidad normal y el histograma de estos residuos no revelan algo que pudiera causar problemas, a pesar de que el residuo menor (-60.75 a 65 °F y para el tipo de material 1) parece alejarse de los demás. El valor estandarizado de este residuo es (-60,75)/ (675.21)1/2 = -2.34. Éste es el único residuo cuyo valor absoluto es mayor que dos. En la tabla 7 se presenta una gráfica de los residuos contra los valores ajustados ![]() ![]() Tabla 7 Residuos del material ![]() Figura 4. Gráfica de residuos versus tipo de material ![]() Tabla 8 Residuos de Temperatura ![]() Figura 5 Gráfica de residuos de temperatura versus tipo de material En la tabla 7 y figura 5 aparecen las gráficas de los residuos contra el tipo de material y contra la temperatura, respectivamente. Ambas gráficas indican una ligera desigualdad en la variancia siendo quizá mayor la variancia de la combinación de 65 °F y tipo de material 1 que la de cualquier otra combinación. La celda correspondiente a 70 °F y el tipo de material es la que contiene ambos residuos extremos (-60.75 y 45.25). Estos dos residuos son los principales responsables de la desigualdad de la variancia detectada en las Fig. 7,8 y 9. Un examen posterior de los datos no reveló ningún problema obvio, como por ejemplo, errores en el registro de los datos y, por lo tanto, estas observaciones deben ser aceptadas como legítimas. Es posible que en esta combinación de tratamiento particular se produzcan voltajes ligeramente más erráticos que en las otras combinaciones. Sin embargo, el problema no es tan severo como para tener un efecto importante en el análisis y las conclusiones. Estimación de los Parámetros del ModeloLos parámetros en el modelo de análisis de variancia de clasificación en dos sentidos: ![]() Pueden estimarse usando el método de mínimos cuadrados. Como hay 1 + a + b + ab parámetros del modelo que deben ser estimados habrá 1 + a + b + ab ecuaciones normales. No es difícil mostrar que las ecuaciones normales son: ![]() Para mayor claridad se muestra el parámetro correspondiente a cada ecuación normal, a la izquierda de las Ecuaciones anteriores. Con el fin de obtener una solución óptima a las ecuaciones anteriores, tenemos que imponer las siguientes restricciones: ![]() Al aplicar estas restricciones, las ecuaciones normales se simplifican considerablemente y se obtienen las soluciones: ![]() Estas soluciones son intuitivamente atractivas. Los efectos de los tratamientos de renglón se estiman mediante la diferencia entre el promedio del renglón y el promedio general; los efectos de los tratamientos de columna mediante la diferencia entre el promedio de la columna y el promedio general, y la ij-ésima interacción se estima restando el promedio general, el efecto del renglón i y el de la columna j al promedio de la ij-ésima celda. Usando la ecuación anterior puede determinarse el valor ajustado de Yijk mediante: ![]() En otras palabras, la k-ésima observación de la ij-ésima celda se estima mediante el promedio de las n observaciones de dicha celda. Suposiciones del análisis de varianza Al aplicar un análisis de varianza se hacen las suposiciones siguientes: 1. El proceso esta en control estadístico (estable). Esto es, se pueden repetir y las causas de variación se han eliminado. 2. La distribución de la población que se muestra es normal. 3. La varianza de los errores dentro de los k niveles del factor es la misma: Esto es, la variabilidad natural dentro de cada tratamiento es la misma de un tratamiento a otro. Cuando se observa que no se puede suponer igual varianza (por ejemplo un proceso Poisson: donde la varianza varia con la media), se tiene dos opciones; Transformar los datos, o pruebas no parametricas. En particular una prueba no parametrica que se usa es la Kruskal – Wallis. Página de |