Contenido diseño factorial de dos factores






descargar 149.07 Kb.
títuloContenido diseño factorial de dos factores
fecha de publicación09.09.2015
tamaño149.07 Kb.
tipoDocumentos
m.exam-10.com > medicina > Documentos

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007


EXPERIMENTOS FACTORIALES

COMPLETOS

CONTENIDO

1. Diseño factorial de dos factores


2. Diseño factorial de dos factores


3. Comparaciones múltiples

1. Diseño factorial completo de 2 factores

Ul ingeniero decide probar los tres materiales de la cubierta, único factor controlable a tres niveles de temperatura (15, 70 y 125 °F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías a cada combinación de material de la cubierta y temperatura, y las 36 pruebas se ejecutan al azar.

En la tabla 1 se presentan el experimento y los datos resultantes de duración observada de las baterías.
En este problema, el ingeniero desea contestar las siguientes preguntas:
1. ¿Qué efecto tienen el tipo de material y la temperatura sobre la duración de la batería?

2. ¿Existe una elección del material que dé por resultado una duración uniformemente larga sin importar la temperatura?


Tipo de material

Temperatura F

15

70

125

1

130

155

34

40

20

70

74

180

80

75

82

58

3

150

188

126

122

25

70

159

126

106

115

58

45

3

138

110

174

120

96

104

168

160

150

139

82

60

Tabla 1. Duración en horas para el ejemplo del diseño de una batería

Esta última pregunta reviste particular importancia. Existe la posibilidad de hallar un material que no sea muy afectado por la temperatura. De ser así, el ingeniero puede hacer que la batería sea robusta a la variación de temperatura en el campo. Éste es un ejemplo del uso del diseño experimental estadístico para el diseño de un producto robusto (o consistente), un importante problema de ingeniería.
Este diseño es un ejemplo específico del caso general de un diseño con dos factores (bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor A se encuentra en el i-ésimo nivel (i -1, 2,..., n). En general, los datos observados se verán como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio, de modo que éste es un diseño completamente aleatorizado.


Tabla 2. Disposición general para un diseño bifactorial
Las observaciones pueden describirse mediante el modelo estadístico lineal:


En donde  es el efecto medio general, i es el efecto del i-ésimo nivel del factor renglón A, j es el efecto del j-ésimo nivel del factor columna B, ()ij es el efecto de la interacción entre i y j, ijk es el componente del error aleatorio. Inicialmente se supone que ambos factores son fijos y que los efectos de tratamiento se definen como desviaciones de la media general, por lo tanto. Se supone que los efectos de interacción son fijos y que se definen dé manera que: . Hay un total de abn observaciones porque se realizan n réplicas.
En un diseño factorial de dos factores, tanto los factores (o tratamientos) de renglón como de columna tienen la misma importancia, específicamente el interés consiste en probar hipótesis acerca de la igualdad de los efectos de tratamiento de renglón, es decir:

Y de la igualdad de los efectos de tratamiento de columna:

También es interesante determinar sí los tratamientos de renglón y columna interaccionan. En otras palabras, resulta conveniente probar:


A continuación, se muestra cómo pueden probarse estas hipótesis usando un análisis de variancia bifactorial o bidireccional (de dos factores o en dos sentidos).

Análisis Estadístico del Modelo de Efectos Fijos



Sea Yi..; el total de las observaciones bajo el i-ésimo nivel del factor A; Y.j. El total de las observaciones bajo el j-ésimo nivel del factor B, Yij. El total de las observaciones de la ij-ésima celda, e Y... el total general de todas las observaciones. Se definen como los promedios de renglón, columna, celda y general, respectivamente, matemáticamente:

La suma total de cuadrados corregida puede expresarse mediante:

Porque los seis productos cruzados del segundo miembro de la ecuación anterior son iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una suma de cuadrados debida a los “renglones” o al “factor” A (SSA) en una suma de cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados debida a la interacción entre A y B (SSAB), y en una suma de cuadrados debida al error (SSE): Analizando el último término del miembro derecho de la Ecuación anterior es posible observar que es necesario tener al menos dos réplicas (n  2) para poder obtenerla suma de cuadrados del error.
Simbólicamente, la Ecuación anterior puede expresarse mediante:

Los grados de libertad asociados a cada suma de cuadrados son:

Efecto
Grados de libertad

A

a-1

B

b-1

Interacción AB

(a-1)(b-1)

Error

ab(n-1)

Total

abn-1



Esta descomposición del total de abn -1 grados de libertad para las sumas de cuadrados se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles, respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Los grados de libertad de la interacción simplemente corresponden a los grados de libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de las ab celdas hay n -1 grados de libertad entre las n réplicas, por lo tanto, hay ab(n -1) grados de libertad del error.
Se observa que la suma de los grados de libertad de los términos del miembro derecho de la ecuación anterior es igual al total de los grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad produce una media de cuadrados. Los valores esperados de las medias de cuadrados son:

Hay que notar, que si las hipótesis nulas, las cuales consisten en proponer que no hay efectos de tratamiento de renglón, columna e interacción, son verdaderas, entonces MSA, MSB, MSAB y MSE son estimadores de 2. Sin embargo, si por ejemplo existen diferencias entre los tratamientos de renglón, entonces MSA será mayor que MSE.
En forma similar, si hay efectos de tratamiento de columna o interacción, las medias de cuadrados correspondientes serán mayores que MSE.
Por lo tanto, para probar el significado de ambos efectos principales, así como de su interacción, simplemente deben dividirse las medias de cuadrados correspondientes entre la media de cuadrados del error. Valores grandes de estas razones implican que los datos no concuerdan con las hipótesis nulas.
Si se considera que el modelo estadístico es adecuado y que los términos del error ijk son independientes con distribuciones normales con variancia constante 2, entonces las razones de las medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribución F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n -1) grados de libertad en el denominador. Las regiones críticas corresponden al extremo superior de la distribución F. Usualmente la prueba se presenta en una tabla de análisis de variancia como la que aparece en la tabla 2.



Fuente de

Variación

SS


G.L.

MS


Fo

Tratamientos A

SSA

a - 1





Tratamientos B

SSB

b - 1





Interacción

SSAB

(a - 1)(b - 1)





Error

SSE

ab(n-1)






Total

SST

abn - 1








Tabla 2 ANOVA para el modelo bifactorial de efectos fijos
Es posible obtener las fórmulas para calcular las sumas de cuadrados de la ecuación anterior. La suma total de cuadrados se calcula en forma usual mediante:


Las sumas de cuadrados para los efectos principales son:

Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los "subtotales":

Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste en calcular SSAB mediante:

La SSE se calcula por diferencia:

Ejemplo: Más sobre el experimento de diseño de una batería. En la tabla 3 se presenta la duración efectiva (en horas) observada en el ejemplo de diseño de una batería descrito en la anterior Los totales de renglón y de columna se indican en los márgenes de la tabla; los números subrayados son los totales de celda.

Tipo de

Mat.

Temperatura (F)

15

70

125

Yi..

1

130

155



34

40

229

20

70

230

998

74

180

80

75

82

58

2

150

188

623

136

122

479

25

70

198

1300

159

126

106

115

58

45

3

138

110

576

174

120

583

96

104

342

1501

168

160

150

139

82

60

Y.j.=

1738

1291

770

Y...=

3799

Tabla 3. Duración (en horas) para el experimento de diseño de una batería
Las sumas de cuadrados se calculan a continuación:






El análisis de variancia aparece en la tabla 4. Se concluye que existe una interacción significativa entre el tipo de material y la temperatura porque F0.05,4.27 = 2.73. Además, también son significativos los efectos principales del tipo de material y de la temperatura, porque FO.O5.2.27 = 3.35.



Fuente de variación

SS

G.L.

MS

Fo

Tipo de material

10,683.72

2

5,341.86

7.91

Temperatura

39,118.72

2

19,558.36

28.97

Interacción

9,613.78

4

2,403.44

3.56

Error

18,230.75

27

675.21




Total

77,646.97

35








Tabla 4. ANOVA para los datos de la duración de la batería

Como auxiliar en la interpretación de los resultados de este experimento resulta útil la construcción de una gráfica de las respuestas promedio de cada combinación de tratamiento. Esta gráfica se muestra en la figura 1.



Figura 1. Gráfica de respuesta vs temperatura

El hecho de que las rectas no sean paralelas indica una interacción significativa. En general, a menor temperatura mayor duración, independientemente del tipo de material.

Al variar la temperatura de baja a intermedia, la duración aumenta con el material tipo 3, mientras que disminuye con los materiales tipo 1 y 2,

Cuando la temperatura varía de intermedia a alta, la duración disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1 esencialmente permanece sin cambio. Al parecer, el material tipo 3 da los mejores resultados si lo que se desea es menor perdida de duración efectiva al cambiar la temperatura.
3. Comparaciones Múltiples


Si el análisis de variancia indica que hay diferencia en el nivel medio de los renglones o columnas, resulta de interés llevar a cabo comparaciones entre las medias individuales de renglón o columna para descubrir las diferencias específicas para esto, los métodos de comparación múltiple analizados en él capitulo anterior resultan útiles.
A continuación, se ilustra la aplicación de la prueba de intervalos múltiples de Duncan a los datos de duración de las baterías del ejemplo 1. Se recordará que en este experimento la interacción resultó significativa. Cuando esto ocurre, las diferencias en las medias de un factor (por ejemplo el A) pueden ser ocultadas por la interacción AB. Un enfoque consiste en fijar el factor B en un nivel específico, y aplicar la prueba de intervalos múltiples de Duncan a las medias del factor A en ese nivel. Para ilustrar esto, supongamos que en el ejemplo 1 se desea detectar diferencias en el nivel medio de los tres tipos de material. Como la interacción es significativa, las comparaciones se realizan en un solo nivel de la temperatura, por ejemplo el nivel 2 (70 grados). Se supone que el mejor estimador de la variancia del error es la MSE obtenida de la tabla del análisis de variancia. Además, se utiliza la suposición de que la variancia del error experimental es la misma en todas las combinaciones de tratamientos. Los promedios de los tres tipos de material, organizados en arden ascendente son:

El error estándar de estos promedios o medias de tratamiento es:

Ya que cada promedio se calcula mediante n = 4 observaciones. Usando la Tabla VII del Apéndice se obtienen los valores de r0.05(2, 27) = 2.91 y de r0.05(3, 27) = 3.06. Los intervalos mínimos significativos son:

R2 = r0.05(2,27)= (2.91)12.99) = 37.80
R3=r0.05(3,27) = (3.26)(12.99) = 39.75
Y las comparaciones proporcionan:
3 vs. 1 = 145.75 – 57.25 = 88.50 >39.75(R3)
3 vs. 2 = 145.75 – 119.75 = 26.00 <37.80(R2)
2 vs. 1 = 119.75 – 57.25 = 62.50 >37.80(R2)
Este análisis indica que en el nivel de temperatura de 70 grados, el voltaje medio producido por los materiales 2 y 3 es el mismo y que el voltaje medio del material 1 es significativamente menor que el producido por los materiales tipo 2 y 3. Si la interacción resulta ser significativa, el investigador puede comparar las medias de todas las ab celdas para determinar en cuáles hay una diferencia significativa. En este análisis las diferencias entre las celdas incluyen tanto los efectos principales como el efecto de interacción. En el ejemplo 1 este método producirá 36 comparaciones entre todos los posibles pares de medias de nueve celdas.

Variabilidad del modelo


Aplicando el procedimiento general a los datos del voltaje de las baterías del

Ejemplo 1. Debe observarse que
SSModelo = SSMaterial + SStemperatura + SSinteracción
SSModelo = 10,683.72 + 39,118.72 + 9613.78 = 59,416.22
Y que
R2 = SSModelo/SST = 59,416.22/77,646.97 = 0.765210
En otras palabras, cerca de 77% de la variabilidad en la caída del voltaje se explica por el tipo de material de las placas de la batería, por la temperatura y por la interacción entre el tipo de material y la temperatura.

AComprobación de la idoneidad del Modelo


ntes de poder adoptar las conclusiones del análisis de variancia, debe probarse la adecuación del modelo supuesto. Como antes, la herramienta principal es el análisis de residuos. Los residuos para el modelo factorial de dos factores son:

Para los residuos del ejemplo 3.1 tenemos que:


Tipo de

Mat.

Temperatura grados Fahrenheit

15

70

125

1

130-134.75=-4.75

155-134.75

=20.25

-23.25

-17.25

-37.25

12.50

74-134.750=-60.75

180-134.75

=45.25

22.75

17.25

24.50

0.50

2

-5.75

32.25

16.25

2.25

-24.50

20.50

3.25

-29.75

-13.75

-4.75

8.50

-4.50

3

-6.00

-34.00

28.25

-25.75

10.50

18.50

24.00

16.00

4.25

-6.75

-3.50

-25.50






Tabla 5. Residuos para el ejemplo 1


Figura 2. Grafica de probabilidad normal e histograma de residuos para el ejemplo 1.



Tabla 6. Residuos



Figura 3. Gráfica de Residuos versus respuesta estimada

Y ya que los valores ajustados son (el promedio de las observaciones en la ij-ésima celda), la Ecuación de residios se transforma en:

Los residuos de los datos de duración de las baterías del ejemplo 1 se muestran en la tabla 6. La gráfica de probabilidad normal y el histograma de estos residuos no revelan algo que pudiera causar problemas, a pesar de que el residuo menor (-60.75 a 65 °F y para el tipo de material 1) parece alejarse de los demás. El valor estandarizado de este residuo es (-60,75)/ (675.21)1/2 = -2.34. Éste es el único residuo cuyo valor absoluto es mayor que dos. En la tabla 7 se presenta una gráfica de los residuos contra los valores ajustados . Esta gráfica muestra una ligera tendencia de la variancia de los residuos a aumentar, a medida que aumenta el voltaje.


Tabla 7 Residuos del material


Figura 4. Gráfica de residuos versus tipo de material



Tabla 8 Residuos de Temperatura



Figura 5 Gráfica de residuos de temperatura versus tipo de material
En la tabla 7 y figura 5 aparecen las gráficas de los residuos contra el tipo de material y contra la temperatura, respectivamente. Ambas gráficas indican una ligera desigualdad en la variancia siendo quizá mayor la variancia de la combinación de 65 °F y tipo de material 1 que la de cualquier otra combinación.
La celda correspondiente a 70 °F y el tipo de material es la que contiene ambos residuos extremos (-60.75 y 45.25). Estos dos residuos son los principales responsables de la desigualdad de la variancia detectada en las Fig. 7,8 y 9.
Un examen posterior de los datos no reveló ningún problema obvio, como por ejemplo, errores en el registro de los datos y, por lo tanto, estas observaciones deben ser aceptadas como legítimas. Es posible que en esta combinación de tratamiento particular se produzcan voltajes ligeramente más erráticos que en las otras combinaciones. Sin embargo, el problema no es tan severo como para tener un efecto importante en el análisis y las conclusiones.

Estimación de los Parámetros del Modelo


Los parámetros en el modelo de análisis de variancia de clasificación en dos sentidos:

Pueden estimarse usando el método de mínimos cuadrados. Como hay 1 + a + b + ab parámetros del modelo que deben ser estimados habrá 1 + a + b + ab ecuaciones normales. No es difícil mostrar que las ecuaciones normales son:

Para mayor claridad se muestra el parámetro correspondiente a cada ecuación normal, a la izquierda de las Ecuaciones anteriores.
Con el fin de obtener una solución óptima a las ecuaciones anteriores, tenemos que imponer las siguientes restricciones:

Al aplicar estas restricciones, las ecuaciones normales se simplifican considerablemente y se obtienen las soluciones:

Estas soluciones son intuitivamente atractivas. Los efectos de los tratamientos de renglón se estiman mediante la diferencia entre el promedio del renglón y el promedio general; los efectos de los tratamientos de columna mediante la diferencia entre el promedio de la columna y el promedio general, y la ij-ésima interacción se estima restando el promedio general, el efecto del renglón i y el de la columna j al promedio de la ij-ésima celda.
Usando la ecuación anterior puede determinarse el valor ajustado de Yijk mediante:


En otras palabras, la k-ésima observación de la ij-ésima celda se estima mediante el promedio de las n observaciones de dicha celda.
Suposiciones del análisis de varianza
Al aplicar un análisis de varianza se hacen las suposiciones siguientes:
1. El proceso esta en control estadístico (estable). Esto es, se pueden repetir y las causas de variación se han eliminado.
2. La distribución de la población que se muestra es normal.
3. La varianza de los errores dentro de los k niveles del factor es la misma: Esto es, la variabilidad natural dentro de cada tratamiento es la misma de un tratamiento a otro.
Cuando se observa que no se puede suponer igual varianza (por ejemplo un proceso Poisson: donde la varianza varia con la media), se tiene dos opciones; Transformar los datos, o pruebas no parametricas. En particular una prueba no parametrica que se usa es la Kruskal – Wallis.


Página de

Añadir el documento a tu blog o sitio web

similar:

Contenido diseño factorial de dos factores iconT4- bases metodológicas de los ensayos clínicos II: tipos de diseñO....

Contenido diseño factorial de dos factores iconDiseño 4: factorial incompleto (2 etapas) en arreglo completamente al azar con co-variables

Contenido diseño factorial de dos factores iconE1UE2: diseño factorial simple en arreglo completamente al azar....

Contenido diseño factorial de dos factores iconProporciónese datos para un experimento factorial 2A*2B*3C. Estructure...

Contenido diseño factorial de dos factores iconProporciónese datos para un experimento factorial 3A*3B*3C. Estructure...

Contenido diseño factorial de dos factores iconUn diseño web en función del contenido

Contenido diseño factorial de dos factores iconCuando se refiere a los factores políticos, sociales, económicos,...

Contenido diseño factorial de dos factores iconFisiopatología Este se caracteriza por la inflamación microvascular...

Contenido diseño factorial de dos factores iconProgramación didáctica. 1º de bachillerato Ciencias Sociales
«Procesos, métodos y actitudes en matemáticas», bloque común a los dos cursos y que debe desarrollarse de forma transversal simultáneamente...

Contenido diseño factorial de dos factores iconFactores asociados Factores preparto






© 2015
contactos
m.exam-10.com