3.1 Conceptos básicos de estadística.
Población
Según (Douglas C. Montgomery y George C.Runger, 2002)
“Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto interés. En cualquier problema particular la población puede ser pequeña, grande pero finita o infinita.” (Pág. 85)
Según (Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers y Keying Ye 2012)
“Una población consta de la totalidad de las observaciones en las que estamos interesados.” (Pág.226)
De acuerdo a Allen L. Webster
(2000)
“Población es la recolección completa de todas las
observaciones de interés para el investigador.”(Pág. 8)
Ejemplos del uso o aplicación de la población
Según (Douglas C. Montgomery y
George C.Runger, 2008)
“El ingreso de los habitantes de una ciudad de Estados Unidos,
y el número de botellas con un contenido menor de bebida en un dia de producción de una compañía refresquera, son poblaciones de tamaño finito.”
(Pág. 85)
De acuerdo a (Allen L. Webster, 2000)
“Si los ingresos de los 121 millones de asalariados de los
Estados Unidos son de interés para un economista que asesore al congreso en la
formulación del plan nacional tributario, entonces los 121 millones de ingresos
constituyen una población.” (Pág. 8)
Según (Murray R. Spiegel 1997)
“Desearíamos extraer
conclusiones respecto a los colores de 200 bolas (la población) en una urna
seleccionando una muestra de 20 bolas de la urna, donde cada bola seleccionada
se regresa luego de observar su color.” (Pág. 155)
Bibliografía
- Allen L. Webster, 2000. Estadística aplicada a los negocios y la economía. Tercera ediciòn. Mc Graw Hill. Colombia
- Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers y Keying Ye ,2012. Probabilidad y estadística para ingeniería y ciencias. Novena edición. Pearson. México
- Murray R. Spiegel 1997. Probabilidad y estadística. Primera edición. Mc Graw Hill. México.
Muestra aleatoria
Según (Douglas C. Montgomery y George C.Runger, 2002)
“Sea X la variable
aleatoria que representa el resultado de tomar una observación de la población.
Sea f(x) la funcion de densidad de
probabilidad de X. supongase que cada
observacion en la,uestra independiente, bajo las mismas condiciones. Esto es,
las observaciones de la muestra se obtienen al observar X de manera independiente bajo condiciones que no cambian, digamos,
n veces. Sea Xi la variable aleatoris que representa la i-ésima réplica.
Entonces X1, X2, . . . , Xn contituyen una muestra aleatoria, donde los valores
numéricos obtenidos son X1, X2, . . . , Xn.”(Pág. 285-286)
Dennis
D.Wackerly, William Mendenhall III y Richard L. Scheaffer. (2010) menciona que:
“Represente
con N y n los números de elementos en la
población y la muestra, respectivamente.
Si el
muestreo se realiza en forma tal que cada una de las( N, n) muestras
tiene igual probabilidad de ser seleccionada, se dice que el muestreo es
aleatorio y que el resultado es una muestra aleatoria.”(Pág. 78)
Según (MURRAY R,
SPIEGEL, 1991).
“Lógicamente, la
confiabilidad de la conclusión extraídas concemientes a una población depende
de si la muestra se ha escogido apropiadamente de tal modo que represente la
población lo suficientemente bien; uno de los problemas importantes de la
inferencia estadística es como escoger una muestra.” (Pág. 156)
Bibliografía
- Douglas C. Montgomery y George C.Runger, 2002. Probabilidad y estadística aplicadas a la ingeniería, primera edición, Mc Graw Hill, México.
- Dennis D.Wackerly, William Mendenhall III y Richard L. Scheaffer, 2010. Estadística matemática con aplicaciones. Séptima edición, Cengage Learning, México.
- Murray R. Spiegel 1997. Probabilidad y estadística. Primera edición. Mc Graw Hill. México.
3.2 Descripción de datos.
Datos agrupados
De acuerdo a (Larry
Stephens, 2009)
“Datos agrupados Datos que se
dan en intervalos de clase, como cuando se resumen para una distribución de
frecuencias. No se tienen los valores de los datos originales.” (Pág., 126)
Según (Levin Richa I, 2004)
“Una
distribución de frecuencias consta de datos
agrupados en clases. Cada valor de una observación cae dentro de alguna de
las clases.” (Pág., 62)
Para (David R. Anderson, 2008)
“Datos agrupados en la mayor parte de los casos, las
medidas de localización y variabilidad se calculan mediante los valores
individuales de los datos. Sin embargo, otras veces sólo se tienen datos agrupados
o datos en una distribución de frecuencias.” (Pág. 120)
Frecuencia relativa
Para (David R. Anderson, 2008)
“La
frecuencia relativa de una clase es igual a la parte o proporción de los
elementos que pertenecen a cada clase. En un conjunto de datos, en el que hay
n observaciones.” ( Pág. 29)
Según (Levin Richa I, 2004)
“Distribución de frecuencias relativas presentación de un
conjunto de datos en el que se muestra la fracción o porcentaje del total del
conjunto de datos que entra en cada clase
mutuamente excluyente y
colectivamente exhaustiva.” (Pág. 45)
De acuerdo a (Larry Stephens, 2009)
“La frecuencia relativa de una clase es la frecuencia de la
clase dividida entre la suma de las frecuencias de todas las clases y
generalmente se expresa como porcentaje.” (Pág. 37)
PUNTO
MEDIO
Para (David R. Anderson, 2008)
“El
punto medio de clase es el valor
que queda a la mitad entre el límite inferior y el límite superior de la clase.
En el caso de las duraciones de las auditorias, los cinco puntos medios de
clase son 12, 17, 22, 27 y 32.” (Pág. 35)
De acuerdo a (Larry Stephens, 2009)
“Punto medio de clase Valor que se
encuentra a la mitad entre el límite de clase inferior y el límite de clase
superior.” (Pág.98)
Según (William Mendenhall, Robert J. Beaver y Barbara M. Beaver, 2010)
“Muchos conjuntos de datos cuantitativos están formados de
números que no se pueden separar fácilmente en categoría o intervalo. Entonces
se hace necesaria una forma diferente de graficar este tipo de datos.” (Pág. 20)
Bibliografia
- Larry Stephens, 2009. Estadística. Cuarta edición, México, McGraw Hill editores.
- Levin, Richar L, 2004 estadística para administración y economía. Séptima edición, México, Person educación.
- David R. Anderson, 2008, Estadística para administración y economía, decima edición, Cergage Learning editares.
- William Mendenhall, Robert J. Beaver y Barbara M. Beaver, 2010. Introducción a la probabilidad y estadística. Décimatercera edición, México, Cengage Learning Editores.
3.3. Medidas de tendencia central
MEDIA
ARITMÉTICA
Según
(Mario F. Triola, 2009)
“La media aritmética,
por lo general, es la medida numérica más importante que se utiliza para
describir datos; comúnmente se le conoce como promedio.” (Pág. 77)
Para
(Murray R. Spiegel y Larry J. Stephens)
“La media aritmética, o
brevemente la media, de un conjunto de N números X1, X2,
X3, . . . XN se denota así: X_ que se lee X barra .”
(Pág. 61)
MEDIA GEOMÉTRICA
(Douglas
A. Lind, William G. Marchal, 2008)
“La media geométrica resulta útil para determinar el cambio promedio de
porcentajes, razones, índices o tasas de crecimiento. Posee amplias aplicaciones
en la administración y la economía, ya que con frecuencia hay interés en determinar
los cambios porcentuales de ventas, salarios o cifras económicas, como el
producto interno bruto, los cuales se combinan o se basan unos en otros. La media
geométrica de un conjunto de n números positivos se define como la raíz
enésima de un producto de n variables.” (pág. 69)
Según (Levin, Richard I. y Rubin, David. S. 2010)
“Media
geométrica Medida de tendencia central utilizada para medir la tasa
promedio de cambio o de crecimiento de alguna cantidad, se calcula tomando la n-ésima
raíz del producto de n valores que representan el cambio.” (pág. 118)
Para (Murray R. Spiegel y Larry J. Stephens)
"La media geométrica G de N números positivos X1, X2, X3, . . . , XN es la raíz n-ésima del producto de los números." (Pág. 65)
Para (Murray R. Spiegel y Larry J. Stephens)
"La media geométrica G de N números positivos X1, X2, X3, . . . , XN es la raíz n-ésima del producto de los números." (Pág. 65)
MEDIA PONDERADA
Según
(Mario F. Triola, 2009)
“los valores varían de acuerdo con su grado de importancia,
por lo que podemos ponderarlos y calcular la media ponderada de los
valores x, una media que se obtiene asignando distintos pesos (w)
a los valores.” Pág. 84)
(Douglas
A. Lind, William G. Marchal, 2008) menciona que:
“La media ponderada constituye un caso especial de la media aritmética
y se presenta cuando hay varias observaciones con el mismo valor.” (pág. 61)
De
acuerdo a
(Levin, Richard I. y Rubin, David. S. 2010)
“La media ponderada nos permite calcular un
promedio que toma en cuenta la importancia de cada valor con respecto al
total.” (pág. 69)
MEDIANA
(Levin, Richard I. y Rubin, David. S. 2010) expone que
“La mediana
es un solo valor del conjunto de datos que mide la observación central del
conjunto. Esta sola observación es el elemento que está más al centro del
conjunto de números. La mitad de los elementos están por arriba de este punto y
la otra mitad está por debajo.” (pág. 77)
De acuerdo a (Mario F. Triola, 2009)
“La mediana de
un conjunto de datos es la medida de tendencia central que implica el valor
intermedio, cuando los valores de los datos originales se presentan en
orden de magnitud creciente (o decreciente). La mediana suele denotarse con x
testada (y se lee “x con tilde”).” (Pág. 78)
Según (Douglas
A. Lind, William G. Marchal, 2008)
“Mediana Punto medio de los valores una vez que se
han ordenado de menor a mayor o de mayor a menor.” (pág. 62)
MODA
Según (Douglas
A. Lind, William G. Marchal, 2008)
“Moda valor de la observación que
aparece con mayor frecuencia.” (pág. 64)
De acuerdo a (Levin, Richard I. y Rubin, David. S. 2010)
“La moda es el valor que más se repite en el conjunto de datos.” (pág. 84)
(Mario F. Triola, 2009) expone que:
“La moda de
un conjunto de datos es el valor que se presenta con mayor frecuencia.” (Pág. 80)
VARIANZA
Según (Levin, Richard I. y Rubin, David. S. 2010)
“Cada población tiene una varianza, su símbolo es sigma
cuadrada. Para calcular la varianza de una población, la suma de los cuadrados
de las distancias entre la media y cada elemento de la población se divide
entre el número total de observaciones en población. Al elevar al cuadrado cada
distancia, logramos que todos los números sean positivos y, al mismo tiempo,
asignamos más peso a las desviaciones más grandes (desviación es la distancia
entre la media y un valor).” (pág. 96)
Según
(Mario F. Triola, 2009)
“La varianza de un conjunto de valores es una medida de variación igual
al cuadrado de la desviación estándar." (Pág. 97)
DESVIACIÓN ESTÁNDAR
De acuerdo a (David
R. Anderson, Dennis J. Sweeney y Thomas A. Williams)
“La desviación estándar se define como la raíz cuadrada positiva
de la varianza. Continuando con la notación adoptada para la varianza muestral
y para la varianza poblacional, se emplea s para denotar la
desviación estándar muestral y σ
para
denotar la desviación estándar poblacional.” (Pág. 95)
(Levin, Richard I. y Rubin, David. S. 2010) señalan que:
“Desviación
estándar es la raíz
cuadrada positiva de la varianza medida de dispersión con las mismas unidades
que los datos originales, más que en las unidades al cuadrado en que se expresa
la varianza.” (pág. 118)
Según
(Mario F. Triola, 2009)
“La desviación estándar de un conjunto de valores muéstrales, es la
medida de variación de los valores con respecto a la media. Es un tipo de
desviación promedio de los valores con respecto a la media.” Pág. 94.
RANGO
De acuerdo a (Levin, Richard I. y Rubin, David. S. 2010)
“El
rango es la diferencia
entre el más alto y el más pequeño de los valores observados.” (pág. 92)
Según
(Mario F. Triola, 2009)
“El rango de un conjunto de datos es la
diferencia entre el valor máximo y el valor mínimo.” (Pág. 93)
(Douglas A. Lind, William G. Marchal, 2008) señala que:
“La medida más simple de
dispersión es el rango. Representa la diferencia entre
los Valores máximo y mínimo de un conjunto de datos.”
(pág. 73)
Bibliografia
- Douglas A. Lind, William G. Marchal, 2008. Estadística aplicada a los negocios y la economía. Decimotercera edición, México: Mc Graw Hill.
- Mario F. Triola, 2009. Estadística, décima edición, México. Pearson Educación.
- Levin, Richard I. y Rubin, David S., 2010. Estadística para administración y economía, séptima edición, México. Pearson educación.
- Douglas A. Lind, William G. Marchal, 2008) estadística aplicada a los negocios y la economía. Decimotercera edición, México. Mc Graw Hill.
3.4. Parámetros para datos agrupados
Según (Jay L. Devore, 2008)
“En el estudio de las distribuciones de datos,
la estadística selecciona un conjunto de los mismos de forma que sean
representativos de todos los de la distribución. Estos datos seleccionados se
denominan características de la distribución o parámetros estadísticos.”
(Pág.190)
Bibliografia
Jay L. Devore, 2008. Probabilidad y Estadística para
Ingeniería y Ciencias. Séptima edición. México. Cengage Learning
editores.
3.6
Distribución de frecuencias.
De acuerdo a Allen L. Webster (2000)
“Una distribución de frecuencias (o tabla de frecuencias)
ordenará los datos si estos se dividen en clases y se registrará el número de
observaciones en cada clase.” (Pág. 22)
Según (David R. Anderson, Dennis J. Sweeney y Thomas A. Williams, 2008)
“Una distribución de frecuencia es un resumen tabular de datos que muestra
el número
(frecuencia)
de elementos en cada una de las diferentes clases disyuntas (que no se
sobreponen).” (Pàg. 28)
Para (Levin, Richard I. y Rubin, David. S. 2010)
“Una distribución de frecuencias es una
tabla en la que organizamos los datos en clases, es decir, en grupos de valores
que describen una característica de los datos.” (pág. 14)
Bibliografía
- Allen L. Webster, 2000. Estadistica aplicada a los negocios y la economía. Tercera ediciòn. Colombia. Mc Graw Hill.
- David R. Anderson, Dennis J. Sweeney y Thomas A. Williams, 2008 Estadística para administración y economía. Decima edición. México. Cengage Learning Editores, S.A. de C.V.
- Levin, Richard I. y Rubin, David S., 2010. Estadística para administración y economía, séptima edición, México. Pearson educación.
3.6. Técnicas de agrupación de
datos.
De acuerdo a (Allen L. Webster, 2000)
“Pueden utilizarse varias herramientas básicas
para describir y resumir un conjunto grande de datos. La manera más simple,
pero quizás la más significativa, es la serie ordenada, la utilidad de una
serie ordenada es limitada. Se necesitan mejores técnicas para describir nuestro
conjunto de datos.” (Pág. 21)
Ejemplo
De acuerdo a Allen L. Webster (2000)
“Se asume que los puntajes de
CI de cinco recién graduados de la Universidad de Podunk son 75, 73, 91, 83 y
80.Una serie ordenada simplemente enumera tales observaciones en orden
ascendente o descendente. Los cinco valores pueden aparecer como 73, 75, 80,
83, 91.” (Pág. 21)
Bibliografía
Allen L. Webster, 2000. Estadistica aplicada a los negocios y la economía. Tercera ediciòn. Colombia. Mc Graw Hill.
3.8. Técnicas de muestreo
De acuerdo a (Allen L. Webster, 2000)
“Son las estrategias
aplicadas por los investigadores durante el proceso de muestreo estadístico.”
Ejemplo
De acuerdo a (Allen L. Webster, 2000)
“Muestreo aleatorio simple,
muestreo sistemático, muestreo estratificado, muestreo por conglomerados.”(Pág.
161)
Bibliografía
Allen L. Webster, 2000. Estadistica aplicada a los negocios y la economía. Tercera ediciòn. Colombia. Mc Graw Hill.
3.9. Histograma
Según (Douglas A. Lind, William G.
Marchal y Samuel A. Wathen, 2008)
“Histograma es una gráfica en la que las clases se señalan en el
eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias
de clase se representan por medio de las alturas de las barras, éstas se
dibujan de manera adyacente.” (Pág. 35)
Según
(Mario F. Triola, 2009)
“Un histograma es una
gráfica de barras donde la escala horizontal representa clases de valores de
datos y la escala vertical representa frecuencias. Las alturas de las barras
corresponden a los valores de frecuencia; en tanto que las barras se dibujan de
manera adyacente sin huecos entre sí.” (Pág. 51)
Para (Humberto Gutiérrez Pulido y Román de la Vara Salazar, 2009)
“Histograma es una representación gráfica de la distribución de un conjunto de datos o de una variable, donde los datos se clasifican por su magnitud en cierto número de clases. Permite visualizar la tendencia central, la dispersión y la forma de la distribución.”(Pág. 23)
Bibliografía
- Douglas A. Lind, William G. Marchal, 2008. Estadística aplicada a los negocios y la economía. Decimotercera edición, México: Mc Graw Hill.
- Mario F. Triola, 2009. Estadística, décima edición, México. Pearson Educación
- Humberto Gutiérrez Pulido y Román de la Vara Salazar, 2009. Control
estadístico de calidad y seis sigma, segunda edición, México, Mc Graw Hill.