1.4 Medidas de tendencia central para un conjunto de datos y datos agrupados.
1.4.1 Media, Media ponderada.
1.4.2 Mediana.
1.4.3 Moda.
1.4.4 Relación entre media, mediana y moda.
1.5 Medidas de dispersión para un conjunto de datos y datos agrupados.
1.5.1 Rango.
1.5.2 Desviación media.
1.5.3 Varianza.
1.5.4 Desviación estándar.
视频信息
答案文本
视频字幕
Las medidas estadísticas son herramientas fundamentales para analizar datos. Se dividen en medidas de tendencia central, que nos indican valores típicos como la media, mediana y moda, y medidas de dispersión, que muestran qué tan dispersos están los datos. Podemos trabajar con datos simples o datos agrupados en intervalos.
La media aritmética es la suma de todos los valores dividida entre el número total de datos. Para datos ponderados, cada valor se multiplica por su peso correspondiente. La media nos indica el valor central típico del conjunto de datos.
La mediana es el valor que divide el conjunto de datos ordenados por la mitad. La moda es el valor que aparece con mayor frecuencia. Estas medidas son útiles cuando los datos tienen valores extremos que afectan la media.
La relación entre media, mediana y moda depende de la forma de la distribución. En una distribución simétrica, las tres medidas coinciden. En distribuciones asimétricas, la media se desplaza hacia la cola más larga.
Las medidas de dispersión nos indican qué tan esparcidos están los datos. El rango es la diferencia entre el máximo y mínimo. La desviación media, varianza y desviación estándar miden la dispersión promedio respecto a la media.
La media aritmética simple se calcula sumando todos los valores y dividiendo entre la cantidad total. La media ponderada considera la importancia relativa de cada valor mediante pesos. En el ejemplo, vemos cómo los pesos afectan el resultado final, desplazando la media hacia los valores con mayor peso.
La mediana es el valor que divide los datos ordenados por la mitad. Para datos impares, es el valor central; para datos pares, es el promedio de los dos valores centrales. La moda es el valor que aparece con mayor frecuencia. Estas medidas son útiles cuando hay valores extremos que afectan la media.
La relación entre media, mediana y moda depende de la forma de la distribución. En distribuciones simétricas, las tres medidas coinciden. En distribuciones con sesgo positivo, la media se desplaza hacia la cola derecha, siendo mayor que la mediana y la moda. La media es sensible a valores extremos, mientras que la mediana es más robusta.
Las medidas de dispersión complementan las de tendencia central al mostrar la variabilidad de los datos. El rango es la medida más simple pero sensible a valores extremos. La desviación media considera todas las desviaciones. La varianza y desviación estándar son las más utilizadas, siendo la desviación estándar especialmente útil por estar en las mismas unidades que los datos originales.