Este libro es un introducción a los instrumentos prácticos del análisis de datos exploratorios.
Este libro adopta un enfoque computacional, que tiene varios ventajas sobre los enfoques matemáticos:
- Presento la mayoría de las ideas usando código Python, en lugar de Notación matemática. En general, el código Python es más legible; también, debido a que es ejecutable, los lectores pueden descargarlo, ejecutarlo, y modificarlo.
- Cada capítulo incluye ejercicios que los lectores pueden hacer para desarrollarse y solidificar su aprendizaje. Cuando escribes programas, tú expresar su comprensión en el código; mientras usted está depurando el programa, también está corrigiendo su comprensión.
- Algunos ejercicios incluyen experimentos para probar estadística comportamiento. Por ejemplo, puede explorar el Teorema del límite central (CLT) mediante la generación de muestras aleatorias y la computación de sus sumas. El Las visualizaciones resultantes demuestran por qué funciona el CLT y cuándo no.
- Algunas ideas que son difíciles de entender matemáticamente son fáciles de entiende por simulación. Por ejemplo, aproximamos los valores de p por ejecutar simulaciones aleatorias, que refuerza el significado de la P-valor.
- Porque el libro se basa en una programación de uso general lenguaje (Python), los lectores pueden importar datos de casi cualquier fuente. No se limitan a conjuntos de datos que se han limpiado y formatado para una herramienta de estadística particular.
(AU). Traducido con Google Translator