top of page
Artboard 7 copy 20.jpg
Statistics for Developers & Engineers

De acuerdo a nuestras investigaciones, desde 1982, las ingenierías (particularmente la ingeniería en computación) son impartidas en nuestras universidades con una deficiencia muy grande en Matemáticas y Estadística. Con el auge (y subsecuente exhuberancia irracional) de la Ciencia de Datos y Machine Learning, es frecuente observar casos donde la falta de estas bases rigurosas resultan en proyectos fallidos, conclusiones espurias e inoperantes, y recomendaciones poco éticas y con impacto negativo en la sociedad. La Sociedad Mexicana de Ciencia de Datos, junto a The Data Pub, ha lanzado este curso enfocado a egresados de Ingeniería en Computación ya incorporados al mercado laboral, para que puedan adquirir el lenguaje y estructuras mentales para iniciarse en lel Análisis de Datos y colaborar efectivamente con Matemáticos, Físicos y Estadísticos para escalar sus productos a millones de registros.

Objetivos

1. Invitar al alumno capaz en programación a utilizar métodos estadísticos.
2. Familiarizar al alumno con el lenguaje matemático utilizado en los métodos de la Ciencias de Datos que involucran la estadística.
3. Proveer al alumno de las restricciones teóricas y los beneficios prácticos que la formalización matemática implica.

Temario

1. Pensamiento estadístico

El ingeniero o desarrollador recibirá los inicios de las estructuras mentales asociadas al pensamiento estadístico y uso del método científico. No solo es dudar y cuestionar sin método ni argumentos, sino saber observar y leer la evidencia, hacer uso de métricas de centralidad y conectar el estado de la realidad con éstas.

2. Estadística Descriptiva

El ingeniero o desarrollador aprenderá a utilizar herramientas aritméticas para describir una población, luego pasará a las herramientas gráficas, para terminar con herramientas de cálculo de probabilidades de eventos únicos y eventos relacionados.

3. Las distribuciones como herramienta para describir la realidad

El ingeniero o desarrollador transicionará de histogramas a distribuciones, cuya forma matemática permite expresar aún más aspectos de la población y diferentes fenómenos. Aprenderá las implicaciones de suponer que son ciertos algunos de los axiomas detrás de algunas distribuciones, y revisará el concepto de números aleatorios.

4. Distribuciones contínuas

El ingeniero o desarrollador aprenderá a modelar fenómenos usando diferentes distribuciones de la familia exponencial, como situaciones de la naturaleza, de la manufactura, de la logística y movimientos de retail, fenómenos financieros y económicos, y cómo se pueden usar estas distribuciones para simular fenómenos del mismo tipo.

5. Probabilidad

El ingeniero o desarrollador examinará algunos fenómenos aparentemente aleatorios, pero cuantificando rigurosamente tanto la incertidumbre, como los posibles resultados, terminando con el teorema de Bayes, el cual subyace a sofisticados temas actuales de ciencia de datos.

6. Operaciones sobre distribuciones

El ingeniero o desarrollador pasará de ajustar distribuciones a fenómenos observados, a modificar la distribución para explorar diferentes alternativas y caminos del mismo fenómeno, o ajustar la distribución, y por tanto la realidad, para mejores resultados de su análisis.

7. Pruebas de hipótesis

El ingeniero o desarrollador se introducirá a uno de los temas más duros del curso, y el cual hace que 8 de cada 10 estudiantes de la especialización en Data Science de Coursera + Johns Hopkins truene esta materia y la deba llevar 3 o 4 veces. Las pruebas de hipótesis son la piedra angular del método científico. ¿Recuerdan escuchar que algo no es "estadísticamente significativo"? Aquí es donde aprendemos a obtener esa "significancia estadística".

8. Estimación

El ingeniero o desarrollador se acercará a la tarea inmediatamente previa a la predicción. Aprenderá que la estimación no es solo acercarse a un valor, sino también cuantificar la varianza e intentar explicarla. Aprenderá diferentes técnicas de estimación y la diferencia entre conceptos como verdad, hecho, verosimilitud. También se aproximará a la estimación bayesiana, la cual privilegia incertidumbre sobre valores puntuales.

9. Correlación

El ingeniero o desarrollador aprenderá a medir y graficar relaciones entre variables de diferentes tipos, e interpretar las implicaciones de dichas relaciones en la realidad. Se acercará también a los fundamentos de la regresión lineal, la cual constituye el 1er algoritmo de aprendizaje automático cubierto en toda la literatura.

bottom of page