Seminario | Approximation-regularization for the analysis of large data sets

Lo sentimos, pero este evento ya no se encuentra disponible. Déjanos tu correo electrónico para avisarte si este evento se repite

Título

Approximation-regularization for the analysis of large data sets (Aproximación-regularización para el análisis de grandes conjuntos de datos)

Idioma: Inglés

Expositor

Daniel Joseph McDonald, PhD

Profesor de los departamentos de estadística y ciencias de la computación
Universidad de Indiana, Estados Unidos.

Resumen

Cuando los conjuntos de datos son extremadamente grandes, los límites computacionales dificultan la implementación de métodos estándares como la regresión lineal o el análisis de componentes principales (PCA). Para abordar este problema, las técnicas de aproximación, denominadas como “sketching”, “preconditioning”, o “compression”, intentan minimizar la pérdida de información relativa a la solución insesgada que resultaría al usar la totalidad de los datos sujeta a restricciones computacionales. Sin embargo, debido a que la solución de datos completos es insesgada, tiende a tener una varianza grande y, por lo tanto, puede no dar los mejores resultados en términos de error cuadrático medio. En este trabajo tomamos un enfoque diferente: soluciones aproximadas pueden ser mejores que soluciones usando la totalidad de los datos, porque en realidad disminuyen la varianza en algunas situaciones. Examinamos las técnicas de aproximación para la regresión de mínimos cuadrados y discutimos las extensiones al PCA y a la regresión de PCA y demostramos nuestros resultados en datos de genética y astronomía.

Organizado por

  • Especialidad de Estadística
  • Maestría en Estadística