Evento presencial
Salón de Seminarios S-105 del Departamento de Matemáticas, Facultad de Ciencias, UNAM
Resumen:
La plática de Carlos Ordoñez de la Universidad de Houston discutirá como cursos de sistemas de bases de datos, minería de datos y sistemas de información, se han ido transformando en cursos de ciencias de datos con un enfoque cada vez más fuerte en IA y programación más automatizada. Esta plática discutirá cómo la IA, la nube (cloud) y bibliotecas en Python han ido cambiando el procesamiento de datos. Hace 20-40 años los sistemas de BD relacionales eran la mejor y quizás única alternativa para almacenar y procesar datos de manera correcta y confiable con SQL. Hace 10-15 años las redes neuronales y hardware más poderoso cambiaron el panorama drásticamente. Hoy en día, hay una gran cantidad de datos (ej. texto, imágenes, video) que no se originan ni acaban en una BD relacional; y para el caso de BD con SQL muchas consultas ya están pre-programadas vía JavaScript+SQL. Con la tendencia de IA un analista tiene como objetivo calcular un modelo predictivo con datos diversos, sobre todo redes neuronales. Los datos ya no están fijos en un servidor; se mueven de un sistema a otro en la nube con archivos de texto (CSV, JSON, XML). Por otro lado, la programación se ha simplificado, con cantidad de código disponible en Internet y con herramientas basadas en LLMs que pueden proporcionar código 80%, dejando un 20% que el programador tiene que ensamblar y adaptar. En resumen, ahora se tiene que aprender SQL, pero también Python y JavaScript. Estas nuevas tendencias están simplificando y acelerando la programación de procesamiento de datos con herramientas de IA.
Semblanza:
Carlos Ordonez studied at UNAM University in Mexico, getting a B.Sc. in actuarial science (applied math, similar to data science degrees) and an M.S. in computer science. He continued PhD studies at the Georgia Institute of Technology advised by Edward Omiecinski, focusing on accelerating machine learning algorithms, getting the PhD in 2000. Carlos worked at NCR from 1998 to 2006, collaborating in the optimization of machine learning and cube query processing algorithms on the Teradata parallel DBMS. In 2006 Carlos joined the Department of Computer Science at the University of Houston, where he currently leads the Big Data Systems (BDS) lab. From 2013 to 2015 Carlos regularly visited MIT and collaborated with Michael Stonebraker, working on new-generation parallel DBMSs (columnar, arrays). From July 2014 to July 2015 Carlos worked as a visiting researcher with ATT Labs-Research (formerly ATT Bell Labs), where he conducted research on stream analytics, extending the R language and data quality with Divesh Srivastava.