La ciencia de datos consiste en el análisis de datos con el propósito de obtener información valiosa para las organizaciones. Es un campo interdisciplinario que integra conceptos y métodos de matemáticas, estadística, inteligencia artificial e ingeniería informática para procesar grandes volúmenes de datos. A través de este análisis, los científicos de datos pueden formular y resolver preguntas como ¿qué ocurrió?,¿por qué ocurrió?, ¿qué ocurrirá? y ¿cómo utilizar los resultados? (¿Qué es la ciencia de datos?, s. f.).
La ciencia de datos es una disciplina relativamente nueva que, a diferencia de campos como las ciencias matemáticas, ha acumulado su conocimiento en un periodo de tiempo corto y de manera intensiva, en lugar de desarrollarse a lo largo de siglos. Su origen se remonta a la década de 1970, aunque el concepto de análisis de datos, propuesto por J. Tukey en su artículo de 1962 The Future of Data Analysis, puede considerarse como un antecedente del término ciencia de datos. Una serie de hechos que se reflejan en el grafico 1 impulsaron el desarrollo de la ciencia de datos a la actualidad..

Fuente: Adaptado de Fernández-Avilés
La ciencia de datos utiliza los enfoques formales de las matemáticas y las aplicaciones prácticas de la ingeniería informática para generar conocimiento y resolver problemas concretos en diversos ámbitos, como la astronomía, medicina, economía, marketing, finanzas, biología, industria, etc (Fernández-Avilés, 2024).
Referencias bibliográficas
Fernández-Avilés, G. (2024). Capítulo 1 ¿Es la ciencia de datos una ciencia? | Fundamentos de ciencia de datos con R. https://cdr-book.github.io/ciencia-datos.html
¿Qué es la ciencia de datos? – Explicación de la ciencia de datos – AWS. (s. f.). Amazon Web Services, Inc. Recuperado 29 de enero de 2025, de https://aws.amazon.com/es/what-is/data-science/