CIENCIA

El día que aprendí qué es la ciencia de datos

¿Qué es la ciencia de datos? ¿Qué hace un científico de datos? ¿Cómo me convierto en científico de datos? Estas son preguntas frecuentes en los sitios de redes sociales de ciencia de datos y, a menudo, se debaten en círculos académicos. Estas pueden ser preguntas difíciles de responder porque la ciencia de datos es muy nueva y evoluciona rápidamente. Además, las respuestas dependen en gran medida de los antecedentes de quienes responden. Por ejemplo, un científico informático podría responder en términos de optimización y aprendizaje automático, mientras que un estadístico podría hablar de errores de medición e inferencia. Los matemáticos aplicados podrían tener una visión diferente al centrarse en la importancia del álgebra lineal y el cálculo. Todos son correctos, que es lo que hace que la ciencia de datos sea una disciplina tan rica e interesante.

Mi propia formación académica se basa en un dominio de aplicación biológica específico pero con una formación formal en inteligencia artificial (IA), sistemas adaptativos complejos y estadísticas. No lo sabía en ese momento, pero mi formación interdisciplinaria me preparó muy bien para una carrera en ciencia de datos. Debo gran parte de mi formación a mi doctorado. mentor, quien se adelantó mucho al insistir en que sus estudiantes graduados recibieran títulos formales en estadística mientras obtenían un doctorado. en una ciencia biomédica. Como resultado, he pasado mi carrera investigando en la interfaz de la informática, la estadística y las ciencias biomédicas. Esto es lo que hoy llamamos ciencia de datos.

Cuando estaba trabajando en mi doctorado. disertación que mi asesor solía hablar sobre la maduración en estadística. Al principio, no tenía ni idea de qué estaba hablando. Después de mi cuarto o quinto curso de estadística de posgrado, hizo clic. Me encontré pensando en problemas como un estadístico. Comprendí la lógica de cómo funcionaban las estadísticas y, por primera vez, pude ver un camino a seguir para cualquier problema que encontrara. Esto, junto con mis cursos de computación y mi investigación en IA y otras áreas como la dinámica no lineal, me dio las habilidades y la confianza para convertirme en el científico de datos que soy hoy.

Tuve una epifanía similar sobre la ciencia de datos hace unos 15 años mientras asistía a un taller de IA. Alguien estaba presentando su trabajo sobre inteligencia artificial y algoritmos de aprendizaje automático para tomar decisiones de inversión. Esta persona no era un académico y trabajaba con un pequeño grupo que invirtió su propio dinero. Su trabajo consistió en configurar 50 algoritmos de predicción diferentes el viernes para analizar datos financieros históricos durante el fin de semana. A continuación, elegiría a los de mejor rendimiento y los utilizaría para realizar inversiones. Los resultados que mostró demostraron un rendimiento superior, un tipo de algoritmo de IA que no está respaldado por la profundidad de la teoría que tienen los métodos populares como las redes neuronales.

Lo que me llamó la atención de su trabajo es que a él no le importaba qué algoritmo saliera en la cima. Solo le preocupaban los beneficios de las inversiones. Fue en ese momento que la ciencia de datos hizo clic para mí. Estaba resolviendo un problema de una manera verdaderamente independiente de la disciplina. Al final del día, el valor de un enfoque analítico no son las citas ni los premios. El valor de un enfoque analítico es si está dispuesto a invertir su propio dinero en él.

La ciencia de datos no se trata de teoría. No se trata de décadas de tradición en disciplinas como las matemáticas aplicadas, la informática y la estadística. Ni siquiera se trata del método científico que defendemos en la academia. La ciencia de datos, en esencia, se trata de resolver un problema con cualquier herramienta que tenga a su disposición. A mi colega inversor no le importaba la teoría ni lo que los científicos académicos pensaran de él. Solo le importaba el resultado final. Veo esto como un enfoque práctico y tenemos muchos problemas prácticos con soluciones que ayudarían a la sociedad. Por supuesto, esto no significa que la ciencia de datos no se beneficie del conocimiento derivado del método científico. Lo que significa es que a veces es necesario ser creativo y romper las reglas disciplinarias para lograr un resultado particular.

La ciencia de datos seguirá evolucionando y, como ocurre con todas las disciplinas, probablemente desarrollará sus propias tradiciones y rigor científico. Mi esperanza es que no pierda de vista sus orígenes: resolver problemas difíciles uniendo herramientas y métodos para lograr un resultado práctico y útil. Por ahora, es un momento emocionante para ser científico de datos.

Publicaciones relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba
Cerrar
Cerrar