Este artículo se publicó originalmente en ChemistryWorld.Com.
ENTREVISTA CON PHIL KAY, GERENTE DE APRENDIZAJE DE JMP
No necesita programar para ser químico,
pero necesita saber utilizar los datos
Los químicos siempre tendrán que adaptar sus habilidades a nuevas formas de hacer ciencia. Cuando era estudiante, me enseñaron a fabricar tubos de punto de fusión estirando capilares de vidrio sobre la llama de un mechero Bunsen. Lo recuerdo porque se me daba muy mal: el contenedor de objetos punzantes estaba repleto de mis obras. Afortunadamente, esa técnica ya estaba obsoleta incluso entonces, y no tuve necesidad de probar mi destreza manual más allá de eso.
En un momento dado, la mayoría de los químicos habrían necesitado al menos nociones básicas de soplado de vidrio. Sin embargo, dado que la mayoría de sus requisitos de trabajo de vidrio eran comunes a los de muchos miles de científicos que existían, pronto surgieron empresas para proveer ese mercado con productos estándar. Hoy, sería absurdo tener que fabricar un condensador Liebig propio para poder llevar a cabo una destilación, o para producir herramientas o reactivos propios.
El trabajo del químico consistirá menos en fabricar muestras y más en generar datos.
Hoy en día existe una tendencia en torno a las habilidades de investigación que considero igualmente absurda: considerar esencial aprender programación para el futuro de la ciencia. Esta idea se extiende a medida que más ciencia pasa del "in vitro" al "in silico". Es cierto que la programación es útil, pero no es un requisito previo para hacer ciencia, igual que no lo es el soplado de vidrio. Esta idea es poco útil porque enfatiza una parte de la investigación poco acertada: se centra en cómo hacer algo, en lugar de por qué hacerlo. Aún peor: ignora la necesidad de aprender a manejar los datos, que es mucho más importante.
Según las necesidades de programación
Según este argumento, a medida que la I+D se vuelva más digital, habrá menos trabajo práctico de laboratorio. En el laboratorio del futuro, las tareas prácticas rutinarias se automatizarán y los investigadores dedicarán su tiempo a programar esas máquinas y sus flujos de trabajo de datos. Por lo tanto, todo el mundo debería ponerse a hacer bootcamps de programación.
Conozco a muchos científicos a los que les encanta la idea de aprender nuevas destrezas digitales como la programación, y yo soy uno de ellos. He aprendido lo suficiente como para haber hecho cosas útiles con la programación en varios momentos a lo largo de mi carrera. Pero solo cuando he tenido que hacerlo.
Recientemente, me interesé en un nuevo método de aprendizaje automático llamado "modelado de conjunto autovalidado" (SVEM, por sus siglas en inglés) que promete ser excepcionalmente útil para analizar los conjuntos de datos más pequeños que normalmente producimos en experimentos industriales de investigación y desarrollo. El algoritmo permite iterar cientos de veces en una rutina de análisis, algo que nadie desearía hacer manualmente. Pasé algunas horas escribiendo código para hacerlo. La papelera se me llenó rápidamente de código roto, metafóricamente hablando. Sin embargo, fue una forma divertida de profundizar en el conocimiento del SVEM, del mismo modo que uno puede apreciar mejor la forma y la función de matraces y embudos si intenta fabricar los suyos propios.
La transformación digital sigue siendo uno de los mayores desafíos a los que se enfrentan las organizaciones hoy en día.
Al realizar mis limitados experimentos, el SVEM me pareció útil, pero no creo que sea necesario que nadie escriba su propio código. Usted podría arriesgarse a usar el mío, pero incluso yo ya no lo uso. Esto se debe a que los "verdaderos" desarrolladores de software han hecho un trabajo mucho mejor: la versión más reciente de JMP Pro contiene una interfaz simple que permite a cualquier persona analizar sus datos con SVEM con solo unos pocos clics. Lo mejor de la programación es que una persona puede producir algo una vez, y que esto luego puede ser reutilizado sin cesar por otras personas.
Céntrese en habilidades que añadan valor
La mayoría de las tareas para las que antes tenía que escribir código ahora se pueden hacer de forma interactiva, y en los últimos años se ha producido una explosión en el número de herramientas comerciales de software de datos y de automatización de laboratorio sin código o con código reducido. Al igual que las empresas que fabrican vidrio en serie, las empresas de software han sido creadas por personas que entienden estos retos y, en colaboración con la comunidad científica, sus dedicados desarrolladores han creado herramientas fáciles de usar para satisfacer estas necesidades de forma específica. Para la mayoría de las personas, aprender a crear sus propias herramientas digitales sería una pérdida de tiempo.
Sin embargo, la transformación digital, y el desarrollo de habilidades necesarias para lograrlo, sigue siendo uno de los mayores desafíos que enfrentan las organizaciones en la actualidad. He hablado con científicos de empresas grandes y pequeñas de todo el mundo y nadie lo ha descifrado. Un enfoque que he visto es que las empresas convierten a un pequeño número de entusiastas en expertos que puedan codificar soluciones personalizadas de forma interna para optimizar los flujos de trabajo de datos de sus compañeros. Sin embargo, esto solo es valioso como paso posterior, una vez hecho el trabajo de base más importante: construir los cimientos de una cultura basada en los datos.
El primer paso es reconocer la necesidad de mejorar las habilidades de datos de todo el personal científico. En el futuro, el trabajo de los químicos consistirá menos en fabricar muestras y más en generar datos que puedan convertirse en información útil. Las empresas de más éxito ya están mejorando la alfabetización de datos de todo su personal, centrándose en las habilidades clave y las herramientas de software que ayudarán a sus científicos a adaptarse a este cambio en el paradigma.
En el futuro, los químicos no necesitarán ser programadores, igual que hoy tampoco necesitan ser sopladores de vidrio. Deberán ser expertos en visualización para poder explorar rápidamente sus datos y comunicar información. Necesitarán comprender el modelado estadístico y los fundamentos del aprendizaje automático para extraer la máxima información de conjuntos de datos tanto pequeños como grandes. Y necesitarán usar un diseño estadístico de experimentos para producir datos más valiosos. JMP ha creado un recurso de formación en línea gratuito, Statistical Thinking for Industrial Problem Solving, que ofrece una introducción a todos estos temas. Infórmese con la colección Chemistry World de diseño de experimentos en colaboración con JMP.
Acerca del autor
Phil Kay es gerente de aprendizaje de JMP Statistical Discovery, una filial de SAS. Su trabajo consiste en comprender los retos de la ciencia y la ingeniería, y ofrecer orientación sobre soluciones de análisis de datos para organizaciones industriales de todo el mundo.
Phil ha sido un científico clave en el desarrollo de numerosos procesos de fabricación de colorantes para impresión digital en FujiFilm Imaging Colorants. Phil tiene un máster en Estadística Aplicada con una monografía sobre diseño de experimentos. También tiene un máster y un doctorado en Química.
Es miembro de la Real Sociedad de Estadística, químico colegiado y miembro del comité del Grupo de Química y Tecnología de Procesos de la Real Sociedad de Química.
A Phil le encanta mostrar a todo el mundo cómo el análisis de datos permite desarrollar una ciencia mejor. Siga a Phil Kay, evangelista del Análisis de Datos, en LinkedIn.
¡Sigamos en contacto!
Pueden ponerse en contacto conmigo por correo electrónico para informarme sobre noticias, eventos y ofertas de JMP. Entiendo que puedo retirar mi consentimiento en cualquier momento.