El pais
SUSCRÍBETE
En este centro se han realizado proyectos en muchas áreas, una de las que más sobresale es la de la salud, específicamente en el diagnóstico de enfermedades como la Leishmaniasis y el Parkinson. | Foto: Especial para El País

INVESTIGACIÓN

Conoce el centro de investigación y desarrollo tecnológico de la Icesi enfocado en la Ciencia de Datos y la Inteligencia Artificial

En este centro se han realizado proyectos en muchas áreas, una de las que más sobresale es la de la salud, específicamente en el diagnóstico de enfermedades como la Leishmaniasis y el Parkinson.

24 de enero de 2023 Por: Elpais.com.co

Con el fin de mejorar la eficiencia productiva y la competitividad de las empresas, la Universidad Icesi crea el Centro de Ciencia de Datos para contribuir en la búsqueda de estos aspectos, basadas en técnicas que sirven para resolver los problemas que enfrentan estas organizaciones en sus procesos productivos y administrativos, usando los datos que ellas mismas han ido generando en sus operaciones diarias. Además, es un campo de trabajo que es utilizado por los estudiantes en diferentes programas y niveles de estudio.

La mayoría de las organizaciones hoy en día, y desde hace años por no decir décadas, cuentan bien sea con procedimientos manuales o sistemas automatizados de software, CRMs, ERPs, sistemas presupuestales y contables, de planeación, producción, distribución y logística, e incluso sistemas genéricos tan sencillos como Excel, entre otros, para registrar datos de las operaciones y procesos productivos que realizan diariamente.

Así, estos datos acumulados año tras año tienen información concreta y detallada de cómo ha operado y cómo se ha llevado el negocio, siendo una fuente invaluable de consulta, estos datos recogidos a largo y ancho de la organización, unidos a los de sus proveedores, sus clientes y su entorno en la sociedad y en el mundo, se vuelven más y más voluminosos.

Gabriel Tamura, director del Centro de Ciencia de Datos, aseguró que “esta perspectiva de los grandes volúmenes de datos con los que es posible contar hoy, es lo que ha permitido el resurgimiento y la re-adopción de la Inteligencia Artificial y el Aprendizaje Automático en el contexto actual, pues estas áreas de conocimiento ya existían desde la década de 1950, sin hablar de otras áreas como las

matemáticas, la estadística y la investigación de operaciones, que también son muy importantes en la Ciencia de Datos, y que son aún más antiguas”.

En últimas, lo que realmente es nuevo y abre las puertas a un sinnúmero de posibilidades es esta amplia disponibilidad de datos en grandes cantidades, que permiten crear y desarrollar nuevos modelos y técnicas de aprendizaje e inteligencia artificial, más precisos y que reflejan cada vez mejor lo que conocemos como inteligencia humana.

En la perspectiva tradicional, los datos acumulados se resumen en indicadores de desempeño, límites de control u otros reportes que a lo largo del tiempo han resultado de mucha utilidad, por ejemplo, para tomar cierta clase de decisiones.

Sin embargo, esto se hace sobre datos que resumen otros datos. La Ciencia de Datos y la Inteligencia Artificial expanden esta forma de toma de decisiones aprovechando no solo los datos resumidos sino todos los datos en su forma cruda, sin procesar, para generar procesos automatizados que aprenden de estos datos para ofrecer más soporte y mejor valor agregado a la toma de decisiones.

¿Cómo inicia el Centro de Ciencia de Datos?

Desde hace varios años, distintos departamentos académicos de la Universidad Icesi venían trabajando en las áreas denominadas analítica de datos y Big Data.

Específicamente, a finales del 2014, Icesi unió esfuerzos con otras tres universidades colombianas, EAFIT, Los Andes y la Javeriana de Bogotá, más tres organizaciones del sector empresarial, tres empresas líderes en el mundo en tecnologías de analítica y Big Data y el Departamento Nacional de Planeación para constituir la Alianza CAOBA. Con el auspicio del Ministerio de las TIC, esta alianza creó meses después el Centro de Excelencia y Apropiación en Big Data y Analítica, en el que participaron en la definición de competencias, cursos de formación en el área, y en el desarrollo de varios proyectos.

Tamura, también contó que de forma independiente a esta alianza, “la Universidad Icesi empezó la creación de un diplomado en Analítica y Grandes Volúmenes de Datos, así como cursos relacionados en varios de sus programas de formación profesional”.

Posteriormente, creó la especialización en Analítica Aplicada a los Negocios, y la Maestría en Ciencia de Datos en el año 2018. En esta última se adoptó una concepción desde la Inteligencia Artificial y el Aprendizaje Automático, aprovechando la gran cantidad de datos que se producen hoy en día en los procesos productivos en las organizaciones, y que muy pocas explotan.

A partir de la continuidad de estos programas académicos en el tiempo, y el afianzamiento y proliferación del uso de diversas técnicas de áreas de conocimiento como la Inteligencia Artificial y el Aprendizaje Profundo (Deep Learning) a nivel mundial, enfocados en el procesamiento, entendimiento y traducción de lenguaje natural, reconocimiento facial y de todo tipo de objetos en imágenes, y síntesis de soluciones en diversos campos de aplicación, tales como el análisis de textos en lenguaje natural, y

la optimización de procesos bioquímicos y de producción, la Universidad Icesi crea el Centro de Ciencia de Datos.

¿Qué participación tienen los estudiantes de estos programas en el Centro de Ciencia de Datos?

En este centro, junto con la ruta de formación en el área que tiene la Icesi, se fortalecen las competencias que adquieren los estudiantes y que varían según el nivel de formación en el que se matriculen, ya sea en pregrado, posgrado, diplomado, especialización, certificaciones, micromaestría o maestría.

Durante el pregrado, estos cursos forman en competencias puntuales de conceptualización y desarrollo de diversas técnicas de Aprendizaje Automático y de Inteligencia Artificial, en lenguajes de programación como Python.

También, en posgrado, se estructuran programas de varios cursos con distintos objetivos de formación. Por ejemplo, en los diplomados, el objetivo es que los estudiantes logren un entendimiento que abarque los temas principales que involucra el desarrollo de proyectos de Ciencia de Datos o Inteligencia Artificial, sin enfatizar en las competencias de la implementación de las técnicas en lenguajes de programación.

Por otra parte, en las certificaciones, micromaestrías y maestrías, los estudiantes deben lograr tanto un entendimiento de la teoría y conceptualización de los modelos, métodos y técnicas correspondientes al programa, así como un dominio de la implementación de los mismos usando lenguajes de programación apropiados. Las certificaciones y micromaestrías son nuevos productos que estamos implementando para que quienes quieran certificar solo algunas de las competencias que hacen parte de un programa oficial (maestría, por ejemplo), puedan obtener dicha certificación y se les homologue más adelante, si deciden optar por el programa completo.

El Centro de Ciencia de Datos articula conocimientos, procesos e infraestructuras que existen en diversas unidades académicas de la Universidad, y trabaja en colaboración con otros centros de la Universidad tales como el Laboratorio de Ingeniería Bioquímica, BIOINC; el Centro de Investigación y Tecnología en Salud, CENIT; el Centro Interdisciplinario de Transformación Digital, CITRADI; el Laboratorio de Innovación, INNLAB; Centro de Investigación en Economía y Finanzas, CIENFI y el Centro de Estudios en Protección y Economía de la Salud, PROESA, entre otros.

De manera especial, el Centro de Ciencia de Datos trabaja en coordinación con la Maestría en Ciencia de Datos y con la Maestría en Inteligencia Artificial Aplicada que será lanzada próximamente.

Por ejemplo, uno de los estudiantes más sobresaliente de estos programas es Luis Eduardo Ferro Diez, quien ingresó a la maestría de Investigación en Ingeniería en 2018 enfocándose en Ciencia de Datos.

En su Tesis de Maestría, “Characterizing Geographic Areas Using Natural Language Processing”, construyó un corpus de conocimiento entrenado de temas, basado en mensajes de texto en lenguaje natural y publicados en Internet por usuarios de un sistema.

Adicionalmente, lo combinó con datos de contexto como la ubicación de los usuarios y el sitio en el que publicaban los mensajes y con esto propuso un nuevo enfoque para realizar segmentación de marketing espacial caracterizando áreas geográficas densamente pobladas.

El corpus constó de ocho millones de vectores de documentos y diez categorías de productos, con el que desarrolló un clasificador de documentos de productos. Posteriormente, con trabajo adicional, publicó, en conjunto con sus tutores, un artículo de investigación titulado “Geo-Spatial Market Segmentation and Characterization Exploiting User Generated Text Through Transformers and Density-Based Clustering” en la revista IEEE Access, una publicación de primera categoría, Q1 en SCImago.

Al graduarse, Luis Eduardo se postuló y fue contratado para trabajar en el Institute of Advanced Research in Artificial Intelligence (IARAI) de la Johannes Kepler Universität Linz, en Austria, en donde se desempeña exitosamente.

¿Cómo es el trabajo con las empresas?

El director del Centro de Ciencia de Datos también contó que se han realizado proyectos en muchas áreas, una de las que más sobresale es la de la salud y específicamente en el diagnóstico de enfermedades tales como la Leishmaniasis y el Parkinson, usualmente a partir del procesamiento de imágenes simples incluso tomadas con la cámara de un teléfono móvil, o de videos.

“Estos proyectos se han desarrollado en colaboración con distintas organizaciones, tales como CIDEIM y la Fundación Valle del Lili, entre otros. En algunos casos, los modelos obtenidos han logrado diagnosticar con mayor precisión y en menor tiempo que médicos especializados. No obstante, es necesario someterlos a estudios sistemáticos más rigurosos de confiabilidad y aplicabilidad generalizada”, informó Gabriel Tamura.

El director del Centro de Ciencia de Datos también contó que se han realizado proyectos en muchas áreas, una de las que más sobresale es la de la salud y específicamente en el diagnóstico de enfermedades tales como la Leishmaniasis y el Parkinson, usualmente a partir del procesamiento de imágenes simples incluso tomadas con la cámara de un teléfono móvil, o de videos.

“Estos proyectos se han desarrollado en colaboración con distintas organizaciones, tales como CIDEIM y la Fundación Valle del Lili, entre otros. En algunos casos, los modelos obtenidos han logrado diagnosticar con mayor precisión y en menor tiempo que médicos especializados. No obstante, es necesario someterlos a estudios sistemáticos más rigurosos de confiabilidad y aplicabilidad generalizada”, informó Gabriel Tamura.

AHORA EN Información Comercial