La IA generativa como herramienta de trabajo (I)
Tras un tiempo barruntando como iniciar un nuevo Blog para la nueva web de ACTel, hace unos días respondí a la publicación de un colega en LinkedIn sobre el estado actual de la IA como herramienta de trabajo. Mi comentario fue a propósito de como enfocar los usos profesionales de los algoritmos y las herramientas IA existentes que los incorporan, dependiendo del tipo de usuario empresarial que los planea utilizar. Decidí entonces buscar alguna web donde poder realizar pruebas para redactar el primer artículo sobre ello.
Cuando pensé en publicar a propósito de este tema, no imaginé que la extensión fuera tal que sea aconsejable realizar la publicación en más de una entrega. Finalmente así será. Este primer artículo como introductorio y los siguientes presentando las acciones, resumen de resultados y conclusiones. Los resultados detallados se facilitarán separadamente por medio de un enlace.
Contexto actual
Actualmente disponemos de múltiples herramientas de lo que se denomina como IA generativa, una denominación no científica sino mercadotécnica (publicitaria) en la misma forma que lo es hablar de IA, que se basan en presentar a los usuarios formularios que les permiten facilitar textos de entrada o preguntas (prompts) a las aplicaciones que utilizan los motores de IA para generar contenido en forma de texto o de imágenes.
Hemos de hablar de un nuevo Canal de Distribución, en este caso de servicios (SaaS), en el que existen mayoristas, empresas que han desarrollado los motores de IA y que los ponen a disposición de usuarios empresariales mediante las denominadas Interfaces de Programación de Aplicaciones (API), los minoristas. Estos últimos desarrollan herramientas que facilitan usos concretos a los usuarios finales, que pueden ser particulares, profesionales u otras empresas.
Lo que se denomina como IA son realmente algoritmos matemáticos que utilizan la estadística para la toma de decisiones desde hace muchos años. A modo de ejemplo, la propia red que conocemos como Internet fue concebida como red inteligente y está conformada por equipos de telecomunicaciones que ejecutan algoritmos de toma de decisión para encaminar los datos desde un origen hacia su destino, atravesando un número indeterminado de nodos de transmisión dependiendo del estado actual de la red. Cuando un nodo deja de funcionar, se recalcula (podríamos decir que se aprende) el nuevo camino que se debe seguir para mantener la comunicación y esto se puede conseguir sin perder los datos transmitidos y en pocos segundos, incluso en periodos inferiores a un segundo. Por lo tanto, hace muchos tiempo que todos somos usuarios, mejor dicho, que los servicios de los que depende nuestra vida diaria, incluyen mecanismos denominados como IA.
Los avances en computación, sobre todo en HPC, nos han llevado a que el estado del arte actual permite utilizar modelos estadísticos que nos sirven para el aprendizaje en una amplia diversidad de facetas, como el lenguaje humano. Los nuevos modelos se han dado en llamar IA generativa, que necesita de una inmensa cantidad de datos para su aprendizaje y por eso las redes sociales son gratuitas y los usuarios son el producto que estas venden a los que están desarrollando los modelos estadísticos que conforman la, para los profesionales con espíritu crítico como yo, mal denominada IA generativa. Actualmente, las denominaciones Aprendizaje Automático (ML) o Aprendizaje Profundo (DL) son las más apropiadas.
Tenemos entonces que la realidad actual es que la IA denominada como generativa engloba una serie de algoritmos de aprendizaje profundo (DL) que son capaces de interpretar y conformar textos coherentes, dicho de otro modo, mediante algoritmos de DL específicos para el Lenguaje Natural que conforman Modelos de Lenguaje Extensos (LLM) para, por ejemplo, resumir contenidos de una búsqueda en Internet y también para la generación de imágenes a partir de un texto descriptivo.
Búsqueda de una herramienta apropiada para realizar pruebas
Atendiendo al criterio del Canal de Distribución ya expuesto, decidí buscar una herramienta de una empresa minorista que utiliza la API de un mayorista y ofrece herramientas para un uso concreto a usuarios finales, obviando así las más conocidas y utilizadas, así como las herramientas técnicas para minoristas que les permiten generar herramientas para usuarios finales.
Cansado de recibir promociones y tener que solicitar la exclusión del envío de mensajes a suscriptores, busqué una herramienta que pudiera probar sin suscripción. Finalmente encontré una que servía a mi propósito. Se trata de una web que ofrece una herramienta gratuita, una aplicación en la nube de tipo "freemium", para generar imágenes y que tiene la deferencia de admitir leads que no se tengan que registrar obligadamente.
Me limito a probar con imágenes porque los resultados se pueden mostrar de manera más concisa que la generación de contenido y las conclusiones son extrapolables e ilustran apropiadamente sobre la materia tratada.
Objetivos de las pruebas
Para dar contenido a este artículo que ilustre el estado actual de las herramientas de IA denominadas como generativas, los objetivos que me marqué en las pruebas fueron los siguientes:
-
evaluar la funcionalidad de la herramienta
-
identificar los sesgos de la herramienta de IA generativa
-
comprobar la calidad de las imágenes generadas referida a:
-
la exactitud de las imágenes
-
la originalidad de las imágenes generadas inicialmente
-
la coherencia en imágenes sucesivas para ajuste fino
-
En el siguiente artículo se indicará la herramienta utilizada y se explicarán las pruebas realizadas, se proporcionará un resumen de los reultados obtenidos, así como las conclusiones extraidas.