IBM lanza modelos de inteligencia artificial de código abierto bajo licencia Apache 2.0

IBM lanza modelos de inteligencia artificial de código abierto bajo licencia Apache 2.0

Introducción a la relación entre código abierto y inteligencia artificial

La inteligencia artificial (IA) y el código abierto tienen una relación complicada. La IA no puede existir sin el código abierto, pero pocas empresas están dispuestas a abrir el código de sus programas de IA o modelos de lenguaje grande (LLM). Sin embargo, IBM es una excepción notable, ya que anteriormente abrió el código de sus modelos Granite. Ahora, IBM está duplicando sus esfuerzos en el código abierto de IA con el lanzamiento de sus últimos modelos Granite AI 3.0 bajo la licencia Apache 2.0.

Características de los modelos Granite

IBM ha logrado esto utilizando datos de preentrenamiento de conjuntos de datos públicamente disponibles, como GitHub Code Clean, Starcoder, repositorios de código públicos y problemas de GitHub. Además, IBM ha tomado grandes medidas para evitar posibles problemas de derechos de autor o legales. Los modelos Granite son LLM diseñados específicamente para casos de uso empresarial, con un fuerte énfasis en programación y desarrollo de software. IBM afirma que estos nuevos modelos fueron entrenados con tres veces más datos que los lanzados anteriormente este año. También ofrecen mayor flexibilidad en la modelización y soporte para variables externas y previsiones móviles.

Ventajas de los modelos Granite

En particular, los nuevos modelos Granite 3.0 8B y 2B están diseñados como modelos “de trabajo” para la IA empresarial, brindando un rendimiento sólido para tareas como Recuperación de información mejorada por generación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Estos modelos también están disponibles en variantes Instruct y Guardian. La primera, como su nombre lo promete, ayuda a las personas a aprender un idioma en particular. Guardian está diseñado para detectar riesgos en las solicitudes de los usuarios y las respuestas de la IA. Esto es vital porque, como señaló el experto en seguridad Bruce Schindler en la conferencia Secure Open-Source Software (SOSS) Fusion, “los ataques de inyección de solicitudes funcionan porque estoy enviando a la IA datos que está interpretando como comandos” – lo que puede llevar a respuestas desastrosas.

Acceso a los modelos Granite

Los modelos de código Granite van desde 3 mil millones hasta 34 mil millones de parámetros y han sido entrenados en 116 lenguajes de programación y 3 a 4 terabytes de tokens, combinando datos de código extensos y conjuntos de datos de lenguaje natural. Estos modelos están accesibles a través de varias plataformas, incluyendo Hugging Face, GitHub, Watsonx.ai de IBM y Red Hat Enterprise Linux (RHEL) AI. Un conjunto curado de los modelos Granite 3.0 también está disponible en Ollama y Replicate.

Nuevo lanzamiento de Watsonx Code Assistant

Además, IBM ha lanzado una nueva versión de su asistente de código Watsonx para el desarrollo de aplicaciones. Allí, Granite proporciona asistencia de codificación generalizada en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para aplicaciones de Enterprise Java. Las capacidades de codificación de Granite ahora están accesibles a través de una extensión de Visual Studio Code, IBM Granite.Code.

Conclusión

La licencia Apache 2.0 permite tanto el uso de investigación como comercial, lo que es una ventaja significativa en comparación con otros LLM importantes, que pueden afirmar ser de código abierto pero vincular sus LLM con restricciones comerciales. Al hacer que estos modelos estén disponibles de forma gratuita, IBM está reduciendo las barreras de entrada para el desarrollo y el uso de la IA. IBM también cree, con razón, que porque son verdaderamente de código abierto, los desarrolladores y los investigadores pueden construir rápidamente sobre ellos y mejorar los modelos. IBM también afirma que estos modelos pueden ofrecer un rendimiento comparable a modelos mucho más grandes y mucho más costosos. En resumen, los modelos Granite de IBM son una contribución significativa al campo de la inteligencia artificial y el código abierto, y su disponibilidad bajo la licencia Apache 2.0 los convierte en una herramienta valiosa para desarrolladores y empresas que buscan aprovechar el potencial de la IA.