ALIA 40B Function Calling: Un Agente IA Español Gestionando Odoo en Producción

163,000 tokens de contexto. Function calling nativo. Multilingüe en todas las lenguas oficiales de España. Y lo mejor: open-source y ejecutable en local. El Barcelona Supercomputing Center (BSC) acaba de lanzar ALIA 40B Function Calling, y en Montevive AI lo hemos puesto a prueba en un caso de uso real: automatizar un ERP Odoo con un agente que entiende castellano, catalán y gallego.
Spoiler: funciona. Y hemos cuantizado el modelo para que puedas probarlo tú también en GPUs Blackwell.
¿Por qué Function Calling cambia el juego?
La diferencia entre un chatbot y un agente es la capacidad de ejecutar acciones. Un chatbot te responde preguntas. Un agente puede buscar en tu base de datos, crear registros, enviar emails, actualizar tickets... todo a través de llamadas a funciones (function calling).
Hasta ahora, si querías un agente IA en español con capacidades empresariales reales, tus opciones eran limitadas:
- GPT / Claude: Excelentes, pero envían tus datos a servidores de EE.UU. (riesgo GDPR)
- Modelos open-source anteriores: Carecían de fine-tuning específico para tool-calling en español
ALIA 40B FC cierra esta brecha: IA soberana, multilingüe y lista para producción.
Qué trae de nuevo ALIA 40B Function Calling
El BSC ha realizado un fine-tuning específico sobre el modelo base ALIA 40B con tres mejoras clave:
1. Ventana de Contexto Ampliada: 163,000 Tokens
Suficiente para manejar:
- Historiales de conversación extensos
- Múltiples definiciones de herramientas (20-30 funciones simultáneas)
- Documentación completa de APIs en contexto
2. Entrenamiento con Tecnología NVIDIA NeMo RL
Fine-tuning mediante reinforcement learning usando NVIDIA NeMo Framework con datasets sintéticos generados principalmente con DeepSeek V3. El modelo aprende a:
- Identificar la intención del usuario
- Seleccionar la herramienta correcta
- Estructurar los parámetros de las llamadas
- Manejar errores y confirmaciones
3. Multilingüismo Oficial Español
No es solo "español compatible". ALIA domina:
- Castellano (español estándar)
- Catalán (català)
- Gallego (galego)
- Euskera (euskara)
Esto importa para empresas con operaciones en múltiples comunidades autónomas o administraciones públicas con requisitos de lenguas cooficiales.
Esta ventaja no es casual: el tokenizador de ALIA procesa texto en español, catalán y gallego con ~1,7× menos tokens que Llama 3 o Mistral, lo que se traduce en mayor eficiencia de contexto y mejor comprensión semántica. En function calling, esto significa que las definiciones de herramientas y los parámetros en español ocupan menos espacio en la ventana de contexto, permitiendo trabajar con más funciones simultáneamente.
Nuestra aportación: Cuantización NVFP4 para GPUs Blackwell
Para facilitar el despliegue de este modelo de 40 mil millones de parámetros, en Montevive AI hemos realizado la cuantización NVFP4 del modelo original del BSC.
¿Qué es NVFP4?
Es un formato de 4 bits propietario de NVIDIA específicamente optimizado para las nuevas GPUs Blackwell (RTX 50xx series, GB10 en DGX Spark). A diferencia de cuantizaciones tradicionales, NVFP4 mantiene mayor precisión en operaciones críticas para inferencia.
Rendimiento real
En nuestras pruebas con una NVIDIA GB10 (DGX Spark):
- Velocidad: ~10 tokens/segundo
- Memoria: ~22 GB VRAM
- Formato: GGUF (compatible con llama.cpp, Ollama, etc.)
👉 Descarga el modelo aquí: montevive/ALIA-40b-fc-2605-NVFP4-GGUF
Esta es nuestra segunda cuantización de ALIA para Blackwell. En mayo publicamos la primera cuantización NVFP4 del modelo base ALIA 40B, pensada para fine-tuning local en DGX Spark. Ahora, con la versión Function Calling ya ajustada por el BSC, ofrecemos un modelo listo para producción en agentes empresariales.
El experimento: Un Agente IA para Odoo ERP
Configuramos un servidor de inferencia con nuestro modelo ALIA 40B NVFP4 conectado a un conector MCP (Model Context Protocol) para Odoo. El agente disponía de herramientas para:
- Buscar contactos (search_contacts)
- Obtener detalles (get_contact)
- Crear registros (create_contact)
- Actualizar datos (update_contact)
Video: Gestionando contactos en Odoo con ALIA
Grabamos todo el proceso para que veas exactamente cómo responde ALIA a instrucciones en diferentes idiomas y ejecuta acciones reales en la base de datos:
Prueba 1: Búsqueda Multilingüe
Castellano: "Lista todos los contactos"
- ✅ Identifica la herramienta
search_contacts - ✅ Devuelve resultados formateados
Catalán: "Busca el correu electrònic de María García"
- ✅ Comprende la intención en catalán
- ✅ Ejecuta búsqueda por nombre
- ✅ Extrae y presenta el email
Gallego: "Móstrame os datos de contacto de Juan López"
- ✅ Entiende la solicitud en gallego
- ✅ Recupera información completa (teléfono, dirección, email)
Observación técnica: Aunque la cuantización puede introducir algo de ruido, el modelo mantiene excelente comprensión multilingüe. El BSC recomienda evaluar tareas específicas de tool-calling en lenguas cooficiales según tu caso de uso.
Prueba 2: Creación de Datos (Write Operation)
La prueba definitiva: modificar la base de datos.
Prompt: "Crea un nuevo contacto: Ana Martínez, email ana@example.com, teléfono +34 666 777 888, dirección Calle Mayor 10, Granada"
Resultado:
- ✅ Parsea correctamente todos los campos
- ✅ Ejecuta
create_contactcon parámetros estructurados - ✅ Confirma la creación con el ID del nuevo registro
El contacto aparece instantáneamente en la interfaz de Odoo. El agente no solo habla, actúa.
Observación: GDPR-Awareness Incorporado
Durante las pruebas, ALIA mostró una tendencia a ser precavida con datos personales. En algunos casos, pedía confirmación antes de ejecutar búsquedas o modificaciones. Esto refleja su alineamiento con GDPR durante el entrenamiento.
Solución: Añadimos un System Prompt explícito indicando que el agente opera en un entorno local seguro y con autorización legítima. Esto redujo las "dudas" sin comprometer la seguridad.
¿Cuándo Usar ALIA 40B FC vs. Alternativas?
| Criterio | ALIA 40B FC | GPT-4 | Claude 3.5 | Llama 3 70B |
|---|---|---|---|---|
| Soberanía digital | ✅ 100% local | ❌ Cloud EE.UU. | ❌ Cloud EE.UU. | ⚠️ Local pero sin FC nativo |
| Multilingüismo ES oficial | ✅ Cat/Gal/Eus nativo | ⚠️ Limitado | ⚠️ Limitado | ⚠️ Limitado |
| Function Calling | ✅ Fine-tuned | ✅ Excelente | ✅ Excelente | ⚠️ Requiere prompting |
| Privacidad (GDPR) | ✅ On-premise | ❌ DPA requerido | ❌ DPA requerido | ✅ On-premise |
| Coste por llamada | ✅ 0€ (tras HW) | 💰 Alto | 💰 Alto | ✅ 0€ (tras HW) |
| Hardware mínimo | ⚠️ GPU Blackwell | ✅ API (sin HW) | ✅ API (sin HW) | ⚠️ GPU alta gama |
Casos de Uso Ideales para ALIA
✅ Administraciones públicas (requisito de lenguas cooficiales) ✅ ERPs con datos sensibles (financiero, salud, RRHH) ✅ Empresas con restricciones GDPR estrictas ✅ Startups con presupuesto limitado (sin coste por API call) ✅ Desarrollos piloto antes de comprometer infraestructura cloud
Limitaciones Honestas (Porque No Vendemos Humo)
🔴 Requiere hardware específico: GPUs Blackwell para aprovechar NVFP4 (RTX 50xx+) 🔴 Velocidad: 10 tokens/s es suficiente para agentes, pero más lento que APIs cloud 🔴 Ecosistema menos maduro: Menos tooling/integraciones que OpenAI/Anthropic 🔴 Latencia inicial: Carga del modelo en memoria (no serverless como APIs)
¿Cuándo NO usar ALIA?
- Si necesitas latencias <100ms (usa APIs dedicadas)
- Si tu equipo no tiene expertise en self-hosting de LLMs
- Si tu caso de uso no requiere soberanía ni multilingüismo específico
Cómo Empezar con ALIA 40B FC
Opción 1: Descarga Directa (Developers)
# Requiere llama.cpp o compatible
huggingface-cli download montevive/ALIA-40b-fc-2605-NVFP4-GGUF
# Ejecuta con llama.cpp
./llama-server -m ALIA-40b-fc-2605-NVFP4.gguf \
-c 163000 \
--gpu-layers 99 \
--port 8080
Opción 2: Integración con MCP
Conecta el modelo a Model Context Protocol para integraciones rápidas con herramientas empresariales (Odoo, PostgreSQL, APIs internas). Puedes encontrar el repositorio oficial de MCP en GitHub.
Opción 3: Consulta con Montevive
¿Necesitas ayuda con el deployment o casos de uso específicos? 👉 Agenda una llamada
Conclusión: La IA Soberana Ya No Es Futuro
ALIA 40B Function Calling demuestra que la IA pública española no solo alcanza estándares internacionales, sino que aporta valor diferencial real:
- Soberanía: Sin dependencia de proveedores extranjeros
- Multilingüismo real: Lenguas oficiales españolas como ciudadanos de primera clase
- Transparencia: Open-source, auditable, sin cajas negras
- GDPR nativo: Privacidad por diseño, no por compliance
Desde que probamos por primera vez ALIA en enero de 2025, hemos visto una evolución impresionante: del modelo base conversacional a una versión con function calling nativo, pasando por mejoras sustanciales en contexto, multilingüismo y rendimiento.
El equipo del BSC está acelerando el desarrollo de una IA nacional práctica y útil. Nosotros en Montevive seguiremos optimizando, cuantizando y experimentando con estos modelos para demostrar que las empresas españolas pueden automatizar sus procesos sin sacrificar control ni privacidad.
Recursos Adicionales sobre ALIA
Si quieres profundizar en ALIA y cómo aprovecharlo en tu empresa, hemos documentado nuestra experiencia completa:
- 📦 Primera cuantización NVFP4 de ALIA base: Ideal para fine-tuning en tu dominio específico (legal, salud, administración)
- 🔤 Análisis del tokenizador de ALIA: Demo interactiva mostrando la eficiencia en lenguas ibéricas
- 🧪 Nuestras primeras pruebas con ALIA (enero 2025): Contexto histórico del proyecto
🚀 Próximos Pasos
Para Developers: Descarga el modelo y comparte tus experimentos con el hashtag #ALIA40B en X/Twitter o LinkedIn. ¿Has probado otros casos de uso? Nos encantaría saberlo.
Para Empresas: Si estás evaluando agentes IA para tu ERP, CRM o sistemas internos, hablemos de tu caso específico. Podemos ayudarte a evaluar si ALIA es la solución adecuada.
Para la Comunidad: Únete a la conversación sobre IA soberana. El futuro de la tecnología europea se construye colaborando, no compitiendo.
Recursos:

