Arquitectura d'una fàbrica d'IA: claus per muntar-la bé

  • Una fàbrica d'IA integra dades, còmput, models i desplegament a una plataforma industrialitzada capaç de produir solucions d'IA a escala.
  • El cor de l'arquitectura són els data lakes, els pipelins robustos i les plataformes d'entrenament i operació de models.
  • IA generativa, RAG, copilots i agents d'IA es recolzen en aquesta infraestructura per oferir aplicacions segures i personalitzades.
  • Ètica, governança i bucles de retroalimentació continua asseguren qualitat, compliment i millora constant en tots els casos dús.

Arquitectura d´una fàbrica d´IA

La arquitectura d'una fàbrica d'IA és molt més que entrenar un model gran i posar-lo darrere d'una API. És una combinació orquestrada de dades, infraestructura, models, processos de negoci, seguretat i govern que permet crear, desplegar i millorar solucions d'intel·ligència artificial de manera contínua. Si es construeix bé, es converteix en una mena de “línia de muntatge” digital capaç de produir copilots, agents i aplicacions intel·ligents a un ritme industrial.

En els darrers anys hem passat de fer proves soltes amb prompts senzills a desplegar ecosistemes complets de IA generativa que donen suport a aplicacions empresarials crítiques, assistents conversacionals, anàlisi avançada de dades o sistemes autònoms. Perquè tot això funcioni a escala calen fàbriques d'IA ben dissenyades, amb una arquitectura clara que abasti des dels fonaments de dades fins als agents d'alt nivell i la governança ètica.

Què és realment una fàbrica de IA

Una fàbrica d'IA és, en essència, una plataforma industrialitzada d'IA que reuneix emmagatzematge massiu, xarxes d'alta velocitat, còmput especialitzat i serveis de programari per entrenar, desplegar i operar models d'intel·ligència artificial a gran escala. És l'equivalent digital d'una planta industrial: en lloc de primeres matèries físiques, ingereix dades; en lloc de cadenes de muntatge, utilitza pipelins i orquestradors; i, en lloc de productes físics, lliura models, APIs i aplicacions intel·ligents.

Dins aquesta fàbrica conviuen granges de GPU i maquinari accelerador (GPU, TPU, DPU), xarxes optimitzades, capes d'emmagatzematge d'alt rendiment i serveis de plataforma que gestionen el cicle de vida dels models. Tot això està pensat per suportar càrregues intensives tant d'entrenament com d'inferència en temps real, amb mecanismes de balanceig de càrrega, observabilitat i escalat elàstic.

Aquest enfocament suposa la industrialització del desenvolupament d'IA: en lloc de projectes aïllats i experimentals, les organitzacions munten una plataforma comuna des de la qual crear múltiples solucions reutilitzant components: pipelins de dades, models base, llibreries d'avaluació, mecanismes de seguretat i patrons d'arquitectura provats.

A més, una fàbrica d'IA no és un projecte puntual, sinó una inversió contínua. Els models es reentrenen, les dades s‟actualitzen, l‟arquitectura s‟adapta a nous requisits de negoci i apareixen noves necessitats (per exemple, integrar agents coordinats o nous casos d‟ús generatius). La fàbrica és el marc estable sobre el qual es poden anar muntant aquestes innovacions.

Esquema d'arquitectura de fàbrica d'IA

Components nuclears de larquitectura duna fàbrica dIA

Perquè una fàbrica d'IA funcioni de forma robusta, cal combinar-ne diversos blocs arquitectònics ben definits que es connectin entre si mitjançant APIs, esdeveniments i pipelins. Tot i que cada organització adapta el disseny a la seva realitat, es repeteixen una sèrie d'elements clau.

1. Plataforma de dades: llacs, magatzems i analítica

Sense dades de qualitat no hi ha models útils, així que el nucli de la fàbrica és una plataforma de dades capaç d'ingerir, d'emmagatzemar i de servir grans volums d'informació estructurada i no estructurada.

En aquest àmbit solen combinar-se diverses peces: un data lake empresarial per emmagatzemar dades en brut (per exemple, sobre tecnologies tipus Azure Data Lake Storage o OneLake a Microsoft Fabric), magatzems de dades optimitzades per a analítica i mecanismes de processament distribuït, típicament basats en Apache Spark (Databricks, Spark a Fabric o HDInsight, entre d'altres).

Els llacs de dades permeten guardar informació en el format original (arxius, blobs, imatges, àudio, text lliure) amb semàntica de sistema d'arxius, seguretat per nivells i escalat a escala de petabytes. Sobre aquesta capa s'apliquen formats transaccionals com Delta Lake per assolir integritat ACID, versionat i rendiment en consultes analítiques massives.

Plataformes integrades com Microsoft Fabric unifiquen moviment, transformació i anàlisi sota un mateix paraigua: enginyeria de dades, ciència de dades, anàlisi en temps real, data warehouse i base de dades analítica, tot compartint un llac comú (OneLake) i oferint capacitats de IA embegudes, copilots per a anàlisi i habilitats de IA generativa orientades a consultes en llenguatge natural.

2. Pipeline de dades: ingesta, neteja i preparació

Per sobre de l'emmagatzematge se situen els pipelins de dades, que són el veritable “carril d'alimentació” de la fàbrica de IA. Aquí es defineixen els fluxos que porten dades des d'aplicacions de negoci, sensors, logs, transaccions, API de tercers o streams en temps real.

Eines d'integració com Data Factory o Fabric Data Factory permeten construir canalitzacions que orquesten tasques de còpia, transformació, enriquiment, deduplicació i càrrega al data lake o al data warehouse. Se suporten enfocaments de codi (Spark, notebooks, scripts) i de poc o gens de codi amb interfícies visuals d'arrossegar i deixar anar.

En molts casos es combinen canalitzacions per lots per a dades històriques amb fluxos de dades en streaming que actualitzen en temps gairebé real la informació que consumeixen els models. La qualitat d'aquests pipelins és crítica perquè si la dada arriba bruta o tarda, el model es degrada i la fàbrica deixa de produir valor.

A més, per a aplicacions de IA generativa amb RAG (Retrieval Augmented Generation) es construeixen pipelins específics per generar incrustacions vectorials, alimentar índexs de cerca semàntica i mantenir actualitzats els magatzems de coneixement que consulten els models de llenguatge.

3. Capa de còmput i entrenament de models

El bloc següent de l'arquitectura és la plataforma d'entrenament i experimentació, on científics de dades, enginyers de machine learning i equips de producte dissenyen, entrenen, avaluen i versionen models.

Serveis com Azure Machine Learning proporcionen àrees de treball, clústers gestionats de GPU i CPU, integració amb llibreries de codi obert (PyTorch, TensorFlow, scikit-learn, XGBoost, entre d'altres), AutoML per automatitzar part del treball i suport nadiu per a frameworks com MLflow per seguiment d'experiments i models.

El flux típic inclou: selecció d'algoritmes, enginyeria de característiques, entrenament supervisat o no supervisat, validació creuada, ajustament d'hiperparàmetres (manual o automàtic) i proves amb dades de validació i test. Tot això queda registrat per poder reproduir resultats, comparar versions i traçar quins models acaben arribant a producció.

Per a càrregues molt intensives o distribuïdes es fan servir temps d'execució específics com Databricks Runtime for Machine Learning o entorns Spark optimitzats, que inclouen llibreries de deep learning, suport per a entrenament distribuït (per exemple, amb Horovod) i utilitats per a enginyeria de característiques i servei de models amb baixa latència.

4. Models de llenguatge, IA generativa i RAG

En el context actual, bona part de les fàbriques d'IA giren al voltant de la IA generativa i els models de llenguatge. Aquests models s'entrenen amb grans col·leccions de text, codi, imatges o àudio i aprenen patrons estadístics que els permeten generar contingut coherent, resumir, traduir, respondre preguntes o raonar sobre instruccions.

Els models de llenguatge es caracteritzen pel nombre de paràmetres, que alhora defineix la capacitat expressiva i el cost computacional. Hi ha models petits (menys de 10.000 milions de paràmetres) que es poden executar en entorns més continguts, i models grans (LLM) amb desenes o centenars de milers de milions de paràmetres. Famílies com Microsoft Phi-3 il·lustren bé aquesta varietat amb versions mini, petites i mitjanes, pensades per equilibrar cost, rendiment i facilitat de desplegament.

El patró de Generació Augmentada per Recuperació (RAG) encaixa perfectament a larquitectura duna fàbrica dIA. En lloc d'ajustar el model amb dades privades, es connecta un sistema de recuperació (cercador vectorial, base de dades documental, magatzem de coneixement) que, en temps de consulta, injecta informació rellevant al prompt. Així es limita l'àmbit de la resposta al contingut corporatiu, es millora la precisió i es manté un control molt més gran sobre les fonts.

RAG no es restringeix a un únic tipus demmagatzematge: pot recolzar-se en motors de cerca vectorial, bases de dades de documents, magatzems de dades o barreges de diversos. L'important és que la arquitectura de recuperació estigui ben integrada amb el pipeline de dades i el servei d'inferència, de manera que qualsevol canvi a la informació de negoci es reflecteixi de forma àgil en les respostes dels models.

5. Copilots i agents d'IA basats en aquesta arquitectura

Sobre els models i la capa de recuperació es construeixen copilots i agents d'IA. Un copilot és un assistent conversacional basat en IA generativa que s'integra en una aplicació concreta (suite ofimàtica, eina de desenvolupament, CRM, etc.) i que ofereix ajut contextual: redactar textos, escriure codi, fer resums, generar consultes o automatitzar tasques.

Aquests copilots es recolzen en l'arquitectura oberta de la fàbrica: models base, connectors o eines, connexions a dades empresarials i capacitats de enginyeria de prompts i orquestració. Poden estendre's mitjançant complements desenvolupats per tercers o per la pròpia organització, afegint-hi noves funcions (consultar un ERP, llançar un flux d'aprovació, recuperar informes interns).

En paral·lel, les arquitectures basades en agents permeten coordinar-ne diversos agents d'IA especialitzats que hi col·laboren: un agent de planificació, un altre de recuperació d'informació, un d'execució d'eines, etc. L'orquestració d'agents esdevé un patró clau quan els escenaris són complexos (processos llargs, múltiples sistemes, decisions condicionades).

Serveis d'alt nivell com Foundry Agent Service ofereixen formes de crear agents com a microserveis, fins i tot amb enfocament sense codi, connectats a models base, magatzems de coneixement i APIs de negoci. Cada agent forma part de la fàbrica, reutilitzant infraestructura, seguretat i mecanismes d'observabilitat, però exposat com servei independent a la resta de lorganització.

6. Desplegament, inferència i operació en producció

Un cop entrenats i validats, els models passen a la fase de desplegament i inferència. Aquí l'arquitectura se centra a exposar APIs segures i escalables, integrar els models en aplicacions client (web, mòbil, backend, microserveis) i garantir que latència, cost i qualitat es mantenen sota control en el temps, fins i tot amb solucions de edge computing per a una IA amb menys latència.

Els models es poden desplegar com a serveis gestionats darrere d'una API amb tarifa per ús o allotjar-se dins del propi entorn de l'organització, especialment en el cas de models petits. Les arquitectures de referència inclouen portes d'enllaç d'aplicacions (Application Gateway), firewalls d'aplicacions web, xarxes virtuals segmentades, punts de connexió privats i protecció DDoS per assegurar que laccés a la IA està correctament protegit.

En aquest punt entren en joc eines de monitorització com Application Insights i Azure Monitor, que recopilen mètriques de rendiment, temps de resposta, errors, consum de tokens i traces. Aquests senyals alimenten dashboards i alertes que ajuden a operar el sistema d'IA com a servei crític, amb visibilitat tant d'infraestructura com de lògica de negoci.

L'arquitectura també contempla la sortida controlada a Internet a través de firewalls, l'ús de identitats administrades per connectar serveis interns (per exemple, des d'un agent fins a Azure OpenAI) i la segmentació a subxarxes per separar zones de dades, còmput, agents de compilació i salts administratius (bastion, jump boxes).

7. Bucle de retroalimentació contínua

Un tret que distingeix una fàbrica de IA madura és la presència d'un bucle de retroalimentació ben definit. Cada interacció dusuari, cada resultat dun model i cada mètrica dús es recull, sanalitza i sutilitza com a entrada per millorar els models o ajustar la lògica de negoci.

Aquest cicle continu inclou recopilar feedback explícit (valoracions, correccions) i implícit (taxa d'èxit de tasques, abandó, clics), integrar aquestes dades al pipeline d'entrenament, avaluar noves versions del model davant de les anteriors i, si les millores són sòlides, promoure-les a producció de forma controlada.

La retroalimentació també alimenta mòduls de supervisió de biaixos, qualitat de respostes, seguretat i compliment. Les fàbriques avançades inclouen panells de “IA responsable” per detectar errors sistemàtics, desalineacions amb les polítiques internes o comportaments no desitjats del model.

Gràcies a aquest bucle, la fàbrica passa de ser un sistema estàtic a convertir-se en una plataforma d'aprenentatge continu, capaç d'adaptar-se a canvis a l'entorn, a les dades oa les necessitats de negoci sense reiniciar-ho tot des de zero.

8. Ètica, governança i seguretat a la fàbrica d'IA

Qualsevol arquitectura seriosa de fàbrica dIA ha dincorporar des del disseny mecanismes d'ètica i governança. No n'hi ha prou que el sistema funcioni; ho ha de fer respectant la privadesa, evitant biaixos injustos, complint la normativa i alineant-se amb els valors de l'organització.

Això es tradueix en marcs de govern que defineixen qui pot entrenar quins models, quines dades es poden fer servir, com s'auditen les decisions del sistema i què controls d'accés i traçabilitat s'apliquen. A nivell tècnic, s'implementen tècniques d'anonimització, controls d'ús de dades sensibles, polítiques de retenció i eines per revisar i explicar les sortides dels models.

La seguretat forma part del mateix paquet: autenticació i autorització centralitzades (per exemple, amb Microsoft Entra ID), aïllament de xarxes, xifrat en trànsit i en repòs, gestió de secrets serveis com Key Vault i configuració de firewalls i WAF per protegir els punts d'entrada públics.

En paral·lel, els marcs com Azure Well-Architected Framework per a càrregues de treball d'IA donen guies sobre com equilibrar fiabilitat, seguretat, rendiment, eficiència de costos i excel·lència operativa en entorns on la IA és un component de primera classe.

Serveis i eines clau dins la fàbrica d'IA

Construir una fàbrica de IA no és començar de zero; es recolza en un ecosistema ampli de serveis de plataforma i eines que cobreixen cada part del cicle de vida de la IA, des de les dades fins als agents.

Serveis d'IA llestos per utilitzar

Els serveis d'Azure AI proporcionen APIs i models ja entrenats per a tasques com visió per ordinador, llenguatge natural, veu, traducció i presa de decisions. Aquests blocs preparats per a la producció permeten accelerar projectes sense necessitat d'entrenar des de zero, alhora que es mantenen opcions de personalització.

Per exemple, Azure AI Speech ofereix capacitats de reconeixement i síntesi de veu, amb opcions de veu personalitzada per adaptar el vocabulari i l'acústica a un domini concret. De la mateixa manera, Azure AI Translator permet entrenar traductors neuronals personalitzats per millorar la qualitat en indústries amb argot específic.

A l'àmbit documental, Azure AI Document Intelligence utilitza models avançats per classificar documents i extreure'n informació estructurada de formularis o PDFs. Poden entrenar-se models personalitzats per a tipus concrets de documents empresarials i combinar-se amb models compostos que resolen fluxos complets de processament documental.

Aquests serveis s'integren a la fàbrica com microserveis especialitzats que cobreixen casos dús concrets (subtitulació automàtica, classificació de tiquets, processament de contractes), beneficiant-se de la mateixa infraestructura de dades, seguretat i observabilitat.

Azure OpenAI i ajustament fi de models

Azure OpenAI permet accedir a models de llenguatge avançats (com diferents variants de GPT o altres models de l'oferta Foundry) i adaptar-los a necessitats específiques mitjançant ajustament fi. Aquest procés entrena el model amb dades pròpies per millorar la qualitat de les respostes en dominis concrets, reduir la longitud necessària dels prompts i optimitzar costos.

L'ajust fi es complementa amb patrons com ara RAG i amb controls de filtratge i moderació de contingut. Des de la perspectiva arquitectònica, Azure OpenAI es consumeix com un servei dins de la xarxa corporativa (sovint per mitjà de punts de connexió privats), integrat amb identitats administrades i seguint les polítiques de governança de l'organització.

A més, aquestes capacitats s'integren cada cop més en plataformes com Foundry, que ofereix un catàleg consolidat de models (més d'un miler en alguns catàlegs), opcions de Model com a servei, ajustament allotjat i fluxos davaluació automàtics per comparar models i configuracions de prompts.

Tot això facilita que la fàbrica pugui experimentar ràpidament amb diferents models, seleccionar els que millor equilibren rendiment i cost i estandarditzar la forma de consumir-los des de les aplicacions de negoci.

Plataformes de desenvolupament: Azure Machine Learning i Foundry

Per coordinar equips i projectes a la fàbrica es necessiten plataformes que gestionin el cicle de vida complet del machine learning. Azure Machine Learning Studio ofereix un entorn al núvol per entrenar, versionar i desplegar models, amb suport per a AutoML, canalitzacions orquestrades, experiments reproduïbles i monitorització de models en producció.

Aquesta plataforma centralitza àrees de treball, còmput, seguretat i connectivitat, de manera que els diferents equips puguin col·laborar compartint recursos però mantenint governança centralitzada. A més, permet integrar fases d'enginyeria de característiques, ajustament d'hiperparàmetres, avaluació amb panells d'IA responsable i desplegament via endpoints REST, inferència en temps real o per lots.

Foundry, per la seva banda, s'orienta a accelerar el desenvolupament de aplicacions d'IA generativa personalitzades: projectes col·laboratius, connexió a dades internes, orquestració de LLMs i RAG, disseny de fluxos de prompts, eines per avaluar respostes i mecanismes per desplegar els prototips en producció sobre infraestructura gestionada.

La combinació d'aquestes plataformes permet a la fàbrica oferir un entorn cohesionat que va des dels experiments de recerca fins als productes d'IA en producció, sense perdre traçabilitat, seguretat ni control de costos al camí.

Llenguatges i frameworks per a la fàbrica d'IA

A nivell d'implementació, la fàbrica d'IA es recolza sobretot a llenguatges com Python i R. Python domina l'ecosistema de machine learning i deep learning gràcies a la seva sintaxi senzilla, la seva enorme biblioteca estàndard i la disponibilitat de llibreries d'IA i dades. R segueix sent clau en estadística avançada, anàlisi de dades i certs sectors (finances, salut, investigació).

Aquests llenguatges s'utilitzen tant per crear algorismes d'aprenentatge automàtic tradicionals (regressió, arbres de decisió, clustering, etc.) com per dissenyar i entrenar xarxes neuronals profundes i models generatius. Al plànol arquitectònic, s'integren amb serveis d'orquestració de pipelins, plataformes com Azure Machine Learning o Databricks i eines de seguiment com MLflow.

Sobre ells es construeixen frameworks d'orquestració d'agents, llibreries per a enginyeria de prompts, SDKs per interactuar amb serveis d'IA i components reutilitzables que acaben formant part del “catàleg intern” de la fàbrica de IA de cada organització.

Gràcies a aquest ecosistema, els equips es poden moure amb soltesa entre la fase de prototipat en notebooks i la industrialització d'aquests prototips com a serveis robusts dins de l'arquitectura global.

Avantatges clau d´una arquitectura de fàbrica d´IA ben dissenyada

Quan tots aquests blocs s'integren de forma coherent, l'organització obté una sèrie de beneficis molt tangibles que van més enllà de tenir “un chatbot bonic”.

En primer lloc hi ha l'escalabilitat: la fàbrica està pensada per executar múltiples projectes d'IA en paral·lel, compartint infraestructura i llibreries comunes, cosa que redueix temps i costos. Els equips deixen de reinventar la roda amb cada intent i passen a recolzar-se en components estàndards (pipelins, plantilles de models, patrons de desplegament).

La velocitat també millora notablement. En comptar amb processos estandarditzats, automatització en entrenament i desplegament, i serveis llestos per utilitzar, el temps des de la idea fins a la posada en producció es escurça de forma dràstica. Això permet iterar ràpidament, testar hipòtesis de negoci i ajustar els casos dús amb menor risc.

Un altre efecte important és la consistència: seguir fluxos de treball repetibles i patrons d'arquitectura provats garanteix una qualitat més uniforme entre diferents models i aplicacions. L'enfocament de fàbrica ajuda a evitar que l'organització s'ompli de solucions aïllades, difícils de mantenir i amb nivells de seguretat desiguals.

Finalment, els bucles de retroalimentació permeten construir una cultura de millora contínua, on els models es reentrenen periòdicament, es corregeixen biaixos detectats, s'incorporen noves fonts de dades i es mesuren els resultats de negoci. La IA deixa de ser un projecte una vegada i es converteix en una capacitat estratègica permanent.

Tot aquest entramat tècnic i organitzatiu fa que l‟arquitectura d‟una fàbrica d‟IA s‟assembli més a dissenyar una planta industrial d‟alta precisió que a llançar una simple aplicació. Qui aconsegueixi muntar bé aquestes peces.dades sòlides, còmput potent, models ben governats, agents útils i una capa forta de seguretat i ètica— tindrà una plataforma preparada per aprofitar la propera onada d'innovació en intel·ligència artificial amb molta més solidesa i capacitat d'adaptació que la competència.

Galícia comptarà amb una fàbrica europea d'intel·ligència artificial per accelerar la innovació en salut
Article relacionat:
Galícia albergarà una fàbrica europea d'IA per impulsar la salut