Puntos clave

  • Las nuevas capacidades de Amazon Bedrock y Amazon SageMaker AI dan a los clientes acceso a técnicas avanzadas de personalización de modelos.
  • Reinforcement Fine Tuning (RFT) en Amazon Bedrock facilita adaptar los modelos a casos específicos y mejorar la precisión.
  • Amazon SageMaker AI reduce los flujos de trabajo de personalización avanzada de modelos de meses a días, acelerando el desarrollo de IA y llevando nuevas soluciones al mercado más rápidamente.

La eficiencia se ha convertido en un desafío crítico para las organizaciones que despliegan soluciones de Inteligencia Artificial (AI). Aunque crear aplicaciones de IA es cada vez más sencillo, ejecutarlas a escala sigue siendo costoso y requiere muchos recursos. Este reto es especialmente destacado en los agentes de IA, que pueden tener mayores demandas de inferencia al razonar sobre problemas, aprovechar diversas herramientas y coordinarse entre múltiples sistemas. La mayoría de las empresas optan por los modelos más grandes y capaces para impulsar sus agentes, pero una parte significativa del tiempo de un agente se dedica a tareas rutinarias, como consultar calendarios y buscar documentos, que no requieren de inteligencia avanzada. El resultado es costes innecesarios, respuestas más lentas y recursos desperdiciados.

La solución está en la personalización: adaptar modelos más pequeños y especializados para gestionar el trabajo que los agentes realizan con mayor frecuencia y ofrecer respuestas más rápidas y precisas a menor coste. Pero hasta ahora, las técnicas de personalización avanzadas, como el aprendizaje por refuerzo, requerían de una profunda experiencia en aprendizaje automático, una amplia infraestructura y meses de tiempo de desarrollo.

Hoy hemos anunciado nuevas capacidades de Amazon Bedrock y Amazon SageMaker AI que ponen la personalización avanzada de modelos al alcance de los desarrolladores de cualquier empresa. Reinforcement Fine Tuning (RFT) en Amazon Bedrock y la personalización de modelos sin servidor en Amazon SageMaker AI con aprendizaje por refuerzo simplifican el proceso de crear una IA eficiente, más rápida, rentable y más precisa en comparación con los modelos base. Al hacer que estas técnicas sean más accesibles para los desarrolladores de nuestros clientes, facilitamos que organizaciones de todos los tamaños puedan crear agentes personalizados para cualquier necesidad empresarial.

RFT, simplificado para desarrolladores en su trabajo diario con Amazon Bedrock

Las técnicas de personalización complejas suponen un obstáculo para crear modelos personalizados y eficientes. El aprendizaje por refuerzo, por ejemplo, entrena un modelo utilizando feedback de humanos o de otro modelo. El buen comportamiento se refuerza, mientras que el mal comportamiento se corrige. Esto es especialmente adecuado para el razonamiento y los flujos de trabajo complejos porque recompensa los buenos procesos, no solo las buenas respuestas. Sin embargo, el aprendizaje por refuerzo requiere una canalización de entrenamiento compleja, un cómputo masivo y acceso a feedback humano costoso o a un potente modelo de IA para evaluar cada respuesta.

RFT en Amazon Bedrock simplifica el proceso de personalización de modelos, poniendo esta técnica al alcance de cualquier desarrollador de cualquier empresa. Amazon Bedrock es una plataforma de IA totalmente gestionada que ofrece acceso a modelos fundacionales de alto rendimiento de Amazon y compañías líderes en IA, junto con capacidades para crear agentes y aplicaciones de IA generativa con funciones de seguridad, privacidad e IA responsable. RFT en Amazon Bedrock aporta de media un 66% de mejora en precisión respecto a los modelos base, ayudándole a obtener mejores resultados con modelos más pequeños, más rápidos y rentables, en lugar de depender de modelos más grandes y costosos.

El proceso es sencillo. Los desarrolladores eligen su modelo base, lo vinculan a sus registros de invocación (es decir, el historial de la IA) o cargan un conjunto de datos. A continuación, seleccionan una función de recompensa, basada en IA, usando reglas o una plantilla lista para usar. Los flujos de trabajo automatizados de Amazon Bedrock gestionan el ajuste específico (fine tuning) de extremo a extremo. De esta forma, no hace falta un doctorado en aprendizaje automático (ML), basta con tener claro qué es un buen resultado para el negocio. De cara al lanzamiento, RFT en Amazon Bedrock será compatible con el modelo Amazon Nova 2 Lite, y próximamente habrá compatibilidad con más modelos.

Clientes como Salesforce y Weni by VTEX han observado mejoras de precisión y eficiencia utilizando RFT en Amazon Bedrock. Phil Mui, SVP de Ingeniería de Software, Agentforce en Salesforce, dijo: “Las pruebas comparativas de AWS con Reinforcement Fine Tuning de Amazon Bedrock muestran resultados prometedores, demostrando hasta un 73% de mejora en precisión respecto al modelo base para nuestros requisitos empresariales específicos. Prevemos aprovechar RFT para mejorar y ampliar lo que ya logramos con ajuste específico supervisado, lo que nos permitirá ofrecer soluciones de IA aún más precisas y personalizadas a nuestros clientes. Este enfoque complementa nuestro flujo de desarrollo de IA actual manteniendo los altos estándares de calidad y seguridad de Salesforce”.

Amazon SageMaker AI acelera la personalización de modelos de meses a días

Los equipos que necesitan más control sobre el flujo de trabajo de IA pueden recurrir a Amazon SageMaker AI. Los desarrolladores de IA eligen SageMaker AI para la personalización porque les da control total para crear, entrenar y desplegar los modelos más capaces a escala.

Desde su lanzamiento en 2017, SageMaker AI ha hecho el flujo de desarrollo de IA más rápido y eficiente. Sin embargo, a medida que las empresas buscan utilizar técnicas de personalización más avanzadas, demandan experiencias más fluidas que eliminen obstáculos que llevan meses de trabajo, como la gestión de infraestructura y la generación de datos sintéticos, para poder centrarse en ofrecer mejores resultados a los clientes. Por eso, SageMaker AI ahora admite nuevas capacidades de personalización de modelos sin servidor, haciendo posible la personalización en cuestión de días.

Hay dos experiencias entre las que elegir: una experiencia agéntica, que se lanza en versión preliminar, y que utiliza un agente para guiar a los desarrolladores por el proceso de personalización del modelo; o un enfoque autodirigido para quienes prefieren llevar las riendas. Con la experiencia agéntica, los desarrolladores describen lo que necesitan en lenguaje natural y el agente recorre todo el proceso de personalización, desde la generación de datos sintéticos hasta la evaluación. Los desarrolladores que buscan control granular y flexibilidad pueden elegir la experiencia autodirigida, que elimina la gestión de infraestructura a la vez que proporciona las herramientas adecuadas para seleccionar la técnica de personalización y ajustar los parámetros.

Con ambas opciones, los desarrolladores pueden acceder a técnicas avanzadas de personalización como Aprendizaje por Refuerzo a partir de feedback de IA, Aprendizaje por Refuerzo con Recompensas Verificables, ajuste fino supervisado y Optimización Directa de Preferencias. Las nuevas capacidades de SageMaker AI funcionarán con Amazon Nova y con modelos de pesos abiertos populares como Amazon Nova, Llama, Qwen, DeepSeek y GPT-OSS, ofreciendo a los clientes una amplia gama de opciones para ajustar el modelo adecuado a su caso de uso.

Robin AI y Vody son solo algunos de los clientes que ya han empezado a simplificar la personalización de modelos con las nuevas capacidades de SageMaker AI. Collinear AI, una plataforma de mejora de IA creada para la IA generativa empresarial, ahorró semanas utilizando SageMaker AI. Soumyadeep Bakshi, cofundador de Collinear AI, declaró que "el ajuste específico de modelos de IA es fundamental para crear simulaciones de alta fidelidad, y antes requería integrar distintos sistemas para entrenamiento, evaluación y despliegue. Ahora, con la nueva capacidad de personalización de modelos sin servidor de Amazon SageMaker AI, disponemos de una vía unificada que nos permite reducir nuestros ciclos de experimentación de semanas a días. Estas herramientas sin servidor de extremo a extremo nos ayudan a centrarnos en lo que importa: crear mejores datos de entrenamiento y simulaciones para nuestros clientes, no mantener infraestructura ni lidiar con plataformas dispares".