Con esta herramienta, los usuarios podrán analizar y entender videos, gráficos y documentos, así como generar contenido multimedia. La plataforma ya está disponible a través de AWS (Amazon web Services).
La compañía de comercio electrónico estadounidense, Amazon, acaba de presentar su nueva de inteligencia artificial llamada Nova. De acuerdo con la plataforma, esta herramienta tendrá la capacidad de analizar y entender videos, gráficos y documentos, así como generar contenido multimedia.
Amazon resalta que su principal objetivo es utilizar la inteligencia artificial para simplificar la vida de los compradores, vendedores, anunciantes, empresas y todos los que se encuentran entre ellos.
«En Amazon, tenemos cerca de 1000 aplicaciones Gen AI en funcionamiento y hemos tenido una visión general de lo que los desarrolladores de aplicaciones aún están afrontando. Nuestros nuevos modelos Amazon Nova están pensados para ayudar a los desarrolladores internos y externos a afrontar estos desafíos, y proporcionar una inteligencia y una generación de contenido convincentes, al mismo tiempo que ofrecen un progreso significativo en latencia, rentabilidad, personalización, fundamentación de la información y capacidades de agente”, comentó Rohit Prasad, vicepresidente sénior de Inteligencia Artificial General de Amazon.
Los nuevos modelos de Amazon Nova disponibles en Amazon Bedrock incluyen:
- Amazon Nova Micro: un modelo de solo texto que ofrece respuestas de menor latencia a un costo muy bajo.
- Amazon Nova Lite: un modelo multimodal de muy bajo costo que es increíblemente rápido para procesar entradas de imágenes, videos y textos.
- Amazon Nova Pro: un modelo multimodal de gran capacidad con la mejor combinación de precisión, velocidad y costo para una amplia gama de tareas.
- Amazon Nova Premier: el modelo multimodal más capaz de Amazon para tareas de razonamiento complejas y para usarse como el mejor profesor para desarrollar modelos personalizados (disponible en el primer trimestre de 2025).
- Amazon Nova Canvas: un modelo de generación de imágenes de última generación.
- Amazon Nova Reel: un modelo de generación de vídeo de última generación.
«Todos los modelos de Amazon Nova son increíblemente capaces, rápidos, rentables y se han diseñado para que resulten fáciles de usar con los sistemas y los datos de un cliente. Admiten una amplia gama de tareas en 200 idiomas y múltiples modalidades. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro son al menos un 75 por ciento más económicos que los modelos con mejor rendimiento en sus respectivas clases de inteligencia en Amazon Bedrock. También son los modelos más rápidos en sus respectivas clases de inteligencia en Amazon Bedrock», escribió Amazon en su blog.
¿Cómo estos modelos beneficiarán a los usuarios?
De acuerdo con Amazon, estos modelos están integrados con Amazon Bedrock, un servicio totalmente administrado que permite utilizar modelos de gestión de alto rendimiento de las principales empresas de inteligencia artificial y de Amazon a través de una única API. «Con Amazon Bedrock, los clientes pueden experimentar y evaluar fácilmente los modelos de Amazon Nova, así como otros modelos de gestión de alto rendimiento, para determinar el mejor modelo para una aplicación», dijo.
Los modelos también admiten un ajuste personalizado, que permite a los clientes indicarles ejemplos de sus propios datos que han sido etiquetados para aumentar la precisión. El modelo de Amazon Nova aprende lo que más le importa al cliente a partir de sus propios datos (incluidos texto, imágenes y videos) y, luego, Amazon Bedrock entrena un modelo personalizado que proporcionará respuestas personalizadas.
Además de respaldar el ajuste fino, los modelos también admiten la destilación, que permite la transferencia de conocimiento específico desde un “modelo docente” más grande y altamente capaz a un modelo más pequeño y más eficiente que es altamente preciso, pero también más rápido y más económico de ejecutar.
Los modelos de Amazon Nova están integrados con las bases de conocimiento de Amazon Bedrock y se destacan en Retrieval Augmented Generation (RAG), lo que permite a los clientes garantizar la mejor precisión al basar las respuestas en los propios datos de la organización. Asimismo, se han optimizado para que sean fáciles de usar y efectivos en aplicaciones de agentes que requieren interactuar con los sistemas y datos propietarios de una organización a través de múltiples API para ejecutar tareas de varios pasos.
Comprensión del video
Para poner a prueba las capacidades de comprensión de video de Amazon Nova Pro, se le pidió al modelo que revisara y describiera un breve videoclip mudo de un partido de fútbol.
Los resultados incluyen detalles sobre el escenario del juego, los uniformes del equipo, descripciones de las acciones que realizan los jugadores y cómo culmina la jugada.