La cuna de Windows acaba de presentar a MAI-Image-1, su primer generador de imágenes con IA desarrollado internamente, en forma integral. La IA de Microsoft, genera imágenes a partir de una entrada de texto. Este modelo ha sido desarrollado completamente por Microsoft AI y ya se posiciona entre los 10 mejores, según los puntajes en LMArena.
Si bien, Microsoft es uno de los gigantes de la tecnología que pisa con fuerza en el negocio de la Inteligencia Artificial. Sin embargo, hasta ahora, lo ha hecho mayormente de la mano de OpenAI, la organización que desarrolla ChatGPT, ya que el asistente Copilot se basa en los modelos de aquel grupo.
Un detalle: hasta el momento en el que se lance, para crear contenido visual en Copilot hay que echar mano a la misma tecnología que usa OpenAI.
Según remarcó la empresa, el nuevo generador es especialmente eficiente para crear resultados fotorrealistas. De hecho, las imágenes que compartió tienen esa característica, permite trabajar con dibujos.

Para desprevenidos, estos generadores potenciados con IA funcionan del siguiente modo: el usuario escribe una indicación —“prompt”, en la jerga— para que el modelo convierta el pedido en una imagen. Por ejemplo, la siguiente fotografía no fue tomada en el mundo real: fue creada con MAI-Image-1. El prompt podría ser: “Un varón joven, vestido con saco y con zapatillas, caminando en una ciudad durante el atardecer”.
De acuerdo a Microsoft, MAI-Image-1 destaca en ciertas variables visuales como la iluminación y la creación de paisajes. “Es especialmente mejor en comparación con muchos modelos más grandes y lentos. Su combinación de velocidad y calidad permite a los usuarios plasmar sus ideas en pantalla más rápido, iterar sobre ellas con rapidez y luego transferir su trabajo a otras herramientas para seguir puliéndolo”, señalaron.
El gigante tecnologico planea implementar su nuevo generador en Copilot y también en Bing. Eso ocurrirá “muy pronto”, según la empresa estadounidense.
Mientras tanto, el generador está disponible en LMArena, una plataforma web pública en la que se evalúan modelos de lenguaje masivos, en una suerte de ámbito de colaboración colectivo para el desarrollo de IA.

