Newsletter

¡Hola!

bardgeneraimagen2
c

La multimodalidad en Inteligencia Artificial da un nuevo paso: Google anunció que Bard puede crear imágenes realistas y amplía su alcance para todos

Pablo Wahnon Editor de Innovación

La inclusión de generación de imágenes era una de las características más esperadas. El sueño de convertirse en un artista para darle un mensaje al mundo nunca estuvo más cerca.

3 Febrero de 2024 16.10

Google anunció que Bard ya puede crear imágenes fotorrealistas de alta calidad en base a simples indicaciones escritas por el usuario y así hacer realidad cualquier idea. Además, presentaron nuevas actualizaciones para mejorar la capacidad de la herramienta: desde corroborar respuestas arrojadas en conversaciones y la disponibilidad de Gemini Pro en todos los idiomas.

La nueva funcionalidad de creación de imágenes se lanzó primero para usuarios de Estados Unidos. Por ese motivo para utilizarla desde otros países lo aconsejable es instalarse una VPN que ayuda a mostrar a mostrar que la computadora está localizada como si estuviese en norteamérica.

El sueño de Yoko Ono está disponible para cualquier persona
Cuando se fundó el arte conceptual se buscó darle un impulso a la democratización de las ideas: Para los fundadores de ese movimiento cualquier persona tiene algo único para decirle al mundo por mas que no sepa dibujar o componer música. Por eso realizaron obras de arte donde lo principal era mostrar un concepto no una habilidad artística. La obra de Yoko Ono lo muestra cabalmente. Por ejemplo, su obra de un tablero de ajedrez con piezas blancas de ambos lados.

Cualquiera puede comprar dos tableros de ajedrez para armar uno nuevo sólo de piezas blancas. Lo importante era el mensaje que transmitía esa obra: ¿Quién te pinta para que se cree el enfrentamiento de las blancas contra las negras?

La IA Generativa esta avanzando en el sentido de que lo importante pasan a ser los conceptos. Si tenemos la idea la IA nos ayudará a realizarlo. Pero para eso requieren Inteligencias Artificiales que entren en lo que se llama multimodalidad. Esto es que puedan trabajar con diversas fuentes de datos sean texto, imágenes o audio. Ahora en Google anunciaron que Bard podrá generar una amplia variedad de imágenes personalizadas a partir de una breve descripción. Por ejemplo, se le podrá pedir que arme una imagen de un tablero de ajedrez, y ofrecerá varios resultados fotorrealistas de alta calidad entre las cuales se puede elegir la que mejor se adecúe a lo imaginado.

La nueva funcionalidad surge con la integración de la tecnología de procesamiento de texto a imagen más avanzada de la compañía “Imagen 2”, que permite a todas las personas repensar la forma de hacer las cosas y recibir ayuda creativa con Bard. Estará disponible en inglés en la mayoría de los países y territorios donde ya funciona la herramienta.

Para ayudar a todas las personas a diferenciar las imágenes originales de las generadas con Inteligencia Artificial, Bard emplea SynthID, una herramienta desarrollada por Google DeepMind, que agrega una marca de agua imperceptible directamente en los píxeles de las nuevas imágenes. De esta forma se comienza a trabajar en una de los temas que más preocupa a la industria: cómo diferenciar objetos digitales realizados con IA.

IA generativa con Bard — Diferentes estilos de imágenes creadas con Bard

Combate a la información falsa
Les guste a los usuarios o no, lo cierto es que en el mar digital cada vez es mas complejo darse cuenta de si la información es falsa o no. Dentro de esta problemática en Google presentaron una nueva función “Doble verificación” para corroborar todas las respuestas que Bard ofrezca, que estará disponible en más de 40 idiomas y 230 países y territorios. ¿Cómo podrá utilizarse? Al iniciar una conversación, debajo de la respuesta aparecerá el ícono “G” que permitirá Buscar en Google las respuestas generadas por Bard y profundizar en esa información, así como identificar distintas fuentes que validen dichos datos. También se podrá hacer clic en frases resaltadas para obtener información que respalde o contradiga lo que responde.

Llegó Gemini Pro en todos los idiomas

A finales del 2023, la compañía anunció la integración de Gemini Pro a Bard en inglés, con el objetivo de potenciar las habilidades de comprensión, razonamiento, resumen y codificación de la herramienta. Ahora, el modelo de lenguaje multimodal más avanzado hasta el momento estará disponible en todos los idiomas (incluido el español 🥳).

Recientemente, uno de los principales líderes de modelos lingüísticos y asistentes de IA en todos los idiomas: la Organización de grandes sistemas de modelo (sus siglas en inglés, LMSYS), realizó una tabla de posiciones que clasifica modelos de IA según su rendimiento. Bard con Gemini Pro ocupó el segundo puesto en el ranking, además se reveló que la herramienta está evolucionando a pasos agigantados gracias a las constantes mejoras.

Si bien Gemini Pro es para un uso profesional cabe recordar que Bard es una herramienta gratuita, accesible globalmente y útil para todo tipo de proyecto, desde ayuda con tareas cotidianas hasta grandes proyectos.

Más noticias

El nuevo mapa del talento: las 20 universidades que ganan terreno en plena revolución de la IA

La nueva versión de ChatGPT en pausa: Gobierno de EE.UU. teme por la ciberseguridad del país

"La memoria es el nuevo activo estratégico de la IA": qué revelan los resultados récord de Micron sobre el futuro del sector

Qualcomm redobla su apuesta por la IA: compra Modular por casi US$ 4.000 millones y desafía el imperio de Nvidia

La multimodalidad en Inteligencia Artificial da un nuevo paso: Google anunció que Bard puede crear imágenes realistas y amplía su alcance para todos

La inclusión de generación de imágenes era una de las características más esperadas. El sueño de convertirse en un artista para darle un mensaje al mundo nunca estuvo más cerca.

Tags

Recuperó una fábrica de aviones y ahora va por la movilidad aérea urbana: busca masificar los drones tripulados por menos de US$ 120.000

Marriott apuesta a la reconversión del Microcentro: invierten US$ 30 millones en un nuevo hotel

Después de quedarse con la Hidrovía, Jan De Nul va por otro negocio clave de la logística argentina

El rey del oro: multiplicó su fortuna con una inversión en Argentina, sus reservas superan a las del BCRA y ya es más rico que Paolo Rocca

Costantini reactiva en Catalinas su ambicioso proyecto de oficinas de US$ 400 millones

América Latina vuelve a pisar fuerte en Cannes: un nuevo hub estratégico consolida el liderazgo creativo y comercial de la región

El CEO de Loma Negra, con Forbes: los 100 años de la empresa, el ingreso de Mindlin y la visión para 2026

Más noticias

El nuevo mapa del talento: las 20 universidades que ganan terreno en plena revolución de la IA

La nueva versión de ChatGPT en pausa: Gobierno de EE.UU. teme por la ciberseguridad del país

"La memoria es el nuevo activo estratégico de la IA": qué revelan los resultados récord de Micron sobre el futuro del sector

Qualcomm redobla su apuesta por la IA: compra Modular por casi US$ 4.000 millones y desafía el imperio de Nvidia

El acuerdo entre Getty y OpenAI: ¿por qué entusiasma a Wall Street, pero alarma a 600.000 fotógrafos?

La startup que trata enfermedades crónicas con IA y ya vale US$1200 millones

Robots humanoides: 18 empresas compiten por crear la próxima gran innovación en IA

Anthropic se prepara para la batalla de la IA: acordó con Micron el abastecimiento de piezas claves

Una membresía. Posibilidades ilimitadas.

La multimodalidad en Inteligencia Artificial da un nuevo paso: Google anunció que Bard puede crear imágenes realistas y amplía su alcance para todos

La inclusión de generación de imágenes era una de las características más esperadas. El sueño de convertirse en un artista para darle un mensaje al mundo nunca estuvo más cerca.

Tags

Más noticias

Iniciá sesión en Forbes

Crear una cuenta

Iniciar sesión