Así es la Inteligencia Artificial de Meta que facilita el análisis de fotos

Editar fotos, analizar grabaciones de vigilancia y comprender las partes de una célula. Estas tareas tienen algo en común: para hacerlo, hay que ser capaz de identificar y separar los distintos objetos de una imagen. Tradicionalmente, los investigadores tuvieron que empezar de cero cada vez que querían analizar una nueva parte de una imagen. Meta pretende cambiar este laborioso proceso convirtiéndose en la ventanilla única para investigadores y desarrolladores web que trabajan en este tipo de problemas.

El miércoles, la empresa presentó un modelo de IA, llamado "Segment Anything Model" o "SAM", mediante el cual los usuarios pueden crear "recortes" o segmentos de cualquier elemento de una imagen haciendo clic en un punto o dibujando un recuadro alrededor del objeto. La herramienta puede utilizarse con fines de investigación, para la edición creativa o incluso para dar sentido a los objetos mientras se llevan puestos unos auriculares de realidad virtual, ya que hace más rápido y eficaz recortar distintas partes de una imagen.

La tecnológica puso a disposición del público la herramienta y también abrió su modelo de visión por computadora, que afirma haber entrenado con "el mayor conjunto de datos de segmentación", compuesto por 1.100 millones de máscaras de segmentación (las "máscaras" son las distintas partes de una imagen) y 11 millones de imágenes cedidas por una gran empresa fotográfica. Meta no ha revelado de qué empresa ha obtenido la licencia de las imágenes.

El trabajo de Meta AI

Meta AI, la rama de investigación en inteligencia artificial del gigante de las redes sociales, trabajó con 130 anotadores humanos con sede en Kenia para crear el conjunto de datos, que se hizo mediante una combinación de etiquetado manual y automático de mil millones de partes de millones de imágenes.

Segment Anything Model, Meta, Meta AI, Inteligencia Artificial

Las tecnologías de reconocimiento de objetos y visión por ordenador existen desde hace años y ya están integradas en diversos dispositivos, como cámaras de vigilancia y drones. Las tiendas de Amazon, por ejemplo, utilizan el reconocimiento de objetos para detectar los artículos que se introducen en la cesta y los vehículos autónomos lo emplean para percibir su entorno. Startups contemporáneas como Runway e incumbentes como Adobe comercializaron su capacidad de utilizar la IA para detectar y seleccionar diferentes objetos dentro de una imagen para sus usuarios creativos.

A medida que surgieron ingeniosos chatbots generativos de IA, el objetivo de los investigadores de Meta era fusionar los avances en los modelos fundacionales de la IA con el ámbito latente de las tecnologías de visión por computadora.

Mira también

ChatGPT prometió "reforzar la transparencia" tras ser bloqueado en Italia

Videos instantáneos: Crean tecnología con Inteligencia Artificial que permitirá a los usuarios generar videos con sólo teclear

"Yo no diría que se trata de una nueva tecnología. La segmentación de objetos ya existe, así que no diría que se trata de una nueva capacidad. Fundamentalmente, creo que su planteamiento de utilizar modelos fundacionales es nuevo y el tamaño del conjunto de datos sobre el que se entrenan podría ser novedoso", afirma Paul Powers, CEO y fundador de Physna, un motor de búsqueda de objetos en 3D.

Mira también

Bloomberg prepara el lanzamiento de su ChatGPT para finanzas: Qué se sabe al respecto

El avance de la tecnología y la carrera por ver quién es más inteligente

Pero lo que Meta espera es que, al dar a conocer estas herramientas más ampliamente, anime a los usuarios a basarse en su modelo generalizado para casos de uso más específicos en campos como la biología y la agricultura.

El anuncio se produce al mismo tiempo que Meta planea utilizar la IA generativa para anuncios en Instagram y Facebook. A finales de febrero, Mark Zuckerberg, CEO de la compañía, anunció que iba a crear un nuevo equipo de productos centrado exclusivamente en la creación de herramientas de IA generativa, como personajes artificiales, filtros de Instagram y funciones de chat en WhatsApp e Instagram. Al parecer, Zuckerberg pasa la mayor parte de su tiempo con el nuevo equipo de IA.

Más detalles sobre la herramienta SAM de Meta

La herramienta SAM está pensada para quienes no tienen la infraestructura de IA o la capacidad de datos para crear sus propios modelos para "segmentar" o identificar los distintos componentes de una imagen, explican los investigadores de Meta AI, Alexander Kirillov y Nikhila Ravi. "Esto ocurre en tiempo real en el navegador, lo que hace que este modelo sea mucho más accesible para mucha más gente, ya que no necesitan ejecutar un montón de cosas en la GPU... Podemos facilitar muchos más casos de uso que otros métodos no permitirían", afirma Ravi.

Pero un modelo de visión por ordenador entrenado en una base de datos de imágenes bidimensionales tiene sus limitaciones, afirma Powers. Por ejemplo, para que la herramienta detecte y seleccione un mando colocado al revés, tendría que entrenarse con distintas orientaciones del mismo objeto. Los modelos entrenados en imágenes bidimensionales no ayudarán a detectar imágenes parcialmente cubiertas o parcialmente expuestas, afirma.

Esto significa que no identificaría con precisión objetos no estandarizados a través de unos auriculares AR/VR o que no detectaría objetos parcialmente cubiertos en espacios públicos si los utilizara un fabricante de vehículos autónomos.

Para la empresa, que cambió su marca de Facebook a Meta a finales de 2021 y firmó su compromiso con el Metaverso, el uso más obvio para esta herramienta de detección de objetos es en sus espacios de realidad virtual, como su juego de realidad virtual en línea Horizon Worlds. Kirillov y Ravi afirman que su herramienta de detección de objetos puede utilizarse para la detección "basada en la mirada" de objetos a través de auriculares de realidad virtual y realidad aumentada.

El modelo puede detectar objetos desconocidos y trabajar en todos los dominios con imágenes submarinas, microscópicas, aéreas y agrícolas. Kirillov dice que se inspiró para crear un modelo generalizado de segmentación de imágenes mientras hablaba con investigadores de doctorado.

“Estaba dando una presentación sobre segmentación a algunos científicos naturales en Berkeley y la gente decía: 'Está bien, claro, todo esto es genial, pero necesito contar e identificar árboles en las fotos que he recopilado para mi investigación sobre incendios en California', y este modelo puede hacer eso por ellos”, dice Kirillov a Forbes.

*Con información de Forbes US sobre Meta Platforms.

Así es la Inteligencia Artificial de Meta que facilita el análisis de fotos

El anuncio se produce cuando el gigante de las redes sociales desvía cada vez más su atención de la creación de un metaverso basado en realidad virtual para incorporar funciones de IA en sus plataformas como Instagram, Facebook, Messenger y WhatsApp.

El trabajo de Meta AI

ChatGPT prometió "reforzar la transparencia" tras ser bloqueado en Italia

Videos instantáneos: Crean tecnología con Inteligencia Artificial que permitirá a los usuarios generar videos con sólo teclear

Bloomberg prepara el lanzamiento de su ChatGPT para finanzas: Qué se sabe al respecto

El avance de la tecnología y la carrera por ver quién es más inteligente

Más detalles sobre la herramienta SAM de Meta

Tags

Luis Galli, CEO de Newsan, habla de consumo, el desafío de P&G y los rumores sobre Carrefour

El negocio de la escasez: por qué los Labubu pasaron de ser un fenómeno a una lección para las marcas

Levantaron US$ 31 millones en dos años y compraron una empresa en México: la historia de la paytech Tapi

Acciones: las dos empresas argentinas que el mercado ve como una "apuesta fuerte" en medio de la reactivación

Desarrollaron una startup que transforma el desperdicio alimentario en una oportunidad rentable y Amazon invirtió en ellos

Más noticias

¿Tu trabajo y la IA te generan ansiedad? 21 preguntas para saberlo, según un psicólogo

Neuroplasticidad en la era del GPS y la IA: el riesgo de delegar ante la pereza metacognitiva de ChatGPT

Lo que revela GPT-5 sobre el deseo, la conciencia y el futuro de la inteligencia artificial humana

Geoffrey Hinton: "Es muy dificil que la IA quiera obedecer a niños de 3 años, y así es como nos verán a nosotros"

Perplexity sorprende al mercado con una millonaria oferta por Google Chrome

La startup que quiere recrear una célula con IA y que acaba de recibir US$ 30 millones para revolucionar la lucha contra el cáncer

La conmoción que provocó la despedida de GPT-4o y cómo una ola de reclamos logró que OpenAI diera marcha atrás

Por qué GPT-5 no es solo una versión mejorada y qué significa para la batalla por la supremacía tecnológica