¿Qué está ocurriendo en esta foto? A menudo la respuesta es obvia y basta con mirar la imagen, pero lograr que una máquina describa eso mismo es mucho más complicado de lo que parece.
Google ha logrado desarrollar un sistema que a través de TensorFlow puede generar esos pies de foto, y ahora ese sistema se ha publicado bajo licencia Open Source, lo que significa que si tienes la tarea de describir un buen conjunto de imágenes, podrás hacer uso de este desarrollo de forma libre.
Más preciso, más rápido, y ahora además Open Source
La tecnología del llamado Brain Team de Google es realmente notable y según sus responsables es capaz de ofrecer un 93,9% de precisión en ese proyecto llamado "Show and Tell" que hace que el motor de inteligencia artificial indique en un pequeño texto lo que ocurre en la foto.

Para lograr esa precisión se ha tenido que entrenar al algoritmo con pies de foto creados por nosotros, algo que entre otras cosas ha permitido que las descripciones sean frases bien construidas y no solo combinaciones de nombres de objetos.
El sistema es ahora mucho más rápido: antes entrenar con cada imagen requería tres segundos usando una GPU NVIDIA G20, pero en esta nueva edición liberada al Open Source ese tiempo se reduce a 0,7 segundos. Las aplicaciones prácticas son numerosas, pero hay una que es especialmente llamativa: hacer la web más accesible para todos los que no pueden ver pero sí "oír" esos contenidos. Ahora también sabrán lo que ocurre en las imágenes que se incluyen en dichos contenidos.
Más información | Google
En Xataka | Deep Learning: qué es y por qué va a ser una tecnología clave en el futuro de la inteligencia artificial
Ver 17 comentarios
17 comentarios
whisper5
(quería responder a 'pandoando' pero me he confundido y ahora no puedo cambiarlo)
Efectivamente, ahora Google puede etiquetar las fotografías de todos sus usuarios que guardan fotos en Google Drive y sacar conclusiones: si viajas o no viajas, a qué lugares, tus aficiones, el tipo de familia que tienes, si tienes niños pequeños o no, y un largo etcétera. Con todos eso podrá mostrar publicidad con mayor posibilidad de éxito, que es el negocio de Google.
sensenic
Interesante tecnología, aunque seguro que ya hay quien quiere ponerla a prueba troleando.
Eso si, el ejemplo de los pies de foto me parece un desacierto, siempre me han parecido absurdos los pes de foto que describen la imagen tal cual en su uso periodístico. Si hay un tranvía en una calle, no necesito reiterar esa información, sino algo adicional que no se desprenda, como por ejemplo, el año en que estaba tomada, el autor, si actualmente hay allí lo mismo, si ese tranvía es el implicado en cierto accidente del que se hable en el artículo, etc.
Usuario desactivado
¿Nadie ha pensado que herramientas como ésta son ideales para los anunciantes? Ahora ya no será necesario listar las 'cosas que te gustan' en una red social, sino que estos algoritmos podrán extraer palabras clave de tus fotos, palabras que usarán los anunciantes para mostrar anuncios más certeros.
alons0
Inteligencia artificial esto.....inteligencia artificial lo otro.....
Para que sea inteligencia tiene que comprender. De nada sirve que describa una imagen o que haga un proceso de manera autonoma si la maquina no comprende lo que hace.
No deja der ser un algoritmo mas o menos complejo y, por tanto, con unas pautas fijas y programadas.
Estoy un poquito cansado de ver y leer "inteligencia artificial" en todos lados, cuando en la realidad (y en la practica) estamos lejos de desarrollar una verdadera IA.
Por no hablar de que el concepto de inteligencia es muy basto, extenso, y engloba muchos ambitos de la mente.
Pero claro vende mas hablar en estos términos, sobre todo para empresas como Google, que se dedican a vender servicios y que seguro que le van a sacar partido a este algoritmo.
sanamarcar
Pasar la info de imágenes a texto, es lo ideal para poder sacar información de la misma. Mi cerebro no funciona así pero no es lo normal, no suelo pasar la info visual a texto y después procesarlo, funciona mejor en bruto. Pero creo que no es lo habitual viendo mi entorno. Desventajas soy muy malo manejando hilos sencillos, con lo que seguir una canción o leer me cuesta mas que por ejemplo.
No se el otro dia fui a un museo de ciencias naturales, y aun se me reforzó la sensación una vez mas que la el homo sapiens es la primera especie que se va poner un autodeprecated. El C va a dejar paso al Si, o un C mejorado. No veo nada que haga ser al hombre excepcional respecto a casi nada.