El sensor estrella en lo referente a detección de objetos cuando hablamos de vehículo inteligente suele ser el LiDAR. Este sistema permite determinar distancias mediante emisión láser, ofreciendo asimismo información sobre profundidad en baja resolución. Según Google, el problema de los LiDAR es dicha resolución, que choca con la calidad que obtenemos mediante cámaras al uso. Fusionar lo mejor de los dos mundos puede ser una buena idea.
Lo mejor del LiDAR con lo mejor de una cámara. Google plantea un nuevo marco de detección 3D multimodal bajo el nombre de DeepFusion. Curiosamente es el mismo nombre que usa Apple para la fusión de imágenes en sus iPhone. Este método combina la información del radar LiDAR con la de una cámara estándar, para lograr que la información de entrada esté en alta resolución.
Cómo realizan la fusión. No es sencillo alinear los datos del LiDAR con los de la cámara. Google utiliza dos nuevas técnicas bajo el nombre de InverseAug y LearnableAlign. InverseAug es modelo capaz de fusionar estos datos, obteniendo las coordenadas 3D del LiDAR y uniéndolas, punto por punto, con las coordenadas 2D de la cámara. LearnableAlign es un segundo modelo que mejora la imagen ya obtenida.
Los resultados. Según los datos de Google, su modelo está por encima de los vistos anteriormente. Han evaluado el comportamiento de su DeepFusion dentro del conjunto de datos abiertos de Waymo, demostrando que combinar cámara y LiDAR es más efectivo que apostar solo por la información obtenida por el LiDAR.
Coches autónomos y robots. Este avance es relevante ya que Google será uno de los grandes actores en la carrera del coche autónomo. Plantear el uso conjunto de LiDAR y cámara permitirá, al menos a nivel técnico, mejorar la detección de obstáculos en la vía, señales, peatones y demás.
Las limitaciones. Hasta Tesla rehúsa del uso del LiDAR, ya que montar cámaras es mucho más barato. La aplicación de este modelo está supeditada a que el fabricante realice un importante despliegue de sensores en su vehículo, un punto complejo en tiempos de coches cada vez más caros.
Ver 12 comentarios
12 comentarios
quarth
"Hasta Tesla está empezando a prescindir del LiDAR"
Tesla jamás ha usado LiDAR en sus vehículos.
mitxael
Falta el radar. Si no, con lluvia, te comes un mojón...
silentblock2o
No me digas que estamos ante una disyuntiva VHS/BETA. Un sistema bueno (lidar + cámara) contra un sistema peor (sólo cámaras)
Si aprendemos de la historia, el ganador de la guerra VHS/BETA no fue el mejor o peor sistema, si no el que consiguió mayor cuota licenciando el sistema.
Si Google licencia esto a los fabricantes ganará. Da igual lo que haga Tesla.
p2dzca
Bienvenido sean unos mejores sensores. Ahora bien, debemos tener claro que el actual estancamiento de la conducción autónoma no se debe a la falta de sensores, sino a la limitada inteligencia artificial que tenemos (léase algoritmos).
dani43321
Están a un paso de darse cuenta de que pueden extrapolar información de profundidad del parallax de las cámaras y no necesitar el LiDAR para nada.
El LiDAR es bueno para algoritmos fijos (aspiradoras).
Las cámaras son buenas para redes neuronales (coches).
t_r_a
vamos, que van a meter a un humano dentro