Demostraciones de robótica exageradas con el fin de obtener beneficios

Usuarios del Club TRPlane

Para ver este contenido, es necesario estar registrado. Haz clic en el botón para ver todos los planes.

A medida que los videos de robots se vuelven más virales, es importante desarrollar un ojo crítico.

En marzo de 2008, un robotista vestido con ropa de invierno le dio a Big Dog una gran patada para la cámara. El robot financiado por DARPA tropezó, pero rápidamente recuperó el equilibrio en medio del estacionamiento. “POR FAVOR, NO PATEÉS EL PROTOTIPO CAMINANTE MECÁNICO DE LA MUERTE”, indica un comentario al video. “LO RECORDARÁ”.

Fuente: Youtube

“Espeluznante como el infierno”, decía otro. «Imagínate si un día estuvieras dando un paseo por el bosque y vieras esa cosa viniendo hacia ti». Los blogs de gadgets y las cuentas de redes sociales arrojaron palabras como “aterrador” y “robopocalipsis”, en aquellos días antes de que Black Mirror le diera al mundo una abreviatura aún más directa. Boston Dynamics obtuvo una gran viralidad. El vídeo actualmente tiene 17 millones de visitas. Fue el primero de innumerables éxitos virales que continúan hasta el día de hoy.

Es difícil exagerar el papel que esa viralidad ha desempeñado en el posterior desarrollo de Boston Dynamics hasta convertirse en una de las empresas de robótica más fácilmente identificables del mundo. Big Dog y sus descendientes como Spot y Atlas han sido celebrados, demonizados, parodiados e incluso aparecieron en un anuncio de cerveza de Sam Adams. Además de desarrollar algunos de los mecatrónicos más avanzados del mundo, el equipo de Boston Dynamics ha demostrado ser especialistas en marketing extremadamente inteligentes.

Hay mucho que decir sobre el papel que han desempeñado estos vídeos en la difusión del evangelio de la robótica.

Parece probable que vídeos como este hayan inspirado las carreras de innumerables robóticos que actualmente están prosperando en este campo. Es un modelo que innumerables nuevas empresas posteriores han adoptado con un amplio éxito. Boston Dynamics por supuesto no puede ser considerado responsable de ninguno de los atajos que podrían haber tomado algunas de esas empresas.

En las últimas décadas, los videos virales de robots han pasado de ser objetos de curiosidad entre los tecnorati a éxitos que acaparan los titulares filtrados a través de TikTok y YouTube. A medida que las recompensas potenciales han aumentado, también lo ha hecho el deseo de «suavizar» los límites. Para complicar aún más las cosas está el estado del CGI, que se ha vuelto indistinguible de la realidad para muchos espectadores. El sesgo de confirmación, la atracción por la novedad y la falta de experiencia técnica desempeñan un papel clave en nuestra tendencia a creer en noticias y vídeos falsos o, como mínimo, exagerados.

Tecnorati, aquellos que tienen habilidades o conocimientos sobre tecnología.

Computer-generated imagery (CGI) Imágenes Generadas por Computadora, creación de contenido visual fijo o animado utilizando software de imágenes.

Se puede disculpar al espectador promedio de TikTok, por ejemplo, por no comprender las complejidades de la generalización. Muchos expertos en robótica han echado más leña al fuego (tal vez sin querer) al dar a entender que los sistemas que vemos en los vídeos son de “propósito general”. Tal vez sea multipropósito, pero todavía estamos lejos de que los robots puedan realizar cualquier tarea sin verse obstaculizada por las limitaciones del hardware.

La mayoría de las veces, los vídeos que se muestran son producto de meses o años de trabajo. En algún lugar del disco duro se encuentran las horas de vídeo que no llegaron a la versión final, en las que se ve a un robot tropezando, farfullando o deteniéndose en seco. No es sorprendente que pocos acepten compartir esas pruebas con el público. Cabe pensar que gran parte se debe a cómo la gente percibe dicha información. En la robótica, las horas y días de prueba y fracaso son una indicación de lo duro que se ha trabajado para llegar al producto final. Sin embargo, entre el público en general estos fallos de los robots pueden ser vistos como un fallo por parte de los propios robóticos.

Para ser justos, por ejemplo, es de elogiar a Boston Dynamics por el “blooper reel” que publicaron en el que Atlas perdía el equilibrio y caía entre movimientos exitosos de parkour. Como de costumbre, terminaron en la sala de montaje muchas más películas de las que llegaron al corte final. Incluso cuando no se trata de robots, así son las cosas.

Junto con CG/renders, la edición creativa es solo una de las muchas formas potenciales de mejorar una demostración de robótica. La mayoría de las veces, la intención no es maliciosa. Es un sentimiento que es fácilmente comprensible por ejemplo por los músicos, que una vez que una canción se lanza, ya no se tiene control sobre ella. Es lo mismo que puede ocurrir con un vídeo sobre robótica. Se toman decisiones para ajustar las cosas y endulzar la presentación. Son una parte esencial a la hora de crear vídeos consumibles online. Sin embargo, especialmente en la era de TikTok, el contexto es la primera víctima.

No existe un libro de reglas sobre la información que se debe incluir en una demostración de robótica. Sin embargo, cuanto más se piensa en ello, más surge se fortalece la idea de que debería haber, al menos, algunas directrices bien definidas.

Justo antes del CES, una publicación de LinkedIn llamó la atención de gran parte de la comunidad de robótica. Fue escrito por Brad Porter, fundador y director ejecutivo de Collaborative Robotics, que anteriormente dirigió los esfuerzos de robótica industrial de Amazon.

En el artículo, Porter señala que CES probablemente estaría plagado de interesantes demostraciones de robótica (efectivamente), pero agrega que “también hay muchos videos increíbles con trucos en circulación. Separar la realidad del arte escénico es difícil”. El ejecutivo no estaba insinuando nada del bagaje negativo que una palabra como “arte escénico” podría tener en este contexto. En cambio, simplemente estaba sugiriendo que los espectadores debían abordar esos videos con un ojo perspicaz y, tal vez, escéptico.

Prestando atención a los videos

Porter identifica cinco puntos diferentes de atención para detectar la veracidad de uno de estos videos.

El primero es el «stop-motion». Esto se refiere a una sucesión de ediciones rápidas que hacen que parezca que el robot se mueve de una manera que es incapaz de hacer en la vida real.

«Si ves un vídeo de robótica con muchos saltos de fotogramas o cortes de cámara, ten cuidado», escribe. «Notarás que los videos de Boston Dynamics a menudo tienen un solo corte sin cortes de cámara, eso es impresionante».

El segundo es la simulación. Esto es, en la práctica, el ejemplo CG mencionado anteriormente. La simulación se ha convertido en una herramienta fundamental en el despliegue robótico. Permite a las personas ejecutar miles de escenarios simultáneamente en segundos. Junto con otros gráficos por ordenador, la simulación robótica se ha vuelto cada vez más fotorrealista en los últimos años. Crear y compartir una simulación realista no es un problema en sí mismo. El problema, más bien, surge cuando se hacen pasar esas cosas por realidad.

El número tres tiene un nombre divertido. Las demostraciones del Mago de Oz se llaman así debido al trabajo pesado que realiza la persona trás de la cortina. Porter cita como ejemplo la demostración de Mobile ALOHA de Stanford. Creo firmemente que no hubo malicia en la decisión de ejecutar la demostración (aún extremadamente impresionante) a través de un teleoperador robótico fuera de la pantalla. De hecho, el «operador de robots», Tony Zhao, aparece tanto en el vídeo como en los créditos finales.

Desafortunadamente, la aparición ocurre dos minutos y medio después de una demostración de tres minutos y medio. Hoy en día, sin embargo, debemos asumir que:

En realidad, ya nadie tiene la capacidad de atención para sentarse a ver dos minutos y medio de increíbles imágenes de robots.
Esto va a ser dividido y despojado de todo contexto.
El espectador promedio de TikTok X (Twitter) no buscará la fuente del video.

Optimus folds a shirt pic.twitter.com/3F5o3jVLq1
— Elon Musk (@elonmusk) January 15, 2024

Para ver otro ejemplo que llegó poco después de la publicación de Porter, se puede analizar el video en X de Elon Musk del robot humanoide Optimus doblando ropa. El video mostraba el texto «Optimus dobla una camisa». Los espectadores con ojos de águila vieron algo interesante en la esquina inferior derecha: una mano enguantada que ocasionalmente aparecía parcialmente en el marco que coincidía con el movimiento del robot.

Si se encuadra el video de lavandería de Optimus solo unos centímetros más a la izquierda, te habrías perdido lo que parece una mano teleoperadora que controla el Tesla Bot. La teleoperación no tiene nada de malo, por supuesto. Tiene algunas aplicaciones excelentes, que incluyen capacitación, resolución de problemas y ejecución de tareas altamente especializadas como la cirugía. Pero es bueno saber lo que estamos (y lo que no) viendo. Esto me parece un caso obvio en el que el cartel original omite información clave, entendiendo que sus audiencias/fanáticos llenarán los vacíos con lo que creen que están viendo en función de sus sentimientos sobre el mensajero.

Podría ser un error acusar a Musk de ofuscar intencionalmente la verdad en este caso. Veintitrés minutos después del tweet inicial, añadió: “Nota importante: Optimus aún no puede hacer esto de forma autónoma, pero ciertamente podrá hacerlo de forma totalmente autónoma y en un entorno arbitrario (no requerirá una mesa fija con un cuadro que tenga sólo una camisa).”

Como señaló Mark Twain, “una mentira puede viajar al otro lado del mundo mientras la verdad todavía se está poniendo los zapatos”. Se puede aplicar un principio similar al vídeo online. El tweet inicial no es exactamente mentira, por supuesto, pero ciertamente puede catalogarse como una omisión. Es lo del viejo periódico de esconder tus correcciones en la página interior. Mucha gente quedará expuesta al error inicial.

No se puede afirmar si esa omisión inicial fue intencional o no, se puede aplicar el beneficio de la duda y ver el tweet de seguimiento como una aclaración genuina de un contexto incompleto. En este caso específico, la mayoría de las opiniones sobre el tema estarán directamente correlacionadas con los sentimientos personales acerca de su autor.

El siguiente ejemplo de Porter y cuarto punto es el “Aprendizaje por refuerzo con una sola tarea”. Se podría profundizar más en el aprendizaje por refuerzo en esta publicación, pero en aras de la brevedad, se podría decir que es una forma de enseñar a los robots a realizar tareas con prueba y error repetitivos del mundo real.

«Abre una puerta, apila un bloque, gira una manivela», escribe Porter. “Aprender estas tareas es impresionante, se ven impresionantes y son impresionantes. Pero un buen ingeniero de RL (Reinforcement Learning, Aprendizaje Reforzado) puede hacer que esto funcione en un par de meses. Un paso más difícil es hacerlo resistente a diferentes variaciones sutiles. Pero generalizar a múltiples tareas similares es muy difícil. Para poder saber si se puede generalizar, busque múltiples tareas entrenadas”.

Al igual que Teleoperador, el aprendizaje por refuerzo no tiene absolutamente nada negativo. Ambas son herramientas valiosas para entrenar y operar robots. Sólo necesita aclarar el punto lo máximo posible para dar un mensaje completo.

El último y quinto consejo de Porter es monitorear el entorno y las posibles omisiones. Cita el vídeo reciente del humanoide Figure preparando café. «El fluido, de un solo corte, muestra solidez ante los modos de fallo», escribe. “Sigue siendo una sola tarea, por lo que las afirmaciones sobre el momento ChatGPT de la robótica no se evidencian aquí. La calidad de la producción es excelente. Pero notarás que el robot no levanta nada más pesado que una taza Keurig. Se han recogido tazas, pero no lo demuestran. ¿Quizás el robot no tiene esa fuerza?»

Estas observaciones no restan valor a lo que es una tecnología realmente impresionante. El problema, sin embargo, es que nuestro cerebro tiende a llenar vacíos. Humanizamos a los robots y asumimos que aprenden de la misma manera que nosotros, cuando en realidad, ver a un robot abrir una puerta no garantiza en absoluto que pueda abrir otra, o incluso la misma puerta bajo una iluminación diferente. Los televisores y las películas también nos han generado expectativas poco realistas sobre lo que los robots pueden (y no pueden) hacer en 2024.

Un último punto que no apareció en la publicación es la velocidad. La tecnología puede ser tremendamente lenta a veces, por lo que es común acelerar las cosas. En su mayor parte, las universidades y otros centros de investigación hacen un buen trabajo al señalar esto mediante una superposición de texto. Esta es la manera de hacerlo. Agregue la información pertinente en la pantalla de una manera que sea difícil de recortar para un influencer hambriento de clics. De hecho, este fenómeno es el motivo por el que 1X obtuvo su nombre.

Un vídeo reciente de la empresa que muestra su uso de redes neuronales llama la atención sobre este hecho. «Este vídeo no contiene teleoperación, ni gráficos por ordenador, ni cortes, ni aceleraciones de vídeo, ni reproducción de trayectoria guionizada», explica la empresa. «Todo está controlado a través de redes neuronales». El resultado es un vídeo de tres minutos que puede parecer casi dolorosamente lento en comparación con otras demostraciones humanoides.

Al igual que con los vídeos de errores, aplaudo esta y cualquier otra forma de transparencia. Para los robots que se mueven realmente lentamente, no hay nada de malo en acelerar las cosas, siempre y cuando se cumpla la reglas de decirlo claramente.

Al igual que el compositor, las empresas deben reconocer que no se puede controlar lo que le sucede a un vídeo una vez que pertenece al mundo. Pero hay que preguntarse: ¿Se ha hecho todo lo que estuvo al alcance para detener la propagación de posibles falsificaciones?

Probablemente sea demasiado esperar que dichos vídeos se rijan por la misma verdad en la legislación publicitaria que rige la publicidad televisiva. Sin embargo, sería de agradecer ver que un grupo de expertos en robótica unen fuerzas para estandarizar cómo pueden y deben funcionar dichas divulgaciones.

Busque su consulta

Enlaces útiles

Tecnológicas:

Categorías

Enlaces útiles

Demostraciones de robótica exageradas con el fin de obtener beneficios

Usuarios del Club TRPlane

Prestando atención a los videos

El impacto de la IA: ¿está desapareciendo el primer peldaño de la escalera profesional?

El Futuro de la Inversión de Capital Riesgo en la Tecnología Climática

Navin Chaddha de Mayfield: por qué la IA se comerá el mercado de la consultoría

Klarna y Bolt se asocian para integrar sus sistemas de pago en un movimiento estratégico

Fervo Energy capta 206 millones para la mayor planta de geotermia mejorada en Utah

Creative Commons presenta CC Signals, un marco para un ecosistema de IA abierto

El impacto de la IA: ¿está desapareciendo el primer peldaño de la escalera profesional?

Categorías

Enlaces útiles

¿Listo para suscribirte?

Enlaces útiles

Categorías

Enlaces útiles

Demostraciones de robótica exageradas con el fin de obtener beneficios

Usuarios del Club TRPlane

Prestando atención a los videos

El impacto de la IA: ¿está desapareciendo el primer peldaño de la escalera profesional?

El Futuro de la Inversión de Capital Riesgo en la Tecnología Climática

Navin Chaddha de Mayfield: por qué la IA se comerá el mercado de la consultoría

Klarna y Bolt se asocian para integrar sus sistemas de pago en un movimiento estratégico

Fervo Energy capta 206 millones para la mayor planta de geotermia mejorada en Utah

Creative Commons presenta CC Signals, un marco para un ecosistema de IA abierto

El impacto de la IA: ¿está desapareciendo el primer peldaño de la escalera profesional?

.tdi_195{margin-bottom:10px!important} .tdi_195{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_195{font-size:16px!important}}Categorías

.tdi_199{margin-bottom:10px!important} .tdi_199{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_199{font-size:16px!important}}Enlaces útiles

.tdi_202{margin-bottom:10px!important} .tdi_202{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_202{font-size:16px!important}}¿Listo para suscribirte?

Categorías

Enlaces útiles

¿Listo para suscribirte?