Newsletter DPT Nro. 51
ISSN 2618-236X
Agosto / 2020
Aprendizaje por imitación en robots quirúgicos
Mediante la revisión de videos de cirugía
Un objetivo de larga data en Inteligencia Artificial es el aprendizaje de nuevas habilidades observando la actuación humana. La posibilidad de aprender -por imitación- habilidades de manipulación a partir de videos puede proporcionar una alternativa escalable a las interfaces tradicionales de kinestésica y teleoperación. La generalización de tales habilidades a nuevas situaciones requiere extraer representaciones de observaciones, tales como las relaciones entre objetos y entorno, con prescindencia de la iluminación, el fondo, la posición, los objetos externos y el foco de la cámara.
En el artículo reseñado, investigadores de la Universidad de California en Berkeley presentan Motion2Vec, un algoritmo que aprende -por imitación- representaciones centradas en movimientos manipulatorios con base en muestras de video quirúrgico, al agruparlos en segmentos de acción (submetas y opciones) codificados de manera semi-supervisada. Se muestra el uso de esa modalidad de representación para imitar movimientos de sutura quirúrgica en videos disponibles públicamente. Se evaluó su aplicación para segmentar e imitar los movimientos de sutura quirúrgica en el robot da Vinci de doble brazo a partir de videos disponibles públicamente del conjunto de datos JIGSAWS. Se comparó el enfoque propuesto con varios métodos métricos y secuenciales de última generación, incluida la consistencia del ciclo temporal.
Las principales contribuciones de este artículo son las siguientes: (1) Un nuevo enfoque de aprendizaje de representación espacio-temporal (Motion2Vec) para la alineación de segmentos, submetas u opciones utilizando un pequeño conjunto de observaciones de video con modalidad semi-supervisada, (2) Análisis de rendimiento, con diferentes combinaciones, de enfoques supervisados y no supervisados para extraer segmentos significativos de videos quirúrgicos mediante aprendizaje métrico y secuencial, y (3) Aprendizaje de segmentos de sutura quirúrgica e imitación cinemática de posturas en brazos de robot da Vinci de videos disponibles públicamente del conjunto de datos JIGSAWS.
Concluye señalando que el aprendizaje por imitación proporciona un enfoque prometedor para enseñar nuevas habilidades de manipulación robótica a partir de demostraciones de expertos.
Fuente primaria: “Motion2Vec: Semi-Supervised Representation Learning from Surgical Videos”. Ajay Kumar Tanwani, Pierre Sermanet, Andy Yan, Raghav Anand, Mariano Phielipp, Ken Goldberg. arXiv:2006.00545v1 [cs.RO] 31 May 2020.