Detección de imágenes adversarias basado en capas de Redes Neuronales Bayesianas
Cargando...
Archivos
Fecha
Autores
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
Aunque las Redes Neuronales Profundas (DNNs) han demostrado repetidamente un rendimiento excelente, se sabe que son vulnerables a ataques adversarios que contienen perturbaciones imperceptibles para los humanos. Se han propuesto múltiples estrategias de defensa adversaria para aliviar este problema, pero a menudo muestran practicidad limitada en términos de eficiencia y manejo exclusivo de ataques específicos. En este artículo, analizamos el rendimiento de las Redes Neuronales Bayesianas (BNNs) dotadas de una distribución posterior aproximada flexible para detectar ejemplos adversarios. Además, estudiamos la robustez del método de detección cuando las capas Bayesianas se encuentran ya sea en la parte superior o a lo largo de las DNNs para determinar el papel de las capas ocultas de la red, y comparamos los resultados con los deterministas. Presentamos resultados empíricos que muestran cómo las BNNs ofrecen un método poderoso y práctico para detectar ejemplos adversarios en comparación con enfoques deterministas. Finalmente, discutimos los beneficios de las estrategias de diseño de las BNNs no solo para proporcionar detectores adversarios robustos, sino también para obtener estimaciones de incertidumbre bien predichas.
Descripción
Abstract
Although Deep Neural Networks (DNNs) have repeatedly shown excellent performance, they are known to be vulnerable to adversarial attacks that contain human-imperceptible perturbations. Multiple adversarial defense strategies have been proposed to alleviate this issue, but they often demonstrate restricted practicability in terms of efficiency and handling solely specific attacks. In this paper, we analyze the performance of Bayesian Neural Networks (BNNs) endowed with flexible approximate posterior distribution for detecting adversarial examples. Furthermore, we study how robust the detection method is when Bayesian layers are located at either the top or throughout the DNNs in order to determine the role of the network’s hidden layers, and we compare the results with the deterministic ones. We provide empirical results that show how BNNs offer a powerful, and practical method of detecting adversarial examples in comparison with deterministic approaches. Finally, we discuss the benefits of BNNs design strategies not only to provide robust adversarial detectors but also to obtain well-predicted uncertainty estimates.
Palabras clave
Ataques Adversarios, Redes Neuronales Bayesianas, Bayesianas, DNNs
