Desde AARON a las GANs ¿Pueden las máquinas ser creativas?

viernes,14 octubre, 2022

Por Elena Verdú Pérez

Hace unos años impartía una asignatura sobre Inteligencia Artificial en la cual se desarrollaba un foro sobre si las máquinas pueden pensar, cuestión que Alan Turing ya se planteó en su famoso artículo “Computing machinery and intelligency” en 1950 (Turing, 1950). En dicho foro los alumnos debatían sobre esta cuestión y derivaban en temas tan apasionantes y controvertidos como el relativo a si las máquinas pueden ser creativas.

Ya en los años 70, Harold Cohen comenzó su creación de AARON, el primer sistema experto dibujante (Cohen, 1995). Como los sistemas expertos de su época, este requería de conocimiento humano incorporado en forma de reglas, lo que implica un trabajo exhaustivo por parte de Harold Cohen durante años para conseguir que la máquina dibujara personas y objetos. Desde entonces, se ha cuestionado la creatividad de las máquinas, con el argumento de que los programas siguen instrucciones dadas por sus programadores.

En los últimos años, la aparición de grandes cantidades de datos y nuevas técnicas como el aprendizaje profundo ha supuesto un punto de inflexión en el campo de la creación artificial, acortando los tiempos para el desarrollo de sistemas creadores. Específicamente, un hito importante en cuanto a la posibilidad de creación por parte de las máquinas ha tenido lugar en 2014, cuando Goodfellow, Pouget-Abadie, Mirza, Xu, Warde-Farley, Ozair, Courville, y Bengio (2014), investigadores de la Universidad de Montreal, propusieron las redes generativas adversarias, más conocidas como GANs por su nombre en inglés (Generative Adversarial Networks). Las GANs se componen de dos redes neuronales, una llamada generadora y otra llamada discriminadora, que compiten entre sí, de ahí el nombre de adversarias. La generadora, nutrida de una señal de ruido aleatorio, trata de generar artificialmente nuevos datos (por ejemplo, imágenes) que parezcan reales con el fin de engañar a su adversaria, la red discriminadora, que trata de distinguir las imágenes reales de las ficticias. Durante su aprendizaje la red generadora va mejorando, creando al comienzo imágenes sin sentido y, progresivamente, generando imágenes que parecen más reales. Por otra parte, en su aprendizaje, la red discriminadora mejora progresivamente en su tarea de detectar las imágenes ficticias. Si contamos con un buen conjunto de datos para entrenar, llega un momento en que esta red será incapaz de distinguir lo real de lo ficticio, a pesar de mejorar en su tarea de discriminar, porque la red generadora ha aprendido a crear imágenes parecidas a las imágenes reales que se han utilizado para entrenar a la máquina discriminadora.

Las GANs tienen un gran potencial creativo, pueden por ejemplo utilizarse para crear una imagen realista a partir de un boceto simple, tal y como muestran los trabajos de Zhu, Krähenbühl, Shechtman and Efros (2016) y Brock, Lim, Ritchie y Weston (2017), modificar el estilo de una imagen tal y como se muestra en la figura 1, o incluso generar caras visibles a partir de imágenes térmicas, como se ilustra en la figura 2.

Figura 1. La primera columna representa la imagen de partida y las siguientes columnas representan las adaptaciones a diferentes estilos realizadas por la red GAN. Fuente: Tahir, Cheng, Memon, y Liu (2022) con licencia https://creativecommons.org/licenses/by/3.0/

Figura 2. A partir de la imagen térmica en la primera columna, diferentes tipologías de GANs (cada columna corresponde a una de ellas) generan caras visibles más o menos realistas. Fuente: Benamara, Zigh, Stambouli, y Keche (2022) con licencia https://creativecommons.org/licenses/by/3.0/

Echando un vistazo a estas creaciones de las redes GANs, o a las de AARON mostradas en el artículo “The further exploits of AARON, Painter” de Harold Cohen (Cohen, 1995), juzguen ustedes mismos sobre la creatividad de las máquinas.

REFERENCIAS

  • Benamara, N. K., Zigh, E., Stambouli, T.B., y Keche, M. 2022. Towards a Robust Thermal-Visible Heterogeneous Face Recognition Approach Based on a Cycle Generative Adversarial Network. International Journal of Interactive Multimedia and Artificial Intelligence 7(4), 132-145.
  • Boden, M.A. 1998. Creativity and artificial intelligence. Artificial Intelligence 103(1-2), 347-356.
  • Brock, A., Lim, T.,Ritchie, J.M., y Weston, N. 2017. Neural Photo Editing with Introspective Adversarial Networks},  arXiv:1609.07093
  • Cohen, H. 1995. The further exploits of AARON, Painter. Stanford Humanities Review 4(2), 141-158.
  • Cohen, H. 2010. Driving the Creative Machine. Orcas Center, Crossroads Lecture Series.
  • Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., y Bengio, Y. 2014. Generative Adversarial Nets. In: Ghahramani, Z., Welling, M., Cortes, C., Lawrence, N., y Weinberger, K.Q. (eds) Advances in Neural Information Processing Systems, vol. 27. Curran Associates, Inc.
  • Newell, A., Shaw, J.C., y Simon, H.A. 1959. Symposium on Creative Thinking, University of Colorado, Boulder, Colorado.
  • Tahir, R., Cheng, K., Memon, B. A., y Liu, Q. 2022. A Diverse Domain Generative Adversarial Network for Style Transfer on Face Photographs, International Journal of Interactive Multimedia and Artificial Intelligence 7(5), 100-108.
  • Turing, A. 1950. Computing machinery and Intelligence, Mind 59, 433-460.
  • Zhu, J.-Y, Krähenbühl, P., Shechtman, E., y Efros, A.A. 2016. Generative Visual Manipulation on the Natural Image Manifold. In: Leibe, B., Matas, J., Sebe, N., Welling, M. (eds) Computer Vision – ECCV 2016. ECCV 2016. Lecture Notes in Computer Science, vol 9909. Springer, Cham.