El papel de las redes neuronales convolucionales en el reconocimiento facial y emocional
Publicado 2026-04-23
Palabras clave
- red neuronal convolucional (CNN),
- aprendizaje automático,
- visión por computadora,
- inteligencia artificial,
- Random Forest
- procesamiento de datos en tiempo real,
- interacción hombre-máquina,
- extracción de características,
- aprendizaje profundo,
- optimización de modelos ...Más
Cómo citar
Derechos de autor 2026 Revista UIS Ingenierías

Esta obra está bajo una licencia internacional Creative Commons Atribución-SinDerivadas 4.0.
Resumen
La investigación, llevada a cabo en el Advanced Data Engineering Lab, tuvo como objetivo desarrollar un sistema de reconocimiento facial y emociones, en tiempo real. Este proyecto, que forma parte de una iniciativa más amplia para mejorar la interacción humano-máquina, utilizó redes neuronales convolucionales y algoritmos de aprendizaje automático, como Random Forest, para analizar expresiones faciales. Los sistemas de cómputo empleados tenían la capacidad de realizar procesamiento intensivo de datos en tiempo real. Los modelos CNN fueron entrenados utilizando el conjunto de datos FER2013, aplicando técnicas de aumento de datos y preprocesamiento para mejorar la generalización del modelo. El modelo B, con una arquitectura optimizada, alcanzó una precisión del 64%, superando el rendimiento de otros modelos. Sin embargo, el estudio reveló dificultades para clasificar con precisión emociones negativas sutiles, como la tristeza, la ira y el miedo, lo que destaca la necesidad de conjuntos de datos más equilibrados y mejores técnicas de extracción de características. La investigación sugiere que las mejoras futuras deben centrarse en el uso de conjuntos de datos más grandes y diversos, así como en técnicas avanzadas como el aprendizaje por transferencia. El sistema propuesto tiene un gran potencial para aplicaciones en contextos industriales, especialmente para mejorar la interacción humano-robot y el monitoreo de la seguridad de los trabajadores.
Descargas
Citas
- [1] A. B. Rashid and M. A. K. Kausik, “AI revolutionizing industries worldwide: A comprehensive overview of its diverse applications,” Hybrid Adv., vol. 7, p. 100277, Dec. 2024, doi: https://doi.org/10.1016/j.hybadv.2024.100277
- [2] N. Fragopanagos and J. G. Taylor, “Emotion recognition in human–computer interaction,” Neural Netw., vol. 18, no. 4, pp. 389–405, May 2005, doi: https://doi.org/10.1016/j.neunet.2005.03.006
- [3] A. P. Singh Chouhan, A. Verma, V. Singh, and A. Rawat, “Vision-based action recognition for the human-machine interaction,” 2024, pp. 363–376.
- [4] W. Zhiqiang and L. Jun, “A review of object detection based on convolutional neural network,” in 2017 36th Chinese Control Conference (CCC), Jul. 2017, pp. 11104–11109, doi: https://doi.org/10.23919/ChiCC.2017.8029130
- [5] L. Liu, Y. Wang, and W. Chi, “Image Recognition Technology Based on Machine Learning,” IEEE Access, pp. 1–1, 2024, doi: https://doi.org/10.1109/ACCESS.2020.3021590
- [6] C.-W. Huang et al., “Emotion recognition in doctor-patient interactions from real-world clinical video database: Initial development of artificial empathy,” Comput. Methods Programs Biomed., vol. 233, p. 107480, May 2023, doi: https://doi.org/10.1016/j.cmpb.2023.107480
- [7] M. Dhuheir, A. Albaseer, E. Baccour, A. Erbad, M. Abdallah, and M. Hamdi, “Emotion Recognition for Healthcare Surveillance Systems Using Neural Networks: A Survey,” in 2021 International Wireless Communications and Mobile Computing (IWCMC), Jun. 2021, pp. 681–687, doi: https://doi.org/10.1109/IWCMC51323.2021.9498861
- [8] H. Xiao et al., “On-Road Driver Emotion Recognition Using Facial Expression,” Appl. Sci., vol. 12, no. 2, Art. no. 2, 2022, doi: https://doi.org/10.3390/app12020807
- [9] “Emotion Detection.” Accessed: Apr. 08, 2024. [Online]. Available: https://www.kaggle.com/datasets/ananthu017/emotion-detection-fer
- [10] “Coursera-Guided-Projects-2021/Facial Recognition with Keras/Facial_Expression_Training.ipynb at main · ashishpatel26/Coursera-Guided-Projects-2021.” [Online]. Available: http://bit.ly/3BcAiny
- [11] P. Viola and M. Jones, “Rapid object detection using a boosted cascade of simple features,” in Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR 2001, Dec. 2001, p. I–I, doi: https://doi.org/10.1109/CVPR.2001.990517
- [12] E. Boitel, A. Mohasseb, and E. Haig, “MIST: Multimodal emotion recognition using DeBERTa for text, Semi-CNN for speech, ResNet-50 for facial, and 3D-CNN for motion analysis,” Expert Syst. Appl., vol. 270, p. 126236, Apr. 2025, doi: https://doi.org/10.1016/j.eswa.2024.126236
- [13] K. Sarvakar, R. Senkamalavalli, S. Raghavendra, J. Santosh Kumar, R. Manjunath, and S. Jaiswal, “Facial emotion recognition using convolutional neural networks,” Mater. Today Proc., vol. 80, pp. 3560–3564, Jan. 2023, doi: https://doi.org/10.1016/j.matpr.2021.07.297
- [14] J. D. Bodapati, U. Srilakshmi, and N. Veeranjaneyulu, “FERNet: A Deep CNN Architecture for Facial Expression Recognition in the Wild,” J. Inst. Eng. India Ser. B, vol. 103, no. 2, pp. 439–448, Apr. 2022, doi: https://doi.org/10.1007/s40031-021-00681-8
- [15] Y. Khaireddin and Z. Chen, “Facial Emotion Recognition: State of the Art Performance on FER2013”.
- [16] A. Dosovitskiy et al., “An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale,” Jun. 03, 2021, arXiv: arXiv:2010.11929. [Online]. Available: http://arxiv.org/abs/2010.11929
