Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo
- Autores
- Fernández, Gonzalo Pablo
- Año de publicación
- 2020
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Buemi, María Elena
- Descripción
- En este trabajo se estudian diferentes enfoques basados en aprendizaje automático (en particular, variantes de redes neuronales artificiales) para clasificar instancias de expresiones faciales en video según su veracidad. Este problema tiene la particularidad, en comparación a la mayoría de problemas que las computadoras aprendieron a resolver utilizando inteligencia artificial, de que es una tarea que no es trivial de resolver para los seres humanos. Con ello surge la dificultad de evaluar el rendimiento de los modelos desarrollados. Entre las mútiples aplicaciones que tiene este problema está mejorar la interacción humano-computadora, aumentar la efectividad de los robots asistentes, aportar en el tratamiento de desórdenes cognitivos crónicos, asistir investigaciones policiales, entre otros. También podría ser utilizado como herramienta para inferir qué tan bueno es un actor o para juzgar si un sospechoso dice la verdad. Se utiliza como base de entrenamiento la SASE-FE que fue diseña da específicamente pa ra resolver este problema en particular. Esta base contiene videos de sujetos realizando expresiones faciales, etiquetados según tipo de expresión y valor de verdad. El principal análisis se basa en comparar redes neuronales profundas (feed-forward) con redes neuronales recurrentes. Este tipo particular de redes se caracteriza por su capacidad de extraer información de una secuencia y almacenarla a través del tiempo. Así, un video puede ser clasificado utilizando no sólo los atributos obtenidos en cada cuadro sino también los de sus antecesores. Ante la escasez de datos para experimentar, se propone una nueva métrica para realizar un análisis más granular y la cual permite comparar con más detalle los resultados que arroja cada variante implementada. Los resultados sugieren que los rasgos determinantes que permiten distinguir entre una expresión sincera y una fingida están muy arraigados al sujeto que las ejecuta y, por lo tanto, desarrollar un clasificador universal (independiente del sujeto en cuestión) parece ser poco viable. En cuanto a la comparación entre los dos tipos de redes, si bien las recurrentes no mejoraron los valores obtenidos por las profundas, sí se destaca que obtuvieron resultados similares con menor cantidad de épocas de entrenamiento.
In this work we study many different machine learning based approaches (particulary, artificial neural networks variants) to classify instances of facial expressions on video according to it’s veracity. This problem has the peculiarity, comparing to most problems that computers learned to solve using artificial intelligence, that is a task not trivial to solve to human beings. With that comes the difficulty of evaluating the performance of the developed models. This problem has multiple aplications, like improving human-computer interaction, increa-sing assistant robots efectivity, helping in chronic cognitive disorders treatment, asisting policial investigations, among others. It also could be used as tool to infer an actor’s performance or to judge if a suspect is telling the truth. We use the SASE-FE dataset that was designed specifically to solve this particular problem. This dataset contains videos of subjects doing facial expresions, labeled with type of expresion and truth value. The main analysis is based on comparing deep feed-forward neural networks with recurrent neural networks. this particular type of network is known for being capable of extract information from a sequence and keep it through time. That way, a video can be clasified using not only it’s features but also the ones from it’s predecessors. Having so little data to experiment, we propose a new metric to make a more granular analysis and that allows compare with more detail the results that each implemented variant throws. Results suggest that determinants traits that allows distinguishing a genuine expresion and a faked one are too related to the subject that executes them and,then, developing an universal clasifier (independent of the subject) seems unfeasible. Regarding the comparison between the two types of networks, although the recurrent variants couldn’t overcome the values obtained by the deep variants, we can appreciate that they reach similar results but with a smaller amount of training epochs.
Fil: Fernández, Gonzalo Pablo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
EXPRESIONES FACIALES
LANDMARKS
REDES NEURONALES RECURRENTES
FACIAL EXPRESSIONS
LANDMARKS
RECURRENT NEURAL NETWORKS - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000479_Fernandez
Ver los metadatos del registro completo
id |
BDUBAFCEN_519787fdfd3afd305377cc50f346bd2c |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000479_Fernandez |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundoFacial expressions veracity estimation using deep learningFernández, Gonzalo PabloEXPRESIONES FACIALESLANDMARKSREDES NEURONALES RECURRENTESFACIAL EXPRESSIONSLANDMARKSRECURRENT NEURAL NETWORKSEn este trabajo se estudian diferentes enfoques basados en aprendizaje automático (en particular, variantes de redes neuronales artificiales) para clasificar instancias de expresiones faciales en video según su veracidad. Este problema tiene la particularidad, en comparación a la mayoría de problemas que las computadoras aprendieron a resolver utilizando inteligencia artificial, de que es una tarea que no es trivial de resolver para los seres humanos. Con ello surge la dificultad de evaluar el rendimiento de los modelos desarrollados. Entre las mútiples aplicaciones que tiene este problema está mejorar la interacción humano-computadora, aumentar la efectividad de los robots asistentes, aportar en el tratamiento de desórdenes cognitivos crónicos, asistir investigaciones policiales, entre otros. También podría ser utilizado como herramienta para inferir qué tan bueno es un actor o para juzgar si un sospechoso dice la verdad. Se utiliza como base de entrenamiento la SASE-FE que fue diseña da específicamente pa ra resolver este problema en particular. Esta base contiene videos de sujetos realizando expresiones faciales, etiquetados según tipo de expresión y valor de verdad. El principal análisis se basa en comparar redes neuronales profundas (feed-forward) con redes neuronales recurrentes. Este tipo particular de redes se caracteriza por su capacidad de extraer información de una secuencia y almacenarla a través del tiempo. Así, un video puede ser clasificado utilizando no sólo los atributos obtenidos en cada cuadro sino también los de sus antecesores. Ante la escasez de datos para experimentar, se propone una nueva métrica para realizar un análisis más granular y la cual permite comparar con más detalle los resultados que arroja cada variante implementada. Los resultados sugieren que los rasgos determinantes que permiten distinguir entre una expresión sincera y una fingida están muy arraigados al sujeto que las ejecuta y, por lo tanto, desarrollar un clasificador universal (independiente del sujeto en cuestión) parece ser poco viable. En cuanto a la comparación entre los dos tipos de redes, si bien las recurrentes no mejoraron los valores obtenidos por las profundas, sí se destaca que obtuvieron resultados similares con menor cantidad de épocas de entrenamiento.In this work we study many different machine learning based approaches (particulary, artificial neural networks variants) to classify instances of facial expressions on video according to it’s veracity. This problem has the peculiarity, comparing to most problems that computers learned to solve using artificial intelligence, that is a task not trivial to solve to human beings. With that comes the difficulty of evaluating the performance of the developed models. This problem has multiple aplications, like improving human-computer interaction, increa-sing assistant robots efectivity, helping in chronic cognitive disorders treatment, asisting policial investigations, among others. It also could be used as tool to infer an actor’s performance or to judge if a suspect is telling the truth. We use the SASE-FE dataset that was designed specifically to solve this particular problem. This dataset contains videos of subjects doing facial expresions, labeled with type of expresion and truth value. The main analysis is based on comparing deep feed-forward neural networks with recurrent neural networks. this particular type of network is known for being capable of extract information from a sequence and keep it through time. That way, a video can be clasified using not only it’s features but also the ones from it’s predecessors. Having so little data to experiment, we propose a new metric to make a more granular analysis and that allows compare with more detail the results that each implemented variant throws. Results suggest that determinants traits that allows distinguishing a genuine expresion and a faked one are too related to the subject that executes them and,then, developing an universal clasifier (independent of the subject) seems unfeasible. Regarding the comparison between the two types of networks, although the recurrent variants couldn’t overcome the values obtained by the deep variants, we can appreciate that they reach similar results but with a smaller amount of training epochs.Fil: Fernández, Gonzalo Pablo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBuemi, María Elena2020-03-13info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000479_Fernandezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-04T09:49:27Zseminario:seminario_nCOM000479_FernandezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-04 09:49:28.959Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo Facial expressions veracity estimation using deep learning |
title |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo |
spellingShingle |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo Fernández, Gonzalo Pablo EXPRESIONES FACIALES LANDMARKS REDES NEURONALES RECURRENTES FACIAL EXPRESSIONS LANDMARKS RECURRENT NEURAL NETWORKS |
title_short |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo |
title_full |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo |
title_fullStr |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo |
title_full_unstemmed |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo |
title_sort |
Estimación de la veracidad de expresiones faciales utilizando aprendizaje profundo |
dc.creator.none.fl_str_mv |
Fernández, Gonzalo Pablo |
author |
Fernández, Gonzalo Pablo |
author_facet |
Fernández, Gonzalo Pablo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Buemi, María Elena |
dc.subject.none.fl_str_mv |
EXPRESIONES FACIALES LANDMARKS REDES NEURONALES RECURRENTES FACIAL EXPRESSIONS LANDMARKS RECURRENT NEURAL NETWORKS |
topic |
EXPRESIONES FACIALES LANDMARKS REDES NEURONALES RECURRENTES FACIAL EXPRESSIONS LANDMARKS RECURRENT NEURAL NETWORKS |
dc.description.none.fl_txt_mv |
En este trabajo se estudian diferentes enfoques basados en aprendizaje automático (en particular, variantes de redes neuronales artificiales) para clasificar instancias de expresiones faciales en video según su veracidad. Este problema tiene la particularidad, en comparación a la mayoría de problemas que las computadoras aprendieron a resolver utilizando inteligencia artificial, de que es una tarea que no es trivial de resolver para los seres humanos. Con ello surge la dificultad de evaluar el rendimiento de los modelos desarrollados. Entre las mútiples aplicaciones que tiene este problema está mejorar la interacción humano-computadora, aumentar la efectividad de los robots asistentes, aportar en el tratamiento de desórdenes cognitivos crónicos, asistir investigaciones policiales, entre otros. También podría ser utilizado como herramienta para inferir qué tan bueno es un actor o para juzgar si un sospechoso dice la verdad. Se utiliza como base de entrenamiento la SASE-FE que fue diseña da específicamente pa ra resolver este problema en particular. Esta base contiene videos de sujetos realizando expresiones faciales, etiquetados según tipo de expresión y valor de verdad. El principal análisis se basa en comparar redes neuronales profundas (feed-forward) con redes neuronales recurrentes. Este tipo particular de redes se caracteriza por su capacidad de extraer información de una secuencia y almacenarla a través del tiempo. Así, un video puede ser clasificado utilizando no sólo los atributos obtenidos en cada cuadro sino también los de sus antecesores. Ante la escasez de datos para experimentar, se propone una nueva métrica para realizar un análisis más granular y la cual permite comparar con más detalle los resultados que arroja cada variante implementada. Los resultados sugieren que los rasgos determinantes que permiten distinguir entre una expresión sincera y una fingida están muy arraigados al sujeto que las ejecuta y, por lo tanto, desarrollar un clasificador universal (independiente del sujeto en cuestión) parece ser poco viable. En cuanto a la comparación entre los dos tipos de redes, si bien las recurrentes no mejoraron los valores obtenidos por las profundas, sí se destaca que obtuvieron resultados similares con menor cantidad de épocas de entrenamiento. In this work we study many different machine learning based approaches (particulary, artificial neural networks variants) to classify instances of facial expressions on video according to it’s veracity. This problem has the peculiarity, comparing to most problems that computers learned to solve using artificial intelligence, that is a task not trivial to solve to human beings. With that comes the difficulty of evaluating the performance of the developed models. This problem has multiple aplications, like improving human-computer interaction, increa-sing assistant robots efectivity, helping in chronic cognitive disorders treatment, asisting policial investigations, among others. It also could be used as tool to infer an actor’s performance or to judge if a suspect is telling the truth. We use the SASE-FE dataset that was designed specifically to solve this particular problem. This dataset contains videos of subjects doing facial expresions, labeled with type of expresion and truth value. The main analysis is based on comparing deep feed-forward neural networks with recurrent neural networks. this particular type of network is known for being capable of extract information from a sequence and keep it through time. That way, a video can be clasified using not only it’s features but also the ones from it’s predecessors. Having so little data to experiment, we propose a new metric to make a more granular analysis and that allows compare with more detail the results that each implemented variant throws. Results suggest that determinants traits that allows distinguishing a genuine expresion and a faked one are too related to the subject that executes them and,then, developing an universal clasifier (independent of the subject) seems unfeasible. Regarding the comparison between the two types of networks, although the recurrent variants couldn’t overcome the values obtained by the deep variants, we can appreciate that they reach similar results but with a smaller amount of training epochs. Fil: Fernández, Gonzalo Pablo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
En este trabajo se estudian diferentes enfoques basados en aprendizaje automático (en particular, variantes de redes neuronales artificiales) para clasificar instancias de expresiones faciales en video según su veracidad. Este problema tiene la particularidad, en comparación a la mayoría de problemas que las computadoras aprendieron a resolver utilizando inteligencia artificial, de que es una tarea que no es trivial de resolver para los seres humanos. Con ello surge la dificultad de evaluar el rendimiento de los modelos desarrollados. Entre las mútiples aplicaciones que tiene este problema está mejorar la interacción humano-computadora, aumentar la efectividad de los robots asistentes, aportar en el tratamiento de desórdenes cognitivos crónicos, asistir investigaciones policiales, entre otros. También podría ser utilizado como herramienta para inferir qué tan bueno es un actor o para juzgar si un sospechoso dice la verdad. Se utiliza como base de entrenamiento la SASE-FE que fue diseña da específicamente pa ra resolver este problema en particular. Esta base contiene videos de sujetos realizando expresiones faciales, etiquetados según tipo de expresión y valor de verdad. El principal análisis se basa en comparar redes neuronales profundas (feed-forward) con redes neuronales recurrentes. Este tipo particular de redes se caracteriza por su capacidad de extraer información de una secuencia y almacenarla a través del tiempo. Así, un video puede ser clasificado utilizando no sólo los atributos obtenidos en cada cuadro sino también los de sus antecesores. Ante la escasez de datos para experimentar, se propone una nueva métrica para realizar un análisis más granular y la cual permite comparar con más detalle los resultados que arroja cada variante implementada. Los resultados sugieren que los rasgos determinantes que permiten distinguir entre una expresión sincera y una fingida están muy arraigados al sujeto que las ejecuta y, por lo tanto, desarrollar un clasificador universal (independiente del sujeto en cuestión) parece ser poco viable. En cuanto a la comparación entre los dos tipos de redes, si bien las recurrentes no mejoraron los valores obtenidos por las profundas, sí se destaca que obtuvieron resultados similares con menor cantidad de épocas de entrenamiento. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-03-13 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000479_Fernandez |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000479_Fernandez |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1842340721401528320 |
score |
12.623145 |