Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components

Autores
Rabinovich, Federico; Ronchetti, Franco; Quiroga, Facundo Manuel
Año de publicación
2025
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
This paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs.
Este artículo presenta una exploración de métodos no supervisados para la inicialización y el entrenamiento de filtros en capas convolucionales, con el objetivo de reducir la dependencia de datos etiquetados y recursos computacionales. Proponemos dos métodos no supervisados basados en la distribución de los datos de entrada y evaluamos su rendimiento en comparación con la inicialización Glorot Uniform tradicional. Al inicializar únicamente la capa inicial de una red CNN básica con uno de nuestros métodos propuestos, logramos una mejora del 0.78% en la precisión final en comparación con la inicialización Glorot Uniform tradicional. Nuestros hallazgos sugieren que estos métodos no supervisados podrían servir como alternativas efectivas para la inicialización de filtros, lo que podría llevar a procesos de entrenamiento más eficientes y a una mejor comprensión de las redes convolucionales.
Facultad de Informática
Materia
Ciencias Informáticas
Clustering,
Convolutional Neural Networks,
Initialization,
K-Means,
Principal Components.
Agrupamiento no supervisado
Componentes principales
Inicialización
K-Medias
Redes Neuronales Convolucionales
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/179675

id SEDICI_a2ebc74464852bd8134d957c3811e470
oai_identifier_str oai:sedici.unlp.edu.ar:10915/179675
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal ComponentsHacia métodos más eficientes de inicialización para Redes Neuronales convolucionales por medio de K-Medias y componentes principalesRabinovich, FedericoRonchetti, FrancoQuiroga, Facundo ManuelCiencias InformáticasClustering,Convolutional Neural Networks,Initialization,K-Means,Principal Components.Agrupamiento no supervisadoComponentes principalesInicializaciónK-MediasRedes Neuronales ConvolucionalesThis paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs.Este artículo presenta una exploración de métodos no supervisados para la inicialización y el entrenamiento de filtros en capas convolucionales, con el objetivo de reducir la dependencia de datos etiquetados y recursos computacionales. Proponemos dos métodos no supervisados basados en la distribución de los datos de entrada y evaluamos su rendimiento en comparación con la inicialización Glorot Uniform tradicional. Al inicializar únicamente la capa inicial de una red CNN básica con uno de nuestros métodos propuestos, logramos una mejora del 0.78% en la precisión final en comparación con la inicialización Glorot Uniform tradicional. Nuestros hallazgos sugieren que estos métodos no supervisados podrían servir como alternativas efectivas para la inicialización de filtros, lo que podría llevar a procesos de entrenamiento más eficientes y a una mejor comprensión de las redes convolucionales.Facultad de Informática2025-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdf44-52http://sedici.unlp.edu.ar/handle/10915/179675enginfo:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e04info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:29:57Zoai:sedici.unlp.edu.ar:10915/179675Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:29:57.574SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
Hacia métodos más eficientes de inicialización para Redes Neuronales convolucionales por medio de K-Medias y componentes principales
title Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
spellingShingle Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
Rabinovich, Federico
Ciencias Informáticas
Clustering,
Convolutional Neural Networks,
Initialization,
K-Means,
Principal Components.
Agrupamiento no supervisado
Componentes principales
Inicialización
K-Medias
Redes Neuronales Convolucionales
title_short Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
title_full Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
title_fullStr Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
title_full_unstemmed Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
title_sort Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
dc.creator.none.fl_str_mv Rabinovich, Federico
Ronchetti, Franco
Quiroga, Facundo Manuel
author Rabinovich, Federico
author_facet Rabinovich, Federico
Ronchetti, Franco
Quiroga, Facundo Manuel
author_role author
author2 Ronchetti, Franco
Quiroga, Facundo Manuel
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Clustering,
Convolutional Neural Networks,
Initialization,
K-Means,
Principal Components.
Agrupamiento no supervisado
Componentes principales
Inicialización
K-Medias
Redes Neuronales Convolucionales
topic Ciencias Informáticas
Clustering,
Convolutional Neural Networks,
Initialization,
K-Means,
Principal Components.
Agrupamiento no supervisado
Componentes principales
Inicialización
K-Medias
Redes Neuronales Convolucionales
dc.description.none.fl_txt_mv This paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs.
Este artículo presenta una exploración de métodos no supervisados para la inicialización y el entrenamiento de filtros en capas convolucionales, con el objetivo de reducir la dependencia de datos etiquetados y recursos computacionales. Proponemos dos métodos no supervisados basados en la distribución de los datos de entrada y evaluamos su rendimiento en comparación con la inicialización Glorot Uniform tradicional. Al inicializar únicamente la capa inicial de una red CNN básica con uno de nuestros métodos propuestos, logramos una mejora del 0.78% en la precisión final en comparación con la inicialización Glorot Uniform tradicional. Nuestros hallazgos sugieren que estos métodos no supervisados podrían servir como alternativas efectivas para la inicialización de filtros, lo que podría llevar a procesos de entrenamiento más eficientes y a una mejor comprensión de las redes convolucionales.
Facultad de Informática
description This paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs.
publishDate 2025
dc.date.none.fl_str_mv 2025-04
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/179675
url http://sedici.unlp.edu.ar/handle/10915/179675
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/issn/1666-6038
info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e04
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
44-52
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846783797285093376
score 12.982451