Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components
- Autores
- Rabinovich, Federico; Ronchetti, Franco; Quiroga, Facundo Manuel
- Año de publicación
- 2025
- Idioma
- inglés
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- This paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs.
Este artículo presenta una exploración de métodos no supervisados para la inicialización y el entrenamiento de filtros en capas convolucionales, con el objetivo de reducir la dependencia de datos etiquetados y recursos computacionales. Proponemos dos métodos no supervisados basados en la distribución de los datos de entrada y evaluamos su rendimiento en comparación con la inicialización Glorot Uniform tradicional. Al inicializar únicamente la capa inicial de una red CNN básica con uno de nuestros métodos propuestos, logramos una mejora del 0.78% en la precisión final en comparación con la inicialización Glorot Uniform tradicional. Nuestros hallazgos sugieren que estos métodos no supervisados podrían servir como alternativas efectivas para la inicialización de filtros, lo que podría llevar a procesos de entrenamiento más eficientes y a una mejor comprensión de las redes convolucionales.
Facultad de Informática - Materia
-
Ciencias Informáticas
Clustering,
Convolutional Neural Networks,
Initialization,
K-Means,
Principal Components.
Agrupamiento no supervisado
Componentes principales
Inicialización
K-Medias
Redes Neuronales Convolucionales - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/179675
Ver los metadatos del registro completo
| id |
SEDICI_a2ebc74464852bd8134d957c3811e470 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/179675 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal ComponentsHacia métodos más eficientes de inicialización para Redes Neuronales convolucionales por medio de K-Medias y componentes principalesRabinovich, FedericoRonchetti, FrancoQuiroga, Facundo ManuelCiencias InformáticasClustering,Convolutional Neural Networks,Initialization,K-Means,Principal Components.Agrupamiento no supervisadoComponentes principalesInicializaciónK-MediasRedes Neuronales ConvolucionalesThis paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs.Este artículo presenta una exploración de métodos no supervisados para la inicialización y el entrenamiento de filtros en capas convolucionales, con el objetivo de reducir la dependencia de datos etiquetados y recursos computacionales. Proponemos dos métodos no supervisados basados en la distribución de los datos de entrada y evaluamos su rendimiento en comparación con la inicialización Glorot Uniform tradicional. Al inicializar únicamente la capa inicial de una red CNN básica con uno de nuestros métodos propuestos, logramos una mejora del 0.78% en la precisión final en comparación con la inicialización Glorot Uniform tradicional. Nuestros hallazgos sugieren que estos métodos no supervisados podrían servir como alternativas efectivas para la inicialización de filtros, lo que podría llevar a procesos de entrenamiento más eficientes y a una mejor comprensión de las redes convolucionales.Facultad de Informática2025-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdf44-52http://sedici.unlp.edu.ar/handle/10915/179675enginfo:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e04info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:29:57Zoai:sedici.unlp.edu.ar:10915/179675Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:29:57.574SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components Hacia métodos más eficientes de inicialización para Redes Neuronales convolucionales por medio de K-Medias y componentes principales |
| title |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components |
| spellingShingle |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components Rabinovich, Federico Ciencias Informáticas Clustering, Convolutional Neural Networks, Initialization, K-Means, Principal Components. Agrupamiento no supervisado Componentes principales Inicialización K-Medias Redes Neuronales Convolucionales |
| title_short |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components |
| title_full |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components |
| title_fullStr |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components |
| title_full_unstemmed |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components |
| title_sort |
Towards more efficient initialization methods for Convolutional Neural Networks via K-Means and Principal Components |
| dc.creator.none.fl_str_mv |
Rabinovich, Federico Ronchetti, Franco Quiroga, Facundo Manuel |
| author |
Rabinovich, Federico |
| author_facet |
Rabinovich, Federico Ronchetti, Franco Quiroga, Facundo Manuel |
| author_role |
author |
| author2 |
Ronchetti, Franco Quiroga, Facundo Manuel |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Clustering, Convolutional Neural Networks, Initialization, K-Means, Principal Components. Agrupamiento no supervisado Componentes principales Inicialización K-Medias Redes Neuronales Convolucionales |
| topic |
Ciencias Informáticas Clustering, Convolutional Neural Networks, Initialization, K-Means, Principal Components. Agrupamiento no supervisado Componentes principales Inicialización K-Medias Redes Neuronales Convolucionales |
| dc.description.none.fl_txt_mv |
This paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs. Este artículo presenta una exploración de métodos no supervisados para la inicialización y el entrenamiento de filtros en capas convolucionales, con el objetivo de reducir la dependencia de datos etiquetados y recursos computacionales. Proponemos dos métodos no supervisados basados en la distribución de los datos de entrada y evaluamos su rendimiento en comparación con la inicialización Glorot Uniform tradicional. Al inicializar únicamente la capa inicial de una red CNN básica con uno de nuestros métodos propuestos, logramos una mejora del 0.78% en la precisión final en comparación con la inicialización Glorot Uniform tradicional. Nuestros hallazgos sugieren que estos métodos no supervisados podrían servir como alternativas efectivas para la inicialización de filtros, lo que podría llevar a procesos de entrenamiento más eficientes y a una mejor comprensión de las redes convolucionales. Facultad de Informática |
| description |
This paper presents an exploration of unsupervised methods for initializing and training filters in convolutional layers, aiming to reduce the dependency on labeled data and computational resources. We propose two unsupervised methods based on the distribution of input data and evaluate their performance against traditional Glorot Uniform initialization. By initializing solely the initial layer of a basic CNN network with one of our proposed methods, we attained a 0.78% enhancement in final accuracy compared to traditional Glorot Uniform initialization. Our findings suggest that these unsupervised methods could serve as effective alternatives for filter initialization, potentially leading to more efficient training processes and a better understanding of CNNs. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-04 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Articulo http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/179675 |
| url |
http://sedici.unlp.edu.ar/handle/10915/179675 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/issn/1666-6038 info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e04 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 44-52 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1846783797285093376 |
| score |
12.982451 |