An evaluation of pre-trained models for feature extraction in image classification

Puls, Erick da Silva

dc.contributor.advisor	Carbonera, Joel Luis	pt_BR
dc.contributor.author	Puls, Erick da Silva	pt_BR
dc.date.accessioned	2023-07-05T03:46:46Z	pt_BR
dc.date.issued	2023	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/261764	pt_BR
dc.description.abstract	In recent years, we have witnessed a considerable increase in performance in image clas sification tasks. This performance improvement is mainly due to the use of deep learning techniques. Generally, deep learning techniques demand a large set of annotated data, making it a challenge to apply this method when little data is available. In this scenario, transfer learning strategies have become a promising alternative to overcome these issues. This work aims to compare the performance of different pre-trained neural networks for feature extraction in image classification tasks. We evaluated 16 different pre-trained models in four datasets, including a dataset of Geological Images that are the focus of this work. Our results demonstrate that for the Geological Images dataset, the best model was CLIP-ViT-B followed by CLIP-ResNet50. Similarly, the best general performance along all four datasets was achieved by CLIP-ViT-B and ViT-H-14, where the CLIP-ResNet50 model had similar performance but with lesser variability. Therefore, our study provides evidence supporting the choice of models for transfer learning in image classification tasks involving the four target datasets.	en
dc.description.abstract	Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	eng	pt_BR
dc.rights	Open Access	en
dc.subject	Image classification	en
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Redes neurais	pt_BR
dc.subject	Transfer learning	en
dc.subject	Imagem	pt_BR
dc.subject	Feature extraction	en
dc.title	An evaluation of pre-trained models for feature extraction in image classification	pt_BR
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.identifier.nrb	001172648	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2023	pt_BR
dc.degree.graduation	Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Nome:: 001172648.pdf
Tamanho:: 4.281Mb
Formato:: PDF
Descrição:: Texto completo (inglês)

Visualizar/abrir

Este item está licenciado na Creative Commons License

Trabalhos de Conclusão de Curso de Graduação (37618)

TCC Ciência da Computação (1025)

Mostrar registro simples