Classificação de uso do solo para agricultura com imagens do Sentinel-2 e CNN VGG-16
Visualizar/abrir
Data
2024Autor
Orientador
Nível acadêmico
Graduação
Assunto
Resumo
Este trabalho apresenta uma abordagem detalhada para a classificação de uso do solo em áreas agrícolas, utilizando imagens de satélite Sentinel-2 e um modelo de Rede Neural Convolucional (CNN) VGG-16 (Arquitetura Visual Geometry Group com 16 camadas treináveis). A área de estudo é a região de Luís Eduardo Magalhães, BA, e os dados utilizados incluem um conjunto público de imagens ópticas e de radar, além de dados de campo coletados in situ. As imagens foram adquiridas durante o ano agrícola bra ...
Este trabalho apresenta uma abordagem detalhada para a classificação de uso do solo em áreas agrícolas, utilizando imagens de satélite Sentinel-2 e um modelo de Rede Neural Convolucional (CNN) VGG-16 (Arquitetura Visual Geometry Group com 16 camadas treináveis). A área de estudo é a região de Luís Eduardo Magalhães, BA, e os dados utilizados incluem um conjunto público de imagens ópticas e de radar, além de dados de campo coletados in situ. As imagens foram adquiridas durante o ano agrícola brasileiro de 2017- 2018, capturando uma ampla diversidade de coberturas do solo, principalmente focadas em culturas agrícolas. A preparação dos dados para o modelo de classificação é parte fundamental para obtenção dos resultados obtidos. Esta fase de pré-processamento tem como fator principal a adoção de uma técnica de janela deslizante sobre as imagens dos talhões a serem analisados, estes talhões são constituídos das culturas identificadas na geração do dataset, e são delimitados pelas geometrias criadas a partir das fronteiras destas áreas. Cada geometria recebe uma classe (cultivar identificado) que é anotada para cada período estruturado no dataset. A janela deslizante sobre as imagens dos talhões gera amostras de imagens menores no formato de entrada do modelo da CNN, que são capturadas sem nenhum tipo de redimensionamento, garantindo as características de textura de cada cultura identificada no solo da região. O modelo VGG-16, inicialmente pré-treinado no conjunto de dados ImageNet, foi adaptado através de fine-tuning para melhorar sua adequação às características específicas dos dados de sensoriamento remoto. No cenário com fine-tuning, o modelo alcançou categorical accuracy de 88% no conjunto de treinamento e 85% no conjunto de teste. Já no cenário sem fine-tuning, os valores obtidos foram de 83% e 82%, respectivamente. A aplicação do fine tuning permitiu ao modelo alcançar uma maior categorical accuracy na classificação do uso do solo no conjunto de dados analisado, apesar de demonstrar tendência maior ao overfitting quando comparado ao desempenho do treinamento da mesma arquitetura de CNN sem os pesos pré-treinados. Este estudo demonstra a eficácia da utilização de CNNs, como a VGG 16, na análise e interpretação de dados de sensoriamento remoto para aplicações agrícolas ...
Abstract
This work presents a detailed approach to land use classification in agricultural areas using Sentinel-2 satellite imagery and a VGG-16 Convolutional Neural Network (CNN) model (Visual Geometry Group architecture with 16 trainable layers). The study area is the region of Luís Eduardo Magalhães, BA, Brazil, and the data used includes a public set of optical and radar images, as well as field data collected in situ. The images were acquired during the Brazilian agricultural year of 2017-2018, cap ...
This work presents a detailed approach to land use classification in agricultural areas using Sentinel-2 satellite imagery and a VGG-16 Convolutional Neural Network (CNN) model (Visual Geometry Group architecture with 16 trainable layers). The study area is the region of Luís Eduardo Magalhães, BA, Brazil, and the data used includes a public set of optical and radar images, as well as field data collected in situ. The images were acquired during the Brazilian agricultural year of 2017-2018, capturing a wide diversity of land covers, mainly focused on agricultural crops. Data preparation for the classification model is a fundamental part of obtaining the results achieved. This pre-processing phase primarily involves adopting a sliding window technique over the images of the plots to be analyzed. These plots consist of the crops identified in the dataset generation and are delineated by geometries created from the boundaries of these areas. Each geometry is assigned a class (identified crop) that is annotated for each period structured in the dataset The sliding window over the plot images generates smaller image samples in the input format of the CNN model, captured without any resizing, thereby preserving the texture characteristics of each crop identified in the region's soil. The VGG-16 model, initially pre-trained on the ImageNet dataset, was adapted through fine-tuning to improve its suitability to the specific characteristics of remote sensing data. In the scenario with fine-tuning, the model achieved a categorical accuracy of 88% on the training set and 85% on the test set. In the scenario without fine-tuning, the values obtained were 83% and 82%, respectively. The application of fine-tuning allowed the model to achieve higher categorical accuracy in land use classification in the analyzed dataset, despite showing a greater tendency towards overfitting when compared to the performance of training the same CNN architecture without the pre-trained weights. This study demonstrates the effectiveness of using CNNs, such as VGG-16, in the analysis and interpretation of remote sensing data for agricultural applications ...
Instituição
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Curso de Engenharia Elétrica.
Coleções
-
TCC Engenharias (5855)
Este item está licenciado na Creative Commons License