Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32295
Título: Estimativa de produtividade de soja por meio de imagens orbitais e machine learning
Título(s) alternativo(s): Soybean yield estimation using orbital images and machine learning
Autor(es): Batistella, Danielli
Orientador(es): Campos, Jose Ricardo da Rocha
Palavras-chave: Agricultura de precisão
Sensoriamento remoto
Inteligência artificial
Precision farming
Remote sensing
Artificial intelligence
Data do documento: 6-Jul-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Pato Branco
Citação: BATISTELLA, Danielli. Estimativa de produtividade de soja por meio de imagens orbitais e machine learning. 2023. Tese (Doutorado em Agronomia) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2023.
Resumo: Para uma região produtora de soja, estimar, de forma precisa e segura, a produtividade futura de suas lavouras, pode ser muito estratégico sob o ponto de vista comercial, porque gera segurança às cooperativas na comercialização da produção. Nesse sentido, o Sensoriamento Remoto (SR) orbital permite operacionalizar os programas de previsão e monitoramento de safras, além de caracterizar, em tempo hábil, a fenologia de culturas de interesse agronômico. Para tal propósito, tem sido utilizado os métodos de Aprendizado de Máquina (AM) para uma melhor estimativa do estado da cultura e do ambiente para tomada de decisões. Dessa forma, o objetivo geral desse estudo foi aprimorar os métodos de estimativa da produção agrícola da cultura da soja já existentes por meio de imagens orbitais de maior resolução espacial, com dados de referência obtidos por monitores de colheita e processados por meio de algoritmos de AM, de forma a construir modelos de estimativa de safras com maior precisão. O estudo foi realizado no Núcleo Regional de Pato Branco/PR, composto por 15 municípios, localizados no Sudoeste do estado do Paraná. Para determinação das áreas de cultivo da soja foram criados perfis espectrotemporais RGB a partir da geração de imagens de máximo e mínimo NDVI (Normalized Difference Vegetation Index) e EVI (Enhanced Vegetation Index) obtidas do sensor MSI do satélite SENTINEL-2 e classificadas por método supervisionado do algoritmo Random Forest (RF) no aplicativo R Studio. Para gerar os modelos de estimativa de produtividade de soja, foram testados três algoritmos supervisionados de regressão linear por AM, denominados Random Forest (RF), Support Vectors Machine (SVM) e Artificial Neural Networks (ANN) no aplicativo R-Studio. Os dados de entrada para geração dos modelos preditivos foram: os índices de vegetação NDVI, EVI, NDMI (Normalized Difference Moisture Index), tanto do sensor MSI quanto do MODIS (AQUA e TERRA) das áreas de produção agrícola do Núcleo Regional Pato Branco-PR, dados de precipitação, dados de terreno referentes à altitude, tipo de solos, geologia e declividade e, dados reais de produção dos talhões, correspondentes às safras 2019/2020, 2020/2021 e 2021/2022. Os modelos de regressão preditivos foram comparados com à produtividade real dos próprios talhões utilizados no estudo. A estimava de produção gerada para área de estudo, foi comparada com os dados oficiais a nível municipal e regional. O índice NDVI proporciona maior acurácia na determinação das áreas de cultivo da soja quando comparado ao EVI. O algoritmo de AM Random Forest gera um modelo de estimativa de produção com maior precisão quando comparado com os de Support Vectors Machine e Artificial Neural Networks. Os índices de vegetação NDMI, EVI e NDVI se configuraram como importantes variáveis preditoras na construção dos modelos. A utilização de índices de vegetação obtidos por imagens de alta resolução espacial, como o sensor MSI do SENTINEL-2, permite estimar a produção da soja de modo igual e superior as do sensor MODIS do TERRA/AQUA que possuem alta temporalidade quando associadas com algoritmos de Aprendizado Máquina e quando consideram a variabilidade espacial do talhão na variável resposta dos modelos preditivos de regressão linear.
Abstract: For a soy-producing region, accurately and safely estimating the future productivity of its crops can be very strategic from a commercial point of view, because it creates security for cooperatives in producing production. In this sense, orbital Remote Sensing (RS) makes it possible to operationalize crop forecasting and monitoring programs, in addition to characterizing, in a timely manner, the phenology of crops of agronomic interest. For this purpose, Machine Learning (ML) methods have been used to better estimate the state of the crop and the environment for decision making. In this way, the general objective of this study was to improve the existing methods of belief of the agricultural production of the soybean crop through orbital images of higher spatial resolution, with reference data obtained by harvest monitors and processed through ML algorithms, in order to build more accurate yield estimation models. The study was carried out in the Regional Nucleus of Pato Branco/PR, composed of 15 municipalities. To cultivate the soybean cultivation areas, RGB spectro-temporal profiles were created from the generation of maximum and minimum NDVI (Normalized Difference Vegetation Index) and EVI (Enhanced Vegetation Index) images transmitted from the MSI sensor of the SENTINEL-2 satellite and classified by supervised method of the Random Forest (RF) algorithm in the R Studio application. To generate soybean yield estimation models, three supervised AM linear regression algorithms called RF; Support Vectors Machine (SVM) and Artificial Neural Networks (ANN) in the R-Studio app. The input data were used to generate the predictive models: the NDVI, EVI, NDMI (Normalized Difference Moisture Index) vegetation indices, both from the MSI and MODIS sensors (AQUA and TERRA) of the agricultural production areas in the region of Pato Branco -PR, precipitation data, terrain data referring to altitude, soil type, geology and slope, and actual plot production data, corresponding to the 2019/2020, 2020/2021 and 2021/2022 harvests. The predictive regression models were compared with the actual productivity of the plots used in the study. The production estimate generated for the study area was detected with official data at municipal and regional level. The NDVI index provides greater accuracy in the experience of soybean growing areas when compared to the EVI. The ML Random Forest algorithm generates a more accurate production estimation model when compared to Artificial Neural Networks and Support Vector Machines. The NDMI, EVI and NDVI vegetation indices are important predictors of variables in the construction of the models. The use of vegetation indices obtained from high spatial resolution images, such as the MSI of SENTINEL-2, allows estimating soybean production in an equal and superior way to that of the MODIS sensor of TERRA/AQUA, which have high temporality when associated with algorithms for Machine Learning and when to consider the spatial variability of the field in the response variable of predictive linear regression models.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/32295
Aparece nas coleções:PB - Programa de Pós-Graduação em Agronomia

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
estimativadeprodutividadedesoja.pdf2,07 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons