Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40584
Título: Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules
Título(s) alternativo(s): Avaliação de um modelo de linguagem multimodal de grande escala para detecção e classificação de falhas em módulos fotovoltaicos
Autor(es): Cardoso, Joao Pedro Zanlorensi
Orientador(es): Lazzaretti, André Eugênio
Palavras-chave: Sistemas de energia fotovoltaica
Localização de falhas (Engenharia)
Células solares
Processamento de linguagem natural (Computação)
Redes neurais (Computação)
Termografia
Aprendizado profundo (Aprendizado do computador)
Inteligência artificial
Photovoltaic power systems
Fault location (Engineering)
Solar cells
Natural language processing (Computer science)
Neural networks (Computer science)
Thermography
Deep learning (Machine learning)
Artificial intelligence
Data do documento: 14-Mai-2026
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: CARDOSO, Joao Pedro Zanlorensi. Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules. 2026. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2026.
Resumo: À medida que a geração solar fotovoltaica se expande, a detecção automática e precisa de falhas torna-se cada vez mais importante para evitar a degradação dos módulos e as perdas de energia. Este estudo avalia o uso de Modelos De Linguagem Multimodal De Grande Escala (MLLMs) na detecção de falhas visuais e térmicas em módulos fotovoltaicos, com base em dois conjuntos de dados abertos. Os resultados mostram desempenho promissor, com 80% de acurácia na classificação visual multi-classe no conjunto de dados da UTFPR usando prompting instrucional em zero-shot e 43% de acurácia na classificação de falhas térmicas com inferência descritiva em few-shot no conjunto Infrared Solar Modules, superando trabalhos anteriores em 19 pontos percentuais. Embora as redes CNN ainda apresentem maior acurácia geral, os MLLMs oferecem diagnósticos textuais mais flexíveis e interpretáveis, sem exigir retreinamento extensivo, o que destaca seu potencial para a manutenção inteligente de sistemas solares.
Abstract: As Photovoltaic (PV) solar deployment expands, accurate automated fault detection is increasingly important to avoid module degradation and energy losses. This study evaluates Multimodal Large Language Models (MLLMs) for detecting visual and thermal faults in PV modules using two open datasets. Results show promising performance: 80% accuracy in multi-class visual classification on the UTFPR dataset with zero-shot instructional prompting, and 43% accuracy in thermal fault classification with few-shot descriptive inference on the Infrared Solar Modules dataset, surpassing previous work by 19 percentage points. Although Convolutional Neural Networks (CNNs) still achieve higher raw accuracy, MLLMs offer flexible and interpretable textual diagnoses without extensive retraining, highlighting their potential for intelligent solar maintenance.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40584
Aparece nas coleções:CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
detectionmultimodalfaultphotovoltaic.pdf5,8 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons