Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules

Cardoso, Joao Pedro Zanlorensi

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40584

Título:	Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules
Título(s) alternativo(s):	Avaliação de um modelo de linguagem multimodal de grande escala para detecção e classificação de falhas em módulos fotovoltaicos
Autor(es):	Cardoso, Joao Pedro Zanlorensi
Orientador(es):	Lazzaretti, André Eugênio
Palavras-chave:	Sistemas de energia fotovoltaica Localização de falhas (Engenharia) Células solares Processamento de linguagem natural (Computação) Redes neurais (Computação) Termografia Aprendizado profundo (Aprendizado do computador) Inteligência artificial Photovoltaic power systems Fault location (Engineering) Solar cells Natural language processing (Computer science) Neural networks (Computer science) Thermography Deep learning (Machine learning) Artificial intelligence
Data do documento:	14-Mai-2026
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	CARDOSO, Joao Pedro Zanlorensi. Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules. 2026. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2026.
Resumo:	À medida que a geração solar fotovoltaica se expande, a detecção automática e precisa de falhas torna-se cada vez mais importante para evitar a degradação dos módulos e as perdas de energia. Este estudo avalia o uso de Modelos De Linguagem Multimodal De Grande Escala (MLLMs) na detecção de falhas visuais e térmicas em módulos fotovoltaicos, com base em dois conjuntos de dados abertos. Os resultados mostram desempenho promissor, com 80% de acurácia na classificação visual multi-classe no conjunto de dados da UTFPR usando prompting instrucional em zero-shot e 43% de acurácia na classificação de falhas térmicas com inferência descritiva em few-shot no conjunto Infrared Solar Modules, superando trabalhos anteriores em 19 pontos percentuais. Embora as redes CNN ainda apresentem maior acurácia geral, os MLLMs oferecem diagnósticos textuais mais flexíveis e interpretáveis, sem exigir retreinamento extensivo, o que destaca seu potencial para a manutenção inteligente de sistemas solares.
Abstract:	As Photovoltaic (PV) solar deployment expands, accurate automated fault detection is increasingly important to avoid module degradation and energy losses. This study evaluates Multimodal Large Language Models (MLLMs) for detecting visual and thermal faults in PV modules using two open datasets. Results show promising performance: 80% accuracy in multi-class visual classification on the UTFPR dataset with zero-shot instructional prompting, and 43% accuracy in thermal fault classification with few-shot descriptive inference on the Infrared Solar Modules dataset, surpassing previous work by 19 percentage points. Although Convolutional Neural Networks (CNNs) still achieve higher raw accuracy, MLLMs offer flexible and interpretable textual diagnoses without extensive retraining, highlighting their potential for intelligent solar maintenance.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/40584
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
detectionmultimodalfaultphotovoltaic.pdf		5,8 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons