Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/40584| Título: | Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules |
| Título(s) alternativo(s): | Avaliação de um modelo de linguagem multimodal de grande escala para detecção e classificação de falhas em módulos fotovoltaicos |
| Autor(es): | Cardoso, Joao Pedro Zanlorensi |
| Orientador(es): | Lazzaretti, André Eugênio |
| Palavras-chave: | Sistemas de energia fotovoltaica Localização de falhas (Engenharia) Células solares Processamento de linguagem natural (Computação) Redes neurais (Computação) Termografia Aprendizado profundo (Aprendizado do computador) Inteligência artificial Photovoltaic power systems Fault location (Engineering) Solar cells Natural language processing (Computer science) Neural networks (Computer science) Thermography Deep learning (Machine learning) Artificial intelligence |
| Data do documento: | 14-Mai-2026 |
| Editor: | Universidade Tecnológica Federal do Paraná |
| Câmpus: | Curitiba |
| Citação: | CARDOSO, Joao Pedro Zanlorensi. Evaluation of a multimodal large language model for fault detection and classification in photovoltaic modules. 2026. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2026. |
| Resumo: | À medida que a geração solar fotovoltaica se expande, a detecção automática e precisa de falhas torna-se cada vez mais importante para evitar a degradação dos módulos e as perdas de energia. Este estudo avalia o uso de Modelos De Linguagem Multimodal De Grande Escala (MLLMs) na detecção de falhas visuais e térmicas em módulos fotovoltaicos, com base em dois conjuntos de dados abertos. Os resultados mostram desempenho promissor, com 80% de acurácia na classificação visual multi-classe no conjunto de dados da UTFPR usando prompting instrucional em zero-shot e 43% de acurácia na classificação de falhas térmicas com inferência descritiva em few-shot no conjunto Infrared Solar Modules, superando trabalhos anteriores em 19 pontos percentuais. Embora as redes CNN ainda apresentem maior acurácia geral, os MLLMs oferecem diagnósticos textuais mais flexíveis e interpretáveis, sem exigir retreinamento extensivo, o que destaca seu potencial para a manutenção inteligente de sistemas solares. |
| Abstract: | As Photovoltaic (PV) solar deployment expands, accurate automated fault detection is increasingly important to avoid module degradation and energy losses. This study evaluates Multimodal Large Language Models (MLLMs) for detecting visual and thermal faults in PV modules using two open datasets. Results show promising performance: 80% accuracy in multi-class visual classification on the UTFPR dataset with zero-shot instructional prompting, and 43% accuracy in thermal fault classification with few-shot descriptive inference on the Infrared Solar Modules dataset, surpassing previous work by 19 percentage points. Although Convolutional Neural Networks (CNNs) still achieve higher raw accuracy, MLLMs offer flexible and interpretable textual diagnoses without extensive retraining, highlighting their potential for intelligent solar maintenance. |
| URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/40584 |
| Aparece nas coleções: | CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| detectionmultimodalfaultphotovoltaic.pdf | 5,8 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons

