Reconhecimento de padrões aplicados à identificação de patologias de laringe

Sodré, Bruno Ribeiro

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/2013

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Sodré, Bruno Ribeiro	-
dc.date.accessioned	2017-03-02T15:47:37Z	-
dc.date.available	2017-03-02T15:47:37Z	-
dc.date.issued	2016-02-23	-
dc.identifier.citation	SODRÉ, Bruno Ribeiro. Reconhecimento de padrões aplicados à identificação de patologias de laringe. 2016. 108 f. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2016.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/2013	-
dc.description.abstract	Diseases that affect the larynx have been considerably increased in recent years due to the condition of nowadays society where there have been unhealthy habits like smoking, alcohol and tobacco and an increased vocal abuse, perhaps due to the increase in noise pollution, especially in large urban cities. Currently the exam performed by per-oral endoscopy (aimed to identify laryngeal pathologies) have been videolaryngoscopy and videostroboscopy, both invasive and often uncomfortable to the patient. Seeking to improve the comfort of the patients who need to undergo through these procedures, this study aims to identify acoustic patterns that can be applied to the identification of laryngeal pathologies in order to creating a new non-invasive larynx assessment method. Here two different configurations of neural networks were used. The first one was generated from 524.287 combinations of 19 acoustic measurements to classify voices into normal or from a diseased larynx, and achieved an max accuracy of 99.5% (96.99±2.08%). Using 3 and 6 rotated measurements (obtained from the principal components analysis method), the accuracy was 93.98±0.24% and 94.07±0.29%, respectively. With 6 rotated measurements from a previouly standardization of the 19 acoustic measurements, the accuracy was 97.88±1.53%. The second one, to classify 23 different voice types (including normal voices), showed better accuracy in identifying hiperfunctioned larynxes and normal voices, with 58.23±18.98% and 52.15±18.31%, respectively. The worst accuracy was obtained from vocal fatigues, with 0.57±1.99%. Excluding normal voices of the analysis, hyperfunctioned voices remained the most easily identifiable (with an accuracy of 57.3±19.55%) followed by anterior-posterior constriction (with 18.14±11.45%), and the most difficult condition to be identified remained vocal fatigue (with 0.7±2.14%). Re-sampling the neural networks input vectors, it was obtained accuracies of 25.88±10.15%, 21.47±7.58%, and 18.44±6.57% from such networks with 20, 30, and 40 hidden layer neurons, respectively. For comparison, classification using support vector machine produced an accuracy of 67±6.2%. Thus, it was shown that the acoustic measurements need to be improved to achieve better results of classification among the studied laryngeal pathologies. Even so, it was found that is possible to discriminate normal from dysphonic speakers.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Laringe - Doenças - Diagnóstico	pt_BR
dc.subject	Voz	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Métodos de simulação	pt_BR
dc.subject	Reconhecimento automático da voz	pt_BR
dc.subject	Engenharia elétrica	pt_BR
dc.subject	Larynx - Diseases - Diagnosis	pt_BR
dc.subject	Voice	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Simulation methods	pt_BR
dc.subject	Automatic speech recognition	pt_BR
dc.subject	Electric engineering	pt_BR
dc.title	Reconhecimento de padrões aplicados à identificação de patologias de laringe	pt_BR
dc.title.alternative	Pattern recognition applied to the identification of pathologies laryngeal	pt_BR
dc.type	masterThesis	pt_BR
dc.description.resumo	As patologias que afetam a laringe estão aumentando consideravelmente nos últimos anos devido à condição da sociedade atual onde há hábitos não saudáveis como fumo, álcool e tabaco e um abuso vocal cada vez maior, talvez por conta do aumento da poluição sonora, principalmente nos grandes centros urbanos. Atualmente o exame utilizado pela endoscopia per-oral, direcionado a identiﬁcar patologias de laringe, são a videolaringoscopia e videoestroboscopia, ambos invasivos e por muitas vezes desconfortável ao paciente. Buscando melhorar o bem estar e minimizar o desconforto dos pacientes que necessitam submeter-se a estes procedimentos, este estudo tem como objetivo reconhecer padrões que possam ser aplicados à identiﬁcação de patologias de laringe de modo a auxiliar na criação de um novo método não invasivo em substituição ao método atual. Este trabalho utilizará várias conﬁgurações diferentes de redes neurais. A primeira rede neural foi gerada a partir de 524.287 resultados obtidos através das conﬁgurações k-k das 19 medidas acústicas disponíveis neste trabalho. Esta conﬁguração atingiu uma acurácia de 99,5% (média de 96,99±2,08%) ao utilizar uma conﬁguração com 11 e com 12 medidas acústicas dentre as 19 disponíveis. Utilizando-se 3 medidas rotacionadas (obtidas através do método de componentes principais), foi obtido uma acurácia de 93,98±0,24%. Com 6 medidas rotacionadas, o resultado obtido foi de acurácia foi de 94,07±0,29%. Para 6 medidas rotacionadas com entrada normalizada, a acurácia encontrada foi de 97,88±1,53%. A rede neural que fez 23 diferentes classiﬁcações, voz normal mais 22 patologias, mostrou que as melhores classiﬁcações, de acordo com a acurácia, são a da patologia hiperfunção com 58,23±18,98% e a voz normal com 52,15±18,31%. Já para a pior patologia a ser classiﬁcada, encontrou-se a fadiga vocal com 0,57±1,99%. Excluindo-se a voz normal, ou seja, utilizando uma rede neural composta somente por vozes patológicas, a hiperfunção continua sendo a mais facilmente identiﬁcável com uma acurácia de 57,3±19,55%, a segunda patologia mais facilmente identiﬁcável é a constrição ântero-posterior com 18,14±11,45%. Nesta conﬁguração, a patologia mais difícil de se classiﬁcar continua sendo a fadiga vocal com 0,7±2,14%. A rede com re-amostragem obteve uma acurácia de 25,88±10,15% enquanto que a rede com re-amostragem e alteração de neurônios na camada intermediária obteve uma acurácia de 21,47±7,58% para 30 neurônios e uma acurácia de 18,44±6,57% para 40 neurônios. Por ﬁm foi feita uma máquina de vetores suporte que encontrou um resultado de 67±6,2%. Assim, mostrou-se que as medidas acústicas precisam ser aprimoradas para a obtenção de melhores resultados de classiﬁcação dentre as patologias de laringe estudadas. Ainda assim, veriﬁcou-se que é possível discriminar locutores normais daqueles pacientes disfônicos.	pt_BR
dc.degree.local	Curitiba	pt_BR
dc.publisher.local	Curitiba	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/5256915433374524	pt_BR
dc.contributor.advisor1	Silva, Marco José da	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/3660493864159835	pt_BR
dc.contributor.advisor-co1	Rosa, Marcelo de Oliveira	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/0897919842779594	pt_BR
dc.contributor.referee1	Rosa, Marcelo de Oliveira	-
dc.contributor.referee2	Ribeiro, Eduardo Parente	-
dc.contributor.referee3	Mello, Alexandre José Tuoto Silveira	-
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::ELETRONICA INDUSTRIAL, SISTEMAS E CONTROLES ELETRONICOS::AUTOMACAO ELETRONICA DE PROCESSOS ELETRICOS E INDUSTRIAIS	pt_BR
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CT_CPGEI_M_Sodré, Bruno Ribeiro_2016.pdf		1,59 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas