Síntese de voz aplicada ao português brasileiro usando aprendizado profundo

Casanova, Edresson

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/12513

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Casanova, Edresson
dc.date.accessioned	2020-11-16T13:09:31Z	-
dc.date.available	2020-11-16T13:09:31Z	-
dc.date.issued	2019-07-01
dc.identifier.citation	CASANOVA, Edresson. Síntese de voz aplicada ao português brasileiro usando aprendizado profundo. 2019. Trabalho de conclusão de Curso (Bacharelado em Ciências da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/12513	-
dc.description.abstract	Deep Artificial Neural Networks have been used to solve a wide range of problems. In particular, such methodology allowed to substantially increase the state of the art in the area of speech synthesis. In this work we explored the state of the art of speech synthesis for Brazilian Portuguese, for this it was necessary to create an audio base containing approximately 10 hours of a single speaker in the language. Deep neural networks are formed by a number of nodes, or units, connected by links, these nodes represent artificial neurons and are arranged in layers connected by sets of weights. A number of models for voice synthesis were investigated, such as DCTTS, Tacotron and Mozilla TTS. Some experiments were proposed to explore the main models of speech synthesis and vocoders in the literature. The results showed that the Mozilla TTS model sounds more natural and performs better than the other explored models, however, the audio quality synthesized by the DCTTS model is very close. In addition, the use of transfer learning from the English to Portuguese was explored, which demonstrate advantages in the application of such technique.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Codificador de voz	pt_BR
dc.subject	Artificial intelligence	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Vocoder	pt_BR
dc.title	Síntese de voz aplicada ao português brasileiro usando aprendizado profundo	pt_BR
dc.title.alternative	Speech synthesis applied to brazilian portuguese using deep learning	pt_BR
dc.type	bachelorThesis	pt_BR
dc.description.resumo	Redes Neurais Artificiais Profundas tem sido utilizadas para solucionar uma ampla gama de problemas. Em particular, tal metodologia permitiu aumentar substancialmente o estado da arte na área de síntese de voz. Neste trabalho explorou-se o estado da arte da síntese de voz para o Português Brasileiro, para tal foi necessário a criação de uma base de áudio contendo aproximadamente 10 horas de um único locutor no idioma. Redes neurais profundas são formadas por um numero de nós, ou unidades, conectados por ligações, estes nós representam neurônios artificiais e são organizados em camadas conectadas por conjuntos de pesos. Uma serie de modelos para síntese de voz foram investigados, a exemplo o DCTTS, o Tacotron e o TTS da Mozilla. Alguns experimentos foram propostos visando explorar os principais modelos de síntese de voz e vocoders da literatura. Os resultados demonstraram que o modelo TTS da Mozilla soa mais natural e possui um melhor desempenho que os demais modelos explorados, entretanto, a qualidade dos áudios sintetizados pelo modelo DCTTS fica muito próxima. Adicionalmente, explorou-se o uso de transferência de aprendizado do idioma Inglês para o Português, o que demonstrou vantagens na aplicação de tal técnica.	pt_BR
dc.degree.local	Medianeira	pt_BR
dc.publisher.local	Medianeira	pt_BR
dc.contributor.advisor1	Candido Junior, Arnaldo
dc.contributor.referee1	Candido Junior, Arnaldo
dc.contributor.referee2	Paula Filho, Pedro Luiz de
dc.contributor.referee3	Aikes Junior, Jorge
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Ciência da Computação	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
Aparece nas coleções:	MD - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
sintesevozportuguesaprendizado.pdf		2,94 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas