Estudo comparativo de algoritmos de classificação supervisionada para classificação de polaridade em análise de sentimentos

dc.contributor.advisorAlbuquerque Júnior, Gabriel Alves de
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1399502815770584
dc.contributor.authorAlbuquerque, Rotsen Diego Rodrigues de
dc.contributor.authorLatteshttp://lattes.cnpq.br/6441716676783585
dc.date.accessioned2020-04-03T16:24:52Z
dc.date.available2020-04-03T16:24:52Z
dc.date.issued2019
dc.degree.departamentEstatística e Informática
dc.degree.graduationBacharelado em Sistemas de Informação
dc.degree.grantorUniversidade Federal Rural de Pernambuco
dc.degree.levelGraduacao
dc.degree.localRecife
dc.description.abstractCom o grande aumento de dados na internet, mostra-se uma rica fonte para a avaliação da opinião pública sobre uma entidade específica. Consequentemente, o número de opiniões disponíveis torna impossível uma tomada de decisão se for necessário ler e analisar todas as opiniões. Como o uso de Machine Learning tem sindo bastante usado, irei apresentar um estudo comparativo de dois algoritmos para classificar oscomentários usando técnicas de processamento de linguagem natural e Análise de Sentimentos. O dados obtidos foram obtidos manualmente onde através do site de competições chamado Kaggle temos cerca de 50.000 comentários sobre diversos filmes. Este estudo tem por finalidade usar também os conceitos da ciência de dados e Machine Learning, processamento de linguagem natural e analises de sentimentos para agregar mais informação sobre a industria de entretenimento e cinema. Por isso esses algoritmos foram criados para que seja possível mostrar os resultados para esse domínio nos reviews de filmes registrados no site da grande industria cinematográfica o famoso IMDB. Após a aplicação dos treinos e testes, a máquina teve uma Acuráciade 86% sobre a predição de textos comentados de filmes.
dc.description.abstractxThe huge increase of data on the Internet, it is a rich source for public opinion assessment of a specific subject. Consequently, the number of opinions available makes decision-making impossible if it is necessary to read and analyze all opinions. Since the use of Machine Learning has been widely used, I will present a comparative study of two algorithms for classifying movie comments using techniques of natural language processing and Sentiment Analysis. The data obtained were obtained manually where through the competition site called Kaggle where we have about 50,000 comments on various films. The purpose of this study is also to use the concepts of data science and Machine Learning, natural language processing and sentiment analysis to add more information about the entertainment and film industry. That is why these algorithms were created so that it is possible to show the results for this domain in the of movies comments registered in one big site/platform of movie industry, the famous IMDB. After training and testing, the machine had an accuracy of 86 % on predicting sentiments on commented text from movies.
dc.format.extent44 f.
dc.identifier.citationALBUQUERQUE, Rotsen Diego Rodrigues de. comparativo de algoritmos de classificação supervisionada para classificação de polaridade em análise de sentimentos. 2019. 44 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2019.
dc.identifier.darkflstrmvhttps://n2t.net/ark:/57462/001300000hfn8
dc.identifier.urihttps://repository.ufrpe.br/handle/123456789/2150
dc.language.isopor
dc.publisher.countryBrasil
dc.relation.uriopenAccesspt_BR
dc.rights.licenseAtribuição-NãoComercial-CompartilhaIgual 4.0 Internacional (CC BY-NC-SA 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR
dc.subjectAprendizado do computador
dc.subjectMineração de dados (Computação)
dc.subjectTextos
dc.subjectEmoções
dc.titleEstudo comparativo de algoritmos de classificação supervisionada para classificação de polaridade em análise de sentimentos
dc.typebachelorThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Imagem de Miniatura
Nome:
tcc_rotsendiegorodriguesdealbuquerque.pdf
Tamanho:
1.68 MB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura Disponível
Nome:
license.txt
Tamanho:
1.87 KB
Formato:
Item-specific license agreed upon to submission
Descrição: