Comparação de arquiteturas de redes neurais em NER para E-commerce brasileiro

Imagem de Miniatura

Data

2023-04-19

Lattes da Orientação Docente

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Nas plataformas de e-commerce a busca é a etapa mais importante para achar seus produtos, por isso a importância de pesquisas visando sua melhoria, uma das formas de fazer essa melhoria é o uso de query understanding (QU). O QU compreende um conjunto de processos que geralmente ocorrem antes das etapas principais de recuperação de documentos. Assim, o QU é fundamental para classificar e reescrever consultas quando se trata de sistemas de grande volume, como é o caso do domínio de e-commerce, especialmente quando seu foco é enriquecer a entrada fornecida. O Reconhecimento de Entidades Nomeadas (NER) é uma das partes mais importantes do entendimento de consultas, dentre outras etapas de processamento de linguagem natural (PLN). O principal objetivo do NER é possibilitar saber quais entidades ou classes estão presentes em uma consulta. Neste artigo, diferentes tipos de técnicas para NER são avaliados em um conjunto de dados de e-commerce em português, com foco em aspectos práticos para uso industrial. Neste trabalho, serão avaliadas diferentes redes neurais, como CNN do framework Spacy, as redes BI-LSTM-CRF, BI-GRU-CRF do framework PyTorch e diferentes métodos de embbedings, alcançando resultados satisfatórios como 0,97 de f1-score na base de testes.

Resumo em outro idioma

On e-commerce platforms, the search is the most important step to find your products, hence the importance of seeking to improve them. One of the ways to do this is to use query understanding (QU). The QU comprises a set of processes that usually occur before the main document recovery steps. Thus, QU is critical to sorting and rewriting queries. when it comes to large-volume systems, such as the domain of ecommerce, especially when your focus is on enriching the provided input. Named Entity Recognition (NER) is one of the most important parts of understanding queries, among other processing steps of natural language (NLP). The main objective of NER is to make it possible to know which entities or classes are present in a query. In this article, different types of techniques for NER are evaluated on a dataset of e-commerce in Portuguese, focusing on practical aspects for industrial use. For this experiment, the CNN network from the Spacy framework, the BI-LSTM-CRF, BI-GRU-CRF networks from the PyTorch framework and different embedding methods were used, achieving satisfactory results such as 0.97 f1-score in the test base.

Descrição

Referência

LINS, Lucas Fernandes. Comparação de arquiteturas de redes neurais em NER para E-commerce brasileiro. 2023. 30 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2023.

Identificador dARK

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess