Show simple item record

dc.contributor.authorCosta, Rita Carolinapt_BR
dc.contributor.authorBarros, Thiago Henrique Bragatopt_BR
dc.contributor.authorFileto, Renatopt_BR
dc.date.accessioned2025-03-21T06:49:44Zpt_BR
dc.date.issued2024pt_BR
dc.identifier.issn1981-1640pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/288776pt_BR
dc.description.abstractNo campo em rápida evolução do Processamento de Linguagem Natural (PLN), entender o domínio da similaridade semântica é de extrema importância tanto para aplicações acadêmicas quanto industriais. Este artigo apresenta uma análise abrangente do domínio da similaridade semântica, integrando uma abordagem multidisciplinar que abrange conceitos-chave, inter-relações entre essas facetas, partes interessadas, práticas de informação e sistemas de classificação existentes. Elucidamos as ideias centrais, como similaridade léxica e sintática, embeddings e várias métricas de similaridade, e demonstramos como elas estão inter-relacionadas. O artigo também identifica e caracteriza a diversa gama de partes interessadas envolvidas neste domínio, desde pesquisadores acadêmicos e líderes técnicos até formuladores de políticas e comunidades de código aberto. Além disso, exploramos como a informação é disseminada e usada dentro deste domínio, incluindo um exame das tendências de publicação de pesquisas e relatórios industriais.Por fim, o artigo avalia os sistemas de classificação e ontologias existentes que estruturam o conhecimento neste campo. Nossas descobertas visam servir como uma estrutura fundamental para futuras pesquisas, desenvolvimentos e considerações éticas no domínio da similaridade semântica. Esta análise profunda aspira orientar tanto recém-chegados quanto especialistas experientes pelo intrincado panorama da similaridade semântica, contribuindo assim para o avanço holístico do campo.pt_BR
dc.description.abstractIn the rapidly evolving field of Natural Language Processing (NLP), understanding the domain of semantic similarity is of paramount importance for both academic and industrial applications. This article presents a comprehensive domain analysis of semantic similarity, integrating a multidisciplinary approach that encompasses key concepts, interrelations among these facets, stakeholders, information practices, and existing classification systems. We elucidate the core ideas, such as lexical and syntactic similarity, embeddings, and various similarity metrics, and demonstrate their interrelatedness. The paper also identifies and characterizes the diverse array of stakeholders involved in this domain, from academic researchers and tech leads to policymakers and open-source communities. Furthermore, we explore how information is disseminated and used within this domain, including an examination of research publication trends and industry reports. Lastly, the article assesses existing classification systems and ontologies that structure the knowledge in this field. Our findings serve as a foundational framework for future research, development, and ethical considerations in the semantic similarity domain. This in-depth analysis aspires to guide both newcomers and seasoned experts through the intricate landscape of semantic similarity, thereby contributing to the field's holistic advancement.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoengpt_BR
dc.relation.ispartofBrazilian Journal of Information Science: research trends. Marília, SP: UNESP, Faculdade de Filosofia e Ciências. Vol. 18 (2024), e024024pt_BR
dc.rightsOpen Accessen
dc.subjectOrganização do conhecimentopt_BR
dc.subjectDomain analysisen
dc.subjectSemantic similarityen
dc.subjectNatural language processingen
dc.subjectKnowledge organizationen
dc.titleSemantic similarity : a domain analysispt_BR
dc.title.alternativeSimilaridade semântica : uma análise de domíniopt
dc.typeArtigo de periódicopt_BR
dc.identifier.nrb001208875pt_BR
dc.type.originNacionalpt_BR


Files in this item

Thumbnail
   

This item is licensed under a Creative Commons License

Show simple item record