Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal
dc.contributor.advisor | Laipelt, Rita do Carmo Ferreira | pt_BR |
dc.contributor.author | Rosa, Samuel Santos da | pt_BR |
dc.date.accessioned | 2019-03-30T04:22:48Z | pt_BR |
dc.date.issued | 2018 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/189837 | pt_BR |
dc.description.abstract | Este trabalho tem como objetivo investigar o potencial da análise de logs para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação na área do Direito Penal. Compõem o corpus de análise 882 logs (236 Jornadas dos Usuários) coletados no período de 2 a 24 de setembro de 2017. O avanço tecnológico tem gerado uma constante modificação no comportamento informacional dos usuários, sendo necessária a utilização de métodos que auxiliem na coleta de informações sobre esses usuários. A análise de logs é um desses métodos ao permitir identificar as ações dos usuários de um sistema de informação ao trazer um conteúdo abundante de informações sobre sua interação com o sistema. O percurso metodológico ocorreu através da coleta dos dados junto ao Portal LexML, seguindo da análise de logs, dividida em cinco etapas: 1ª Etapa – Estruturação e Organização: os logs foram agrupados e organizados (estruturação de cabeçalhos); 2ª Etapa – Classificação e Seleção: classificação das expressões de busca utilizadas pelos usuários com base na CDDir; 3ª Etapa – Validação: validação das expressões referentes ao Direito Penal com base no Vocabulário Controlado Básico do Senado Federal; 4ª Etapa – Análise Estatística: identificação das Jornadas dos Usuários, eliminação de outliers e cálculos estatísticos; 5ª Etapa – Análise da Jornada dos Usuários: observação manual de cada jornada. Como resultados foram observados um alto índice de expressões sem termos representados no VCB (54,31%). O assunto mais pesquisado pelos usuários foi ―Infrações contra as pessoas‖ com 191 buscas. No número de interações junto ao sistema identificamos uma média de 3,74 solicitações por usuário e uma média de 11 minutos e 33 segundos por jornada. Verificamos que 48,38% dos usuários modificam sua expressão de busca e que 31,78% dos usuários iniciam a busca de forma geral e posteriormente a tornam especificas. Encontramos também uma média de 4 lexias por expressão e 15,1 por jornada. Quanto ao uso de recursos terminológicos, 24,58% das jornadas utilizam a numeração jurídica. Observamos também um baixo uso de booleanos. Em relação ao uso de modificadores, 3,81% dos usuários não utilizam e na análise de uso de filtros encontramos que 61,44% não fazem uso deste artificio. Identificamos como limitações da análise de logs: delimitação dos usuários e suas jornadas; identificação de robôs de busca; e o desconhecimento das motivações dos usuários. Já como contribuições: a coleta dos dados sem interferência humana; visualização das ações dos usuários; acesso a um grande volume de informações sobre características de busca dos usuários; avaliação do controle terminológico; e a possibilidade de configuração dos dados registrados no arquivo log. Conclui-se que a análise de logs é uma fonte de dados valiosa para o estudo do comportamento de busca em sistemas de informação, ao trazer uma gama de informações disponíveis passiveis de análise. Torna-se, portanto uma metodologia importante na identificação de características de busca dos usuários, que por usa vez são fundamentais para o aperfeiçoamento dos sistemas de recuperação da informação e do processo de indexação. | pt |
dc.description.abstract | This work aims to investigate the potential of log analysis for the study of information searching behaviour of Portal LexML users in the information retrieval in the area of Criminal Law. They compose the analysis corpus 882 logs (236 User Journey) collected in the period from September 2 to 24, 2017. The technological advance has generated a constant modification in the informational behavior of the users, being necessary the use of methods that help in the search of information about these users. The log analysis is one of these methods by allowing the identification of the actions of users of an information system by bringing abundant information about their interaction with the system. The methodological course was carried out through the collection of data from the Portal LexML, followed by log analysis, divided into five stages: 1st Stage – Structuring and Organization: the logs were grouped and organized (structuring headers); 2st Stage – Classification and Selection: classification of search expressions used by users based on CDDir; 3st. Stage – Validation: validation of expressions related to Criminal Law based on the Basic Controlled Vocabulary of the Federal Senate; 4st Stage – Statistical Analysis: identification of User Journey, elimination of outliers and statistical calculations; 5st Stage – User Journey Analysis: manual observation of each journey. As results we observed a high index of expressions without terms represented in the VCB (54,31%). The subject most searched by users was "Offenses against people" with 191 searches. In the number of interactions with the system we identified an average of 3,74 requests per user and an average of 11 minutes and 33 seconds per journey. We verified that 48,38% of the users modified their search expression and that 31,78% of the users initiated the search in general form and subsequently made it specific. We found an average of 4 lexias per expression and 15,1 per journey. As for the use of terminological resources, 24,58% of the journeys use legal numbering. We also noticed a low use of booleans. In relation to the use of modifiers, 3,81% of users do not use and in the analysis of the use of filters we find that 61,44% do not use. We have identified limitations of log analysis: delimitation of users and their journeys; identification of search robots; and unknown motivations of users. Already as contributions: the collection of data without human interference; visualization of user actions; access to a large volume of information about user search characteristics; assessment of terminological control; and the possibility of setting the data recorded in the log file. It is concluded that log analysis is a valuable data source for the study of information searching behaviour, by bringing a range of information available for analysis. It is, therefore, an important methodology in the identification of search characteristics of the users, which for once are fundamental for the improvement of information retrieval systems and the indexing process. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Representação da informação | pt_BR |
dc.subject | Log Analysis | en |
dc.subject | Recuperação da informação | pt_BR |
dc.subject | Information Retrieval Systems | en |
dc.subject | Informação jurídica | pt_BR |
dc.subject | Information Retrieval | en |
dc.subject | Information Searching Behaviour | en |
dc.title | Pegadas de informação digital: a análise de logs como metodologia para o estudo do comportamento de busca em sistemas de informação dos usuários do Portal LexML na recuperação da informação no Direito Penal | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisor-co | Krebs, Luciana Monteiro | pt_BR |
dc.identifier.nrb | 001087779 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Faculdade de Biblioteconomia e Comunicação | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2018 | pt_BR |
dc.degree.graduation | Biblioteconomia | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License
-
TCC Biblioteconomia (816)