Detecção de tweets sobre eventos de trânsito usando word embedding
View/ Open
Date
2018Author
Advisor
Academic level
Graduation
Title alternative
Detection of tweets on Traffic Events usingWord Embedding
Subject
Abstract in Portuguese (Brasil)
O acesso à informações sobre incidentes de trânsito é importante tanto para os usuários quanto para órgãos reguladores de trânsito. Métodos tradicionais de detecção de incidentes requerem grande investimento em infraestrutura. Simultaneamente, usuários de mídias sociais como Twitter compartilham essas informações de forma autônoma. Contudo, a tarefa de identificar essas informações em meio ao grande volume de dados produzidos pelos usuários não é trivial. Considerando isso, o objetivo deste tra ...
O acesso à informações sobre incidentes de trânsito é importante tanto para os usuários quanto para órgãos reguladores de trânsito. Métodos tradicionais de detecção de incidentes requerem grande investimento em infraestrutura. Simultaneamente, usuários de mídias sociais como Twitter compartilham essas informações de forma autônoma. Contudo, a tarefa de identificar essas informações em meio ao grande volume de dados produzidos pelos usuários não é trivial. Considerando isso, o objetivo deste trabalho foi desenvolver um sistema de detecção de publicações na rede social Twitter sobre incidentes de trânsito. Foram selecionados tweets oriundos da cidade de Porto Alegre usando as informações de geolocalização disponível na interface de busca do Twitter. A aplicabilidade da técnica de Word embedding para classificação textual foi analisada, especificamente, as variantes Doc2Vec e fastText. Os resultados são apresentados por meio da comparação dos algoritmos utilizados, levando-se em conta questões como tempo de treinamento dos modelos e F1-score dos modelos. ...
Abstract
Access to information on traffic incidents is important for both users and traffic regulators. Traditional methods of incident detection require large investment in infrastructure. At the same time, social media users as Twitter share this information autonomously. The results are presented by comparing the algorithms used, taking into account questions such as training time and accuracy of the models. The traffic events analyzed were selected from the city of Porto Alegre, geolocation system o ...
Access to information on traffic incidents is important for both users and traffic regulators. Traditional methods of incident detection require large investment in infrastructure. At the same time, social media users as Twitter share this information autonomously. The results are presented by comparing the algorithms used, taking into account questions such as training time and accuracy of the models. The traffic events analyzed were selected from the city of Porto Alegre, geolocation system of Twitter. However, the task of identifying this information in the midst of the large volume of data produced by users is not trivial. Taking that into account, this work objective was developing a system of detection of publications in the social network Twitter about traffic incidents. The applicability of the Word embedding technique for text classification, specifically the Doc2Vec and fastText variants, was analyzed. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Collections
This item is licensed under a Creative Commons License
