Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina
dc.contributor.advisor | Recamonde-Mendoza, Mariana | pt_BR |
dc.contributor.author | Martins, João Maieron | pt_BR |
dc.date.accessioned | 2024-03-07T05:02:07Z | pt_BR |
dc.date.issued | 2024 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/273006 | pt_BR |
dc.description.abstract | A dengue é uma arbovirose que representa grande perigo à saúde pública no Brasil, onde anualmente são registrados números altíssimos de casos, e surtos têm se tornado cada vez mais recorrentes. Nos últimos anos, técnicas de aprendizado de máquina têm se mostrado muito úteis em esforços de monitoramento e contenção dessa doença. No entanto, esforços do tipo são bastante recentes e há muitos caminhos ainda não explorados. Este trabalho consiste na montagem de modelos preditivos de casos de dengue para todas as unidades federativas do Brasil, com uso das técnicas Random Forest (RF), Support Vector Regressor (SVR) e Long Short-term Memory (LSTM), treinados sobre séries temporais que englobam dados climáticos e números de buscas na Internet. Além de previsões por modelos individuais, foi testada uma modalidade ensemble por macrorregião, a fim de explorar a fundo a possibilidade de previsões nesse nível no país. Realizados os experi mentos, observou-se grande variação de performance sobre cada estado, indicando que há entre eles fortes diferenças na qualidade dos dados ou nas formas como se manifesta a doença, o que torna alguns deles mais favoráveis a predições desse tipo. Percebeu-se leve queda de performance com o uso de ensemble, o que reforçou esse entendimento. Os mo delos conseguiram, sobre uma parcela dos estados, captar bem as tendências temporais, ainda que com discrepâncias nos números exatos de casos. Também comprovaram-se a utilidade de dados do Google Trends e a boa adequação de SVR e LSTM para pes quisas deste tipo. Embora os modelos construídos não sejam precisos o bastante para o monitoramento da dengue, espera-se que as descobertas feitas possam direcionar esforços futuros, com foco nos locais e nas técnicas mais promissoras, para construir modelos mais eficientes. | pt_BR |
dc.description.abstract | Dengue is an arbovirus that poses a significant threat to public health in Brazil, where annually, extremely high numbers of cases are reported, and outbreaks have become in creasingly recurrent. In recent years, machine learning techniques have proven highly useful in monitoring and controlling this disease. However, such efforts are relatively recent, and there are many unexplored avenues. This work involves the construction of predictive models for dengue cases in all Brazilian states, using the Random Forest, Support Vector Regressor, and Long Short-term Memory techniques. These models are trained on time series data that encompass climatic information and Internet search vol umes. In addition to predictions by individual models, a regional ensemble approach was tested to thoroughly explore the possibility of forecasting at this level in the country. Fol lowing the experiments, significant performance variations were observed among states, indicating strong differences in data quality or the manifestation of the disease, making some states more favorable to such predictions. A slight drop in performance with the use of ensembles reinforced this understanding. The models were able to capture temporal trends well in some states, although with discrepancies in the exact numbers of cases. The utility of Google Trends data for such research was also confirmed. While the constructed models may not be accurate enough for dengue monitoring, it is hoped that the findings can guide future efforts, focusing on the most promising locations and techniques to build more efficient models. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Dengue | pt_BR |
dc.subject | Time series | en |
dc.subject | LSTM | en |
dc.subject | Saúde pública | pt_BR |
dc.subject | Modelos preditivos | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.title | Explorando dados climáticos e do Google Trends na predição de casos de dengue no Brasil : uma abordagem com aprendizado de máquina | pt_BR |
dc.title.alternative | Exploring climate and Google Trends data to predict dengue cases in Brazil : a machine learning approach | pt |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.identifier.nrb | 001197737 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2024 | pt_BR |
dc.degree.graduation | Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License
-
TCC Ciência da Computação (1025)