Mostrar registro simples

dc.contributor.advisorHugo, Fernando Nevespt_BR
dc.contributor.authorMoreira, Rogério de Freitaspt_BR
dc.date.accessioned2023-12-29T03:22:35Zpt_BR
dc.date.issued2023pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/270551pt_BR
dc.description.abstractIntrodução: Nesta pesquisa foi construída uma aplicação de Ciência de Dados na plataforma Knime, para a investigação e análise dos impactos econômicos da COVID-19 durante os seus primeiros 16 meses da pandemia, em consultórios odontológicos privados do Estado brasileiro do Rio Grande do Sul (RS). Objetivo: Desenvolver e avaliar um aplicativo na plataforma analítica Knime visando identificar e interpretar relações entre diferentes variáveis, presentes em diferentes DBs com dados da distribuição e severidade dos casos de COVID-19 no RS, para inferir se estas variáveis estão associadas com métricas específicas relacionadas ao impacto econômico da pandemia no mercado-alvo. Métodos: Todo o app foi construído no Knime, e todas as etapas foram executadas nele. Foram calculadas as seguintes métricas da COVID-19: a) Incidência, para mensurar a disseminação; b) Taxa de Hospitalização, para avaliar casos severos; e c) Taxa de Letalidade, para quantificar casos extremos. Os 497 municípios do Estado foram clusterizados segundo estas métricas mensais. Também foi aplicada em consultórios privados uma survey sobre retração do mercado. O cruzamento destas fontes de dados permitiu a seleção, configuração, aplicação e comparação da performance de 5 diferentes algoritmos de regressão (linear; polinomial de graus 2, 3 e 4; e logística) e 5 de classificação (k-NN; SVM; Naïve Bayes; MLP e AutoML) para avaliar quais deles tiveram os melhores desempenhos na predição dos efeitos econômicos em função das métricas da COVID-19. Mostrou-se o desenvolvimento de uma abordagem no Knime para um processo de Descoberta de Conhecimento em Bases de Dados (KDD) pelo cruzamento de dados de diferentes fontes (aparentemente não relacionadas). A comparação entre performances, para este dataset, indicou que nenhum algoritmo de regressão, e nem o k-NN ou o SVM alcançaram boas performances; Naïve Bayes teve previsões apenas medianas; porém os algoritmos MLP e AutoML tiveram excelentes níveis de acerto nas predições feitas, respectivamente de 98,18% e de 100%. Conclusão: O aplicativo foi construído com sucesso, porém a escassez de respostas à survey comprometeu a validade externa dos resultados da pesquisa, a qual permitiria predições amplamente acertadas e verificáveis no mercado-alvo. Não foi possível identificar associações estatísticas inequívocas entre as métricas da COVID-19 e dos fluxos nos consultórios. Porém ficou preservada a validade interna, legitimando a contento o objetivo da construção de todo um app no Knime, flexível e facilmente adaptável a outras questões de pesquisa e a outras bases de dados, mesmo por usuários sem treinamento formal em linguagens de programação. Outra meta atingida pela clusterização foi a de constatar a existência de 3 a 4 subgrupos a cujos membros pudessem ser aplicadas políticas similares no enfrentamento dos efeitos pesquisados.pt_BR
dc.description.abstractIntroduction: In this research a Data Science application was built on the Knime platform, for the investigation and analysis of the economic impacts of COVID-19 in the first 16 months of the pandemic, in private dental practices in the Brazilian state of Rio Grande do Sul (RS). Objective: To develop and evaluate an application on the Knime analytic platform aiming to identify and to interpret relationships between different variables, present in different DBs with data on the distribution and severity of COVID-19 cases in RS, to infer whether these variables are associated with specific metrics related to economic impact on the target market. Methods: The entire app was built in Knime, and all steps were run on it. The following COVID-19 metrics were calculated: a) Incidence, to measure dissemination; b) Hospitalization Rate, to assess severe cases; and c) Lethality Rate, to quantify extreme cases. The 497 municipalities in the State were clustered according to these monthly metrics. A survey on market shrinkage was also applied to private dental practices in RS. The cross-linking of these data sources allowed the selection, configuration, application, and performances comparison of 5 different regression algorithms (linear; polynomial of degrees 2, 3, and 4; and logistic) and 5 classification algorithms (k-NN; SVM; Naïve Bayes; MLP, and AutoML) to assess which of them had the best performance in predicting the economic effects as a function of the COVID19 metrics. Results: The research presents the workflow for constructing this application, and its use for: a) clustering the overall COVID-19 data, which generated only 3 to 4 subgroups that maximize intra-group similarities and inter-group dissimilarities; and b) predicting the hit levels in the predictions of the practices' metrics as a function of the COVID-19 metrics. It was shown the development of an approach in Knime for a Knowledge Discovery in Databases (KDD) process by cross-linking data from different (apparently unrelated) sources. The performance comparison for this dataset indicated that no regression algorithm, neither k-NN nor SVM achieved good performances; Naïve Bayes had only average predictions; but the MLP and AutoML algorithms had excellent hit levels on the predictions made, 98.18% and 100%, respectively. Conclusion: The application was successfully built, but the scarcity of survey responses has compromised the external validity of this research's results, which would allow for largely accurate and verifiable predictions in the target market. It was not possible to identify unequivocal statistical associations between COVID-19 metrics and dental offices' inflows. However, the internal validity was preserved, legitimating the goal of building an entire app in Knime, flexible and easily adaptable to other research questions and other databases, even by users with no formal training in programming languages. Another goal achieved by the clustering was to verify the existence of 3 to 4 subgroups to whose members similar policies could be applied to address the studied effects.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectEconomic factorsen
dc.subjectCOVID-19pt_BR
dc.subjectFatores econômicospt_BR
dc.subjectDental offices, privateen
dc.subjectMachine learningen
dc.subjectConsultórios odontológicospt_BR
dc.subjectSetor privadopt_BR
dc.titleImpactos econômicos da covid-19 no mercado odontológico privado no Estado do RS : o desenvolvimento e avaliação de um app low code de data science no knimept_BR
dc.title.alternativeEconomic impacts of covid-19 on the private dental market in Brazilian State of RS : the development and evaluation of a data science low code app on knimeen
dc.typeDissertaçãopt_BR
dc.identifier.nrb001193234pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentFaculdade de Odontologiapt_BR
dc.degree.programPrograma de Pós-Graduação em Odontologiapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2023pt_BR
dc.degree.levelmestradopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples