Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse

Boos, Rodrigo Augusto Scheller

dc.contributor.advisor	Recamonde-Mendoza, Mariana	pt_BR
dc.contributor.author	Boos, Rodrigo Augusto Scheller	pt_BR
dc.date.accessioned	2017-09-28T02:27:44Z	pt_BR
dc.date.issued	2017	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/168959	pt_BR
dc.description.abstract	Em alguns cenários envolvendo aprendizado de máquina, os dados a serem analisados podem estar sendo adquiridos e analisados de forma distribuída, tal que o conjunto de atributos de cada instância pode não estar completamente disponível em uma localização central, seja por motivos de confidencialidade ou de custos computacionais envolvidos na comunicação de grandes volumes de dados. Neste contexto, surge o problema de como realizar a classificação de novas instâncias de forma descentralizada, utilizando informações contidas em diferentes sítios ou bases de dados a fim de viabilizar a tarefa de classificação sem o comprometimento do seu desempenho. O objetivo principal deste trabalho é analisar diferentes abordagens baseadas na Teoria da Escolha Social para extrair um consenso a partir de um conjunto de modelos de classificação treinados em sítios distintos, utilizando apenas o subconjunto de atributos disponível localmente, focando especificamente em problemas de classificação multiclasse. Seguindo esta direção, a classificação de dados descentralizados ocorre em duas etapas: primeiramente os modelos treinados localmente são aplicados aos novos dados apresentados para predizer as classes correspondentes, e em um segundo momento estas predições são centralizadas e agregadas através de funções de escolha social a fim de se obter um resultado global. Os resultados dos experimentos realizados demonstram bom desempenho do método para diversos casos de teste obtidos do UCI Machine Learning Repository, tendo como principal conclusão que as funções de escolha social são boas agregadoras para conjuntos de dados com classes balanceadas, e que para cenários caracterizados por desbalanceamento de classes o método da pluralidade é mais promissor.	pt_BR
dc.description.abstract	In some scenarios involving machine learning, the data to be analyzed may be acquired and analyzed in a distributed fashion, such that the set of attributes of each instance may not be completely available in a central facility, either due to confidentiality reasons or computational costs involved in the communication of large volumes of data. In this context, the problem that arises is how to perform the classification of new instances in a decentralized way, using information contained in different sites or databases in order to enable the classification task without compromising its performance. The main goal of this work is to analyze different approaches based on the Social Choice Theory to extract a consensus from a set of classification models trained in distinct sites, using only the subset of features available locally, focusing specifically on multiclass classification problems. Following this direction, the classification of decentralized data takes place in two stages: locally trained models are applied to the new data presented, in order to predict their corresponding classes; and in a second moment these predictions are centralized and aggregated through social choice functions in order to obtain a global result. Our results demonstrate good performance of the proposed method for several test cases from the UCI Machine Learning Repository, and the main conclusion of this work is that the social choice functions are good aggregators for datasets with balanced classes, while plurality is the most promising aggregation method for datasets characterized by large class imbalance.	en
dc.format.mimetype	application/pdf
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Machine learning	en
dc.subject	Sistemas : Informação	pt_BR
dc.subject	Aprendizado : máquina	pt_BR
dc.subject	Multiclass classification	en
dc.subject	Distributed classification	en
dc.subject	Social choice functions	en
dc.subject	Supervised learning	en
dc.title	Funções de escolha social para elaboração de consenso em aprendizado de máquina descentralizado : um estudo em problemas de classificação multiclasse	pt_BR
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.identifier.nrb	001048288	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2017	pt_BR
dc.degree.graduation	Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Nome:: 001048288.pdf
Tamanho:: 2.047Mb
Formato:: PDF
Descrição:: Texto completo

Visualizar/abrir

Este item está licenciado na Creative Commons License

Trabalhos de Conclusão de Curso de Graduação (36113)

TCC Ciência da Computação (991)

Mostrar registro simples