A Framework for testing Federated Learning algorithms using an edge-like environment

Federated Learning [FL] is a machine learning paradigm where many clients coopera tively train a single centralized model while keeping their data private and decentralized. FL is commonly used in edge computing, which involves placing computer workloads (both hardware and software) as close as possible to the edge, where the data is being created and where actions are occurring, enabling faster response times, greater data privacy, and reduced data transfer costs. However, due to the heterogeneous data dis tributions/contents of clients, it is non-trivial to accurately evaluate the contributions of local models in global centralized model aggregation. This has been a major challenge in FL, commonly known as data imbalance or class imbalance. Previous work has been proposed to address this issue such as Deep Reinforcement Learning (DRL) algorithms to dynamically learn the weight of the contributions of each client at each round. Testing and assessing this FL algorithms can be a very difficult and complex task due to the distributed nature of the systems. In this work, a literature review of these concepts is presented in order to introduce the reader enough context of this challenge and a distributed edge-like environment framework is proposed to assess FL algorithms in a more easy and scalable way. ...

Resumo

O aprendizado federado é um paradigma de aprendizado de máquina em que muitos clientes treinam cooperativamente um único modelo centralizado, mantendo seus dados privados e descentralizados. Ele é comumente usado em computação de borda, que consiste em colocar as cargas de trabalho do computador (hardware e software) o mais próximo possível da borda, onde os dados estão sendo criados e onde as ações estão ocorrendo, permitindo tempos de resposta mais rápidos, maior privacidade de dados e custos de transferência de dados reduzidos. No entanto, devido às distribuições/conteúdos de dados heterogêneos dos clientes, não é trivial avaliar com precisão as contribuições de modelos locais na agregação de modelos centralizados globais. Este tem sido um grande desafio para o paradigma, comumente conhecido como desequilíbrio de dados ou desequilíbrio de classes. Trabalhos anteriores foram propostos para resolver esse problema, como algo ritmos de Deep Reinforcement Learning (DRL) para aprender dinamicamente o peso das contribuições de cada cliente em cada rodada. Testar e avaliar esses algoritmos FL pode ser uma tarefa muito difícil e complexa devido à natureza distribuída dos sistemas. Neste trabalho, uma revisão da literatura desses conceitos é apresentada a fim de apresentar ao leitor o contexto suficiente desse desafio e uma estrutura de ambiente semelhante a uma borda distribuída é proposta para avaliar o desempenho de algoritmos FL de uma maneira mais fácil e escalável. ...

Institución

Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.

Colecciones

Tesinas de Curso de Grado (37618)

Tesinas Ciencia de la Computación (1025)

Otras opciones

Mostrar todos los metadatos

Estatísticas

Este ítem está licenciado en la Creative Commons License