Defesa de Dissertação de Mestrado – Ernesto Gurgel Valente Neto
Data da publicação: 19 de fevereiro de 2025 Categoria: NotíciasTítulo: A New Methodology for Edge Intelligence Data Quality Evaluation in IID and Non-IID Datasets in Federated Learning
Data: 21/02/2025
Horário: 10:00
Local: https://mea.videoconferencia.ufc.br/xueQIU738r
Banca Examinadora:
Julio César Santos dos Anjos (UFC, Orientador)
Solon Alves Peixoto (UFC, Coorientador)
Guilherme de Alencar Barreto (UFC)
Victor Hugo Costa Albuquerque (UFC)
Valderi Reis Quietinho Leithardt (Iscte – Instituto Universitário de Lisboa, Portugal)
Resumo:
Neste estudo, um algoritmo para seleção de qualidade de dados supera desafios intrínsecos ao treinamento de Inteligência Artificial (IA) em ambientes de Aprendizado Federado (FL) em um cenário com dados Independentes e Identicamente Distribuídos (IID) e Não-Independentes e Não-Identicamente Distribuídos (não-IID), onde a seleção de dados de qualidade surge como uma questão central. A utilização de entropia é fundamental em nossa abordagem. O método propõe filtrar dados sem informações relevantes em aplicações de processamento de imagens e reconhecimento de padrões em cenários de Internet das Coisas (IoT) com FL. Através da análise de quatro conjuntos de dados diferentes – MNIST, Fashion-MNIST, CIFAR-10 e CIFAR-100 – a eficácia do algoritmo foi validada, demonstrando uma melhoria significativa na otimização de recursos, redução de custos de comunicação e manutenção de alta precisão e eficiência em condições diversas. Os experimentos indicam uma melhoria média de 50% no desempenho em ambientes de Aprendizado Federado sem trocas de código significativas. Em particular, os resultados no cenário IID com dados centralizados registraram uma perda mínima de precisão de 0,14%, acompanhada de um ganho significativo em eficiência de tempo, variando de pelo menos 42,05% a um máximo de 56,43%. No cenário não-IID com dados descentralizados, foi registrada uma perda mínima de precisão de cerca de 0,05%, seguida de uma redução no tempo de execução de computação variando de um mínimo de 44,76% a um máximo de 55,31%.
Palavras-chave: Data Quality; Deep Learning; Federated Learning; IoT