SELEÇÃO DE PADRÕES PARA RESAMPLING EM PROBLEMAS DE CLASSIFICAÇÃO
Título [PT]: SELEÇÃO DE PADRÕES PARA RESAMPLING EM PROBLEMAS DE CLASSIFICAÇÃO
Autor: Vinícius Ferreira da Silva
Palavras-Chave [PT]: classificação, conjuntos desbalanceados, métodos de resampling.
Área de concentração:
Titulação:
Banca:
Prof. Dr. Humberto César Brandão de Oliveira (Orientador)
Prof. Dr. Ricardo Menezes Salgado
Prof. Dr. Eric Batista Ferreira
Resumo:
A classificação de padrões é um ramo da Inteligência Artificial que procura classificar objetos em categorias através de algoritmos inteligentes. Na criação de classificadores de padrões via treinamento supervisionado, o problema do desbalanceamento de dados se dá por conjuntos de treinamento que contém mais exemplos de uma determinada classe do que de outra, formando classes majoritárias e minoritárias. Esta situação pode levar o classificador a ignorar estas classes menos representadas, enquanto classifica eficientemente classes mais representadas. Existem várias técnicas que ajudam a lidar com este problema, sendo o resampling um tipo delas. Dentro do resampling, as abordagens vão desde a replicação de padrões da classe minoritária, até a criação de padrões artificiais, sendo comum a escolha de padrões aleatórios como entrada para tal. Com base nestas informações, este trabalho apresenta uma abordagem para a escolha de padrões, diferente da abordagem aleatória, tendo como base um ambiente desbalanceado. Testes foram realizados e através dos resultados podemos concluir que o método proposto é uma alternativa e que pode auxiliar na aplicação de técnicas de resampling.
Data: 06 de Julho de 2015
Link: SELEÇÃO DE PADRÕES PARA RESAMPLING EM PROBLEMAS DE CLASSIFICAÇÃO