Benchmarking Noisy Label Detection Methods

16 out. 2025·
Henrique Pickler
,
Jorge K. S. Kamassury
,
Danilo Silva
· 1 minutos de leitura
Resumo
Este trabalho apresenta um benchmark abrangente para métodos de detecção de rótulos ruidosos, abordando três componentes principais: função de concordância, método de agregação e forma de coleta de informação (in-sample e out-of-sample). A partir dessa decomposição, é proposta uma tarefa padronizada de detecção e uma nova métrica de desempenho, a taxa de falso negativo em ponto de operação fixo. Os resultados mostram que abordagens in-sample com agregação por probabilidade média e margem de logit alcançam melhor desempenho em cenários com ruído sintético e real.
Tipo
Publicação
arXiv preprint arXiv:2510.16211

Preprint que propõe um benchmark abrangente de métodos de detecção de rótulos ruidosos em aprendizado supervisionado. O trabalho decompõe a detecção em três componentes estruturais — função de concordância, método de agregação e tipo de coleta (in-sample vs. out-of-sample) — permitindo uma análise comparativa sistemática. Também introduz uma métrica inédita de avaliação baseada na taxa de falso negativo em ponto de operação fixo. Trabalho em colaboração com o grupo de pesquisa em aprendizado robusto da UFSC, complementando o método CCT com ênfase no aspecto de detecção em vez de treinamento robusto.