Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão
Carregando...
Tipo
Dissertação
Data de publicação
2021-11-08
Periódico
Citações (Scopus)
Autores
Soares, Letícia Sakamoto
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Menezes, Mario Olímpio de
Sousa, Miguel Angelo de Abreu de
Sousa, Miguel Angelo de Abreu de
Programa
Engenharia Elétrica e Computação
Resumo
Com os avanços no âmbito da Inteligência Artificial, Aprendizado de Máquina e outras abordagens analíticas, o algoritmo vem sendo modificado no sentido de substituir um ser humano em diversas tarefas simples e rotineiras. Contudo, há uma discussão no que tange as definições adequadas da justiça de dados, debate este que obtém a atenção de pesquisadores de numerosas áreas, como engenharia de software e direito, sociologia, por exemplo. Em consulta a literatura, nota-se indefinição sobre o significado do termo vieses algorítmicos. Como principais fontes de viés são apontados os dados de treinamento e o processo de construção de ferramentas utilizadas para decisões automatizadas. Sendo assim, enfatiza-se a necessidade de investir no aumento da transparência em todas as etapas da construção do algoritmo, desde a exploração do conjunto de dados até o desenvolvimento e a tomada de decisões, e transcender a objetividade desses elementos como, por exemplo, analisar a desigualdade social estrutural presente em dados. A problemática abordada nesta pesquisa visa atestar que as decisões guiadas por algoritmos sejam mais equitativas, apontando quais as variáveis que as influenciam. Com o objetivo de observar os impactos e influência que dados possam causar nos resultados dos algoritmos de tomada de decisão, existe na literatura uma base de dados de um estudo investigativo feito pela ProPublica sobre a ferramenta COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), pesquisa comumente citada na área de viés algoritmíco. Tomando como base as abordagens de análises da literatura, foi aplicada no conjunto de dados COMPAS uma Análise Exploratória para verificar a existência de desbalanceamento de classe, condição essa confirmada. Posteriormente foi aplicada a técnica de Self Organizing Map (SOM) como ferramenta de exploração dividida em três etapas para compreender o comportamento dos dados. Na primeira etapa, quando os dados estão desbalanceados pela classe e intraclasse, na segunda etapa, quando estão balanceados pela classe, e na terceira etapa, pela intraclasse. Com isso, foi possível observar como cada elemento do conjunto de dados estava disposto e a sua relevância no mapa SOM, e em conjunto com o Coeficiente de Gini compreender quais conjuntos de dados estão mais equitativos.
Descrição
Palavras-chave
viés algorítmico , redes neurais , rede de Kohonen , mapas auto-organizáveis, , discriminação