Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão

dc.contributor.advisorSilva, Leandro Augusto da
dc.contributor.authorSoares, Letícia Sakamoto
dc.date.accessioned2022-05-23T13:18:26Z
dc.date.available2022-05-23T13:18:26Z
dc.date.issued2021-11-08
dc.description.abstractCom os avanços no âmbito da Inteligência Artificial, Aprendizado de Máquina e outras abordagens analíticas, o algoritmo vem sendo modificado no sentido de substituir um ser humano em diversas tarefas simples e rotineiras. Contudo, há uma discussão no que tange as definições adequadas da justiça de dados, debate este que obtém a atenção de pesquisadores de numerosas áreas, como engenharia de software e direito, sociologia, por exemplo. Em consulta a literatura, nota-se indefinição sobre o significado do termo vieses algorítmicos. Como principais fontes de viés são apontados os dados de treinamento e o processo de construção de ferramentas utilizadas para decisões automatizadas. Sendo assim, enfatiza-se a necessidade de investir no aumento da transparência em todas as etapas da construção do algoritmo, desde a exploração do conjunto de dados até o desenvolvimento e a tomada de decisões, e transcender a objetividade desses elementos como, por exemplo, analisar a desigualdade social estrutural presente em dados. A problemática abordada nesta pesquisa visa atestar que as decisões guiadas por algoritmos sejam mais equitativas, apontando quais as variáveis que as influenciam. Com o objetivo de observar os impactos e influência que dados possam causar nos resultados dos algoritmos de tomada de decisão, existe na literatura uma base de dados de um estudo investigativo feito pela ProPublica sobre a ferramenta COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), pesquisa comumente citada na área de viés algoritmíco. Tomando como base as abordagens de análises da literatura, foi aplicada no conjunto de dados COMPAS uma Análise Exploratória para verificar a existência de desbalanceamento de classe, condição essa confirmada. Posteriormente foi aplicada a técnica de Self Organizing Map (SOM) como ferramenta de exploração dividida em três etapas para compreender o comportamento dos dados. Na primeira etapa, quando os dados estão desbalanceados pela classe e intraclasse, na segunda etapa, quando estão balanceados pela classe, e na terceira etapa, pela intraclasse. Com isso, foi possível observar como cada elemento do conjunto de dados estava disposto e a sua relevância no mapa SOM, e em conjunto com o Coeficiente de Gini compreender quais conjuntos de dados estão mais equitativos.pt_BR
dc.description.sponsorshipMackPesquisa - Fundo Mackenzie de Pesquisapt_BR
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/29275
dc.language.isopt_BRpt_BR
dc.language.isoenpt_BR
dc.publisherUniversidade Presbiteriana Mackenzie
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectviés algorítmicopt_BR
dc.subjectredes neuraispt_BR
dc.subjectrede de Kohonenpt_BR
dc.subjectmapas auto-organizáveis,pt_BR
dc.subjectdiscriminaçãopt_BR
dc.titleEquidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisãopt_BR
dc.typeDissertaçãopt_BR
local.contributor.advisorLatteshttp://lattes.cnpq.br/1396385111251741pt_BR
local.contributor.advisorOrcidhttps://orcid.org/0000-0002-8671-3102pt_BR
local.contributor.authorLatteshttp://lattes.cnpq.br/1942480258890877pt_BR
local.contributor.authorOrcidhttps://orcid.org/0000-0002-3613-8250pt_BR
local.contributor.board1Menezes, Mario Olímpio de
local.contributor.board1Latteshttp://lattes.cnpq.br/4882949829423994pt_BR
local.contributor.board1Orcidhttps://orcid.org/0000-0003-0263-3541pt_BR
local.contributor.board2Sousa, Miguel Angelo de Abreu de
local.contributor.board2Latteshttp://lattes.cnpq.br/0722315364640409pt_BR
local.description.abstractenWith advances in Artificial Intelligence, Machine Learning, and other analytical appro aches, the algorithm has been modified to replace a human being in several simple and routine tasks. However, there is a discussion regarding the appropriate definitions of data justice, a debate that gets the attention of researchers from numerous areas, such as soft ware engineering and law, sociology, for example. In consulting the literature, one notices vagueness about the meaning of the term algorithmic biases. As main sources of biases are pointed out the training data and the construction process of tools used for automated decisions. Thus, it is emphasized the need to invest in increasing transparency in all stages of algorithm construction, from the exploration of the data set to the development and decision-making, and transcend the objectivity of these elements as, for example, analyze the structural social inequality present in data. The problem addressed in this research aims to attest that the decisions guided by algorithms are more equitable, pointing out which variables influence them. In order to observe the impacts and influence that data can cause in the results of decision-making algorithms, there is in the literature a data base of an investigative study done by ProPublica about the tool COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), research commonly cited in the area of algorithmic bias. Based on the literature analysis approaches, an Exploratory Analysis was applied on the COMPAS dataset to verify the existence of class unbalance, and this condition was confirmed. Subsequently, the Self Organizing Map (SOM) techni que was applied as an exploration tool divided into three stages to understand the data behavior. In the first stage, when the data is unbalanced by class and intraclass, in the second stage, when it is balanced by class, and in the third stage, by intraclass. With this, it was possible to observe how each element of the data set was arranged and its relevance in the SOM map, and together with the Gini Coefficient understand which data sets are more equitablept_BR
local.keywordsalgorithmic biaspt_BR
local.keywordsneural networkspt_BR
local.keywordsKohonen networkpt_BR
local.keywordsself-organizing mapspt_BR
local.keywordsdiscriminationpt_BR
local.publisher.countryBrasil
local.publisher.departmentEscola de Engenharia Mackenzie (EE)pt_BR
local.publisher.initialsUPM
local.publisher.programEngenharia Elétrica e Computaçãopt_BR
local.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
LETICIA SAKAMOTO SOARES - protegido.pdf
Tamanho:
1.78 MB
Formato:
Adobe Portable Document Format
Descrição:
Letícia Sakamoto Soares
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.95 KB
Formato:
Item-specific license agreed upon to submission
Descrição: