Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19

dc.contributor.advisorSilva, Leandro Augusto da
dc.contributor.authorSargiani, Vagner
dc.date.accessioned2022-09-27T14:21:00Z
dc.date.available2022-09-27T14:21:00Z
dc.date.issued2022-08-12
dc.description.abstractA classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças.pt_BR
dc.description.sponsorshipIPM - Instituto Presbiteriano Mackenziept_BR
dc.description.sponsorshipMackPesquisa - Fundo Mackenzie de Pesquisapt_BR
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/30606
dc.language.isopt_BRpt_BR
dc.language.isoenpt_BR
dc.publisherUniversidade Presbiteriana Mackenzie
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectTESSOMpt_BR
dc.subjectself-organizing mapspt_BR
dc.subjectentropiapt_BR
dc.subjectXAIpt_BR
dc.subjectsuporte visualpt_BR
dc.subjectCOVID-19pt_BR
dc.subjectmineração de dadospt_BR
dc.titleAlgoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19pt_BR
dc.typeTesept_BR
local.contributor.advisorLatteshttp://lattes.cnpq.br/1396385111251741pt_BR
local.contributor.advisorOrcidhttps://orcid.org/0000-0002-8671-3102pt_BR
local.contributor.authorLatteshttp://lattes.cnpq.br/9363303337287168pt_BR
local.contributor.authorOrcidhttps://orcid.org/0000-0003-2144-9037pt_BR
local.contributor.board1Oliveira, Rogério de
local.contributor.board1Latteshttp://lattes.cnpq.br/3067732992972770pt_BR
local.contributor.board2Kitani, Edson Caoru
local.contributor.board2Latteshttp://lattes.cnpq.br/6731656353508097pt_BR
local.contributor.board3Vallim Filho, Arnaldo Rabello de Aguiar
local.contributor.board3Latteshttp://lattes.cnpq.br/2511892257148568pt_BR
local.contributor.board4Sassi, Renato José
local.contributor.board4Latteshttp://lattes.cnpq.br/8750334661789610pt_BR
local.contributor.board4Orcidhttps://orcid.org/0000-0001-5276-4895pt_BR
local.description.abstractenData classification is an automatic or semi-automatic process that, utilizing Artificial Intelligence algorithms, learns the variable and class relationships of a data set for use a posteriori in situations where the class result is unknown. For many years, work on this topic has been aimed at increasing the hit rate of algorithms. However, when the problem is restricted to application in health care, besides the concern with performance, it is also necessary to design algorithms whose result is understandable by the specia- list responsible for making the decision. Among the problems in the field of medicine, a current research focus is related to COVID-19, in which AI algorithms may contribute to early diagnosis. Among the available COVID data, the blood test is a typical proce- dure performed when the patient seeks the hospital, and its use in the diagnosis allows reducing the need for other diagnostic tests that can impact the detection time and fi- nancial costs. In this work, we propose using Self-Organizing Maps (SOM) to discover attributes in blood test exams that are more relevant for COVID-19 diagnosis. The work applies SOM and entropy calculation in the definition of a hierarchical, semi-supervised and explainable model named TESSOM (Tree-based Entropy Structured Self-Organizing Maps), in which the main feature is enhancing the investigation of groups of cases with a higher level of class overlapping, as far as the diagnostic outcome is concerned. Framing the TESSOM algorithm in the context of Explainable Artificial Intelligence (XAI) makes it possible to explain the results to the expert in a simplified way. It is demonstrated in the work that the use of the TESSOM algorithm to identify attributes of blood tests can help the identification of COVID-19 cases, in addition to having a performance increase of 1.489% in multi scenarios when analyzing a base of 2207 cases from 3 hospitals in the state of S ̃ao Paulo, Brazil. This work is a starting point for researchers to identify rele- vant attributes of blood tests for COVID-19 and to support the diagnosis of other diseases.pt_BR
local.keywordsTESSOMpt_BR
local.keywordsself-organizing mapspt_BR
local.keywordsentropypt_BR
local.keywordsXAIpt_BR
local.keywordsvisual supportpt_BR
local.keywordsCOVID-19pt_BR
local.keywordsdata miningpt_BR
local.publisher.countryBrasil
local.publisher.departmentEscola de Engenharia Mackenzie (EE)pt_BR
local.publisher.initialsUPM
local.publisher.programEngenharia Elétrica e Computaçãopt_BR
local.subject.cnpqEngenharia de Computaçãopt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
VAGNER SARGIANI - protegido.pdf
Tamanho:
19.97 MB
Formato:
Adobe Portable Document Format
Descrição:
Vagner Sargiani
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.95 KB
Formato:
Item-specific license agreed upon to submission
Descrição: