Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
dc.contributor.advisor | Silva, Leandro Augusto da | |
dc.contributor.author | Sargiani, Vagner | |
dc.date.accessioned | 2022-09-27T14:21:00Z | |
dc.date.available | 2022-09-27T14:21:00Z | |
dc.date.issued | 2022-08-12 | |
dc.description.abstract | A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças. | pt_BR |
dc.description.sponsorship | IPM - Instituto Presbiteriano Mackenzie | pt_BR |
dc.description.sponsorship | MackPesquisa - Fundo Mackenzie de Pesquisa | pt_BR |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/30606 | |
dc.language.iso | pt_BR | pt_BR |
dc.language.iso | en | pt_BR |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | TESSOM | pt_BR |
dc.subject | self-organizing maps | pt_BR |
dc.subject | entropia | pt_BR |
dc.subject | XAI | pt_BR |
dc.subject | suporte visual | pt_BR |
dc.subject | COVID-19 | pt_BR |
dc.subject | mineração de dados | pt_BR |
dc.title | Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 | pt_BR |
dc.type | Tese | pt_BR |
local.contributor.advisorLattes | http://lattes.cnpq.br/1396385111251741 | pt_BR |
local.contributor.advisorOrcid | https://orcid.org/0000-0002-8671-3102 | pt_BR |
local.contributor.authorLattes | http://lattes.cnpq.br/9363303337287168 | pt_BR |
local.contributor.authorOrcid | https://orcid.org/0000-0003-2144-9037 | pt_BR |
local.contributor.board1 | Oliveira, Rogério de | |
local.contributor.board1Lattes | http://lattes.cnpq.br/3067732992972770 | pt_BR |
local.contributor.board2 | Kitani, Edson Caoru | |
local.contributor.board2Lattes | http://lattes.cnpq.br/6731656353508097 | pt_BR |
local.contributor.board3 | Vallim Filho, Arnaldo Rabello de Aguiar | |
local.contributor.board3Lattes | http://lattes.cnpq.br/2511892257148568 | pt_BR |
local.contributor.board4 | Sassi, Renato José | |
local.contributor.board4Lattes | http://lattes.cnpq.br/8750334661789610 | pt_BR |
local.contributor.board4Orcid | https://orcid.org/0000-0001-5276-4895 | pt_BR |
local.description.abstracten | Data classification is an automatic or semi-automatic process that, utilizing Artificial Intelligence algorithms, learns the variable and class relationships of a data set for use a posteriori in situations where the class result is unknown. For many years, work on this topic has been aimed at increasing the hit rate of algorithms. However, when the problem is restricted to application in health care, besides the concern with performance, it is also necessary to design algorithms whose result is understandable by the specia- list responsible for making the decision. Among the problems in the field of medicine, a current research focus is related to COVID-19, in which AI algorithms may contribute to early diagnosis. Among the available COVID data, the blood test is a typical proce- dure performed when the patient seeks the hospital, and its use in the diagnosis allows reducing the need for other diagnostic tests that can impact the detection time and fi- nancial costs. In this work, we propose using Self-Organizing Maps (SOM) to discover attributes in blood test exams that are more relevant for COVID-19 diagnosis. The work applies SOM and entropy calculation in the definition of a hierarchical, semi-supervised and explainable model named TESSOM (Tree-based Entropy Structured Self-Organizing Maps), in which the main feature is enhancing the investigation of groups of cases with a higher level of class overlapping, as far as the diagnostic outcome is concerned. Framing the TESSOM algorithm in the context of Explainable Artificial Intelligence (XAI) makes it possible to explain the results to the expert in a simplified way. It is demonstrated in the work that the use of the TESSOM algorithm to identify attributes of blood tests can help the identification of COVID-19 cases, in addition to having a performance increase of 1.489% in multi scenarios when analyzing a base of 2207 cases from 3 hospitals in the state of S ̃ao Paulo, Brazil. This work is a starting point for researchers to identify rele- vant attributes of blood tests for COVID-19 and to support the diagnosis of other diseases. | pt_BR |
local.keywords | TESSOM | pt_BR |
local.keywords | self-organizing maps | pt_BR |
local.keywords | entropy | pt_BR |
local.keywords | XAI | pt_BR |
local.keywords | visual support | pt_BR |
local.keywords | COVID-19 | pt_BR |
local.keywords | data mining | pt_BR |
local.publisher.country | Brasil | |
local.publisher.department | Escola de Engenharia Mackenzie (EE) | pt_BR |
local.publisher.initials | UPM | |
local.publisher.program | Engenharia Elétrica e Computação | pt_BR |
local.subject.cnpq | Engenharia de Computação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- VAGNER SARGIANI - protegido.pdf
- Tamanho:
- 19.97 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Vagner Sargiani
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.95 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: