Aplicação de aprendizagem de máquina para desenvolvimento de um framework para identificação de comportamentos maliciosos em rede
dc.contributor.advisor | Ruivo, Eurico Luiz Prospero | |
dc.contributor.author | Lopes, Patrick Estevam | |
dc.date.accessioned | 2024-09-20T23:39:29Z | |
dc.date.available | 2024-09-20T23:39:29Z | |
dc.date.issued | 2024-08-07 | |
dc.description.abstract | As ameaças disparadas por cibercriminosos tem-se intensificado nos últimos cinco anos, e este fato tem relação com o avanço tecnológico das redes de comunicação. Em meio às redes corporativas e até mesmo na conexão com a Internet, os ataques cibernéticos atuam na perspectiva de adquirir informações privadas. O presente trabalho avaliou a possibilidade de uso do conjunto de dados CIC-IDS2017, base de dados comumente empregada para estudos de cibersegurança, para treinamento de modelos de aprendizagem de máquina a serem utilizados em outra base de dados construída com base em informações capturadas por uma ferramenta de monitoramento de tráfego. Observou-se que os desempenhos dos modelos nesse cenário aproximaram-se aos de um classificador aleatório, evidenciando a impossibilidade de transferência de conhecimento conforme proposto. Dessa forma, as mesmas técnicas utilizadas para a base CIC-IDS2017 foram treinadas e testadas com a nova base gerada e seus desempenhos foram comparados. Ainda, com base nas análises executadas sob o novo conjunto de dados, os modelos de aprendizado de máquina, Random Forest (RF), K-Nearest Neighbours (K-NN) e Multi-layer Perceptron (MLP), foram aplicados para identificar comportamentos maliciosos. Os resultados indicam o RF como destaque, com alta acurácia. A validação cruzada por K-Pastas reforçou o desempenho superior do RF, tornando-o uma escolha promissora para ser adicionado como modelo foco na construção de uma ferramenta de identificação de anomalias em rede, intitulada de NGIDS. | |
dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível | |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/39433 | |
dc.language.iso | pt_BR | |
dc.language.iso | en | |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.subject | ataques cibernéticos | |
dc.subject | cibersegurança | |
dc.subject | aprendizagem de máquina | |
dc.title | Aplicação de aprendizagem de máquina para desenvolvimento de um framework para identificação de comportamentos maliciosos em rede | |
dc.type | Dissertação | |
local.contributor.advisorLattes | http://lattes.cnpq.br/5918644808671007 | |
local.contributor.authorLattes | http://lattes.cnpq.br/7430372646274760 | |
local.contributor.board1 | Lopes, Fábio Silva | |
local.contributor.board1Lattes | http://lattes.cnpq.br/2302666201616083 | |
local.contributor.board1Orcid | https://orcid.org/0000-0001-8274-7682 | |
local.contributor.board2 | Martins, Claudio Luis de Meo | |
local.contributor.board2Lattes | http://lattes.cnpq.br/0498967801089430 | |
local.description.abstracten | Threats posed by cybercriminals have intensified in the last five years. This fact is related to the communication networks technological advancement. Amid corporate networks and even Internet connections, cyber-attacks operate from the perspective of acquiring private information. The present work evaluated the possibility of using the CIC-IDS2017 dataset, a database commonly used for cybersecurity studies, for training machine learning models to be used in another database built based on captured information by a traffic monitoring tool. Note that the models performance in this scenario was close to that of a randomly classified one, highlighting the impossibility of transferring knowledge as proposed. Thus, the same techniques used for the CIC-IDS2017 database were trained and tested with the new generated database and their performances were compared. Based on the analyzes performed under the new dataset, the machine learning models, Random Forest (RF), K-Nearest Neighbors (K-NN) and Multi-layer Perceptron (MLP), were applied to identify malicious behaviors. The results indicate RF as a highlight, with high accuracy. K-Folds cross-validation reinforced the RF superior performance, making it a promising choice to be added as a focus model in the construction of a network anomaly identification tool, typical of NGIDS. | |
local.keywords | cyberattacks | |
local.keywords | cybersecurity | |
local.keywords | machine learning | |
local.publisher.country | Brasil | |
local.publisher.department | Escola de Engenharia Mackenzie (EE) | |
local.publisher.initials | UPM | |
local.publisher.program | Engenharia Elétrica e Computação | |
local.subject.cnpq | CNPQ::ENGENHARIAS |