Aplicação de aprendizagem de máquina para desenvolvimento de um framework para identificação de comportamentos maliciosos em rede

dc.contributor.advisorRuivo, Eurico Luiz Prospero
dc.contributor.authorLopes, Patrick Estevam
dc.date.accessioned2024-09-20T23:39:29Z
dc.date.available2024-09-20T23:39:29Z
dc.date.issued2024-08-07
dc.description.abstractAs ameaças disparadas por cibercriminosos tem-se intensificado nos últimos cinco anos, e este fato tem relação com o avanço tecnológico das redes de comunicação. Em meio às redes corporativas e até mesmo na conexão com a Internet, os ataques cibernéticos atuam na perspectiva de adquirir informações privadas. O presente trabalho avaliou a possibilidade de uso do conjunto de dados CIC-IDS2017, base de dados comumente empregada para estudos de cibersegurança, para treinamento de modelos de aprendizagem de máquina a serem utilizados em outra base de dados construída com base em informações capturadas por uma ferramenta de monitoramento de tráfego. Observou-se que os desempenhos dos modelos nesse cenário aproximaram-se aos de um classificador aleatório, evidenciando a impossibilidade de transferência de conhecimento conforme proposto. Dessa forma, as mesmas técnicas utilizadas para a base CIC-IDS2017 foram treinadas e testadas com a nova base gerada e seus desempenhos foram comparados. Ainda, com base nas análises executadas sob o novo conjunto de dados, os modelos de aprendizado de máquina, Random Forest (RF), K-Nearest Neighbours (K-NN) e Multi-layer Perceptron (MLP), foram aplicados para identificar comportamentos maliciosos. Os resultados indicam o RF como destaque, com alta acurácia. A validação cruzada por K-Pastas reforçou o desempenho superior do RF, tornando-o uma escolha promissora para ser adicionado como modelo foco na construção de uma ferramenta de identificação de anomalias em rede, intitulada de NGIDS.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/39433
dc.language.isopt_BR
dc.language.isoen
dc.publisherUniversidade Presbiteriana Mackenzie
dc.subjectataques cibernéticos
dc.subjectcibersegurança
dc.subjectaprendizagem de máquina
dc.titleAplicação de aprendizagem de máquina para desenvolvimento de um framework para identificação de comportamentos maliciosos em rede
dc.typeDissertação
local.contributor.advisorLatteshttp://lattes.cnpq.br/5918644808671007
local.contributor.authorLatteshttp://lattes.cnpq.br/7430372646274760
local.contributor.board1Lopes, Fábio Silva
local.contributor.board1Latteshttp://lattes.cnpq.br/2302666201616083
local.contributor.board1Orcidhttps://orcid.org/0000-0001-8274-7682
local.contributor.board2Martins, Claudio Luis de Meo
local.contributor.board2Latteshttp://lattes.cnpq.br/0498967801089430
local.description.abstractenThreats posed by cybercriminals have intensified in the last five years. This fact is related to the communication networks technological advancement. Amid corporate networks and even Internet connections, cyber-attacks operate from the perspective of acquiring private information. The present work evaluated the possibility of using the CIC-IDS2017 dataset, a database commonly used for cybersecurity studies, for training machine learning models to be used in another database built based on captured information by a traffic monitoring tool. Note that the models performance in this scenario was close to that of a randomly classified one, highlighting the impossibility of transferring knowledge as proposed. Thus, the same techniques used for the CIC-IDS2017 database were trained and tested with the new generated database and their performances were compared. Based on the analyzes performed under the new dataset, the machine learning models, Random Forest (RF), K-Nearest Neighbors (K-NN) and Multi-layer Perceptron (MLP), were applied to identify malicious behaviors. The results indicate RF as a highlight, with high accuracy. K-Folds cross-validation reinforced the RF superior performance, making it a promising choice to be added as a focus model in the construction of a network anomaly identification tool, typical of NGIDS.
local.keywordscyberattacks
local.keywordscybersecurity
local.keywordsmachine learning
local.publisher.countryBrasil
local.publisher.departmentEscola de Engenharia Mackenzie (EE)
local.publisher.initialsUPM
local.publisher.programEngenharia Elétrica e Computação
local.subject.cnpqCNPQ::ENGENHARIAS
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
PATRICK ESTEVAM LOPES - protegido.pdf
Size:
1.23 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
2.22 KB
Format:
Item-specific license agreed upon to submission
Description: