Classificação automática de questões do ENADE utilizando o algoritmo KNN

Imagem de Miniatura
Tipo
TCC
Data
2021-06-14
Autores
Oliveira, Samuel
Orientador
Frango, Ismar
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Programa
Resumo
Grande parte dos dados gerados digitalmente estao em formato n ˜ ao˜ estruturado, mais precisamente em texto, por conta disso a tarefa de extrair, analisar e organizar esses dados se torna essencial e trabalhos relacionados a classificac¸ao de texto vem ganhando cada vez mais destaque. A gerac¸ ˜ ao˜ de dados textuais pode ocorrer de diversas formas devida a vasta quantidade de documentos dispon´ıveis em forma digital como site de noticias, avaliac¸oes ˜ de clientes, enciclopedias online, redes sociais, etc. e apesar de serem mais ´ dif´ıceis de lidar, uma vez compreendidos os dados textuais podem resultar em uma fonte rica e complementar aos dados estruturados mais convencionais. No ambito educacional, podemos citar as avaliac¸ ˆ oes como fonte textual, no Brasil ˜ existem exames aplicados nacionalmente afim de avaliar o n´ıvel educacional do pa´ıs em diferentes estagios da educac¸ ´ ao. Direcionado ao ensino superior ˜ temos o Exame Nacional de Desempenho dos Estudantes (ENADE), ha diversos ´ trabalhos analisando estatisticamente os resultados desta prova usando como base os microdados contendo as notas dos exames, quantidade de acertos por questao, respostas aos question ˜ arios, etc. Em contrapartida, existem poucos ´ trabalhos explorando o conteudo e quest ´ oes da prova em si, em seu formato ˜ bruto de texto. Nesse contexto, o presente trabalho tem como objetivo aplicar e avaliar o algoritmo k-nearest neighbors (KNN) na tarefa de classificac¸ao das ˜ questoes do ENADE para o curso de Ci ˜ encias da Computac¸ ˆ ao, em seus cinco ˜ anos de aplicac¸ao em temas previamente definidos.
Descrição
Palavras-chave
enade , algoritmo , knn
Citação