Classificação automática de questões do ENADE utilizando o  algoritmo KNN

Oliveira, Samuel

Classificação automática de questões do ENADE utilizando o algoritmo KNN

Arquivos

806-Artigo Final-3492-1-4-20210614.pdf(1007.68 KB)

Tipo

TCC

Data de publicação

2021-06-14

Autores

Oliveira, Samuel

Orientador

Frango, Ismar

Resumo

Grande parte dos dados gerados digitalmente estao em formato n ˜ ao˜ estruturado, mais precisamente em texto, por conta disso a tarefa de extrair, analisar e organizar esses dados se torna essencial e trabalhos relacionados a classificac¸ao de texto vem ganhando cada vez mais destaque. A gerac¸ ˜ ao˜ de dados textuais pode ocorrer de diversas formas devida a vasta quantidade de documentos dispon´ıveis em forma digital como site de noticias, avaliac¸oes ˜ de clientes, enciclopedias online, redes sociais, etc. e apesar de serem mais ´ dif´ıceis de lidar, uma vez compreendidos os dados textuais podem resultar em uma fonte rica e complementar aos dados estruturados mais convencionais. No ambito educacional, podemos citar as avaliac¸ ˆ oes como fonte textual, no Brasil ˜ existem exames aplicados nacionalmente afim de avaliar o n´ıvel educacional do pa´ıs em diferentes estagios da educac¸ ´ ao. Direcionado ao ensino superior ˜ temos o Exame Nacional de Desempenho dos Estudantes (ENADE), ha diversos ´ trabalhos analisando estatisticamente os resultados desta prova usando como base os microdados contendo as notas dos exames, quantidade de acertos por questao, respostas aos question ˜ arios, etc. Em contrapartida, existem poucos ´ trabalhos explorando o conteudo e quest ´ oes da prova em si, em seu formato ˜ bruto de texto. Nesse contexto, o presente trabalho tem como objetivo aplicar e avaliar o algoritmo k-nearest neighbors (KNN) na tarefa de classificac¸ao das ˜ questoes do ENADE para o curso de Ci ˜ encias da Computac¸ ˆ ao, em seus cinco ˜ anos de aplicac¸ao em temas previamente definidos.

Palavras-chave

enade , algoritmo , knn

URI

https://dspace.mackenzie.br/handle/10899/31047

Coleções

Ciência da Computação - TCC - FCI Higienópolis

Página do item completo