Classificação automática de questões do ENADE utilizando o algoritmo KNN
Tipo
TCC
Data de publicação
2021-06-14
Periódico
Citações (Scopus)
Autores
Oliveira, Samuel
Orientador
Frango, Ismar
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Programa
Resumo
Grande parte dos dados gerados digitalmente estao em formato n ˜ ao˜
estruturado, mais precisamente em texto, por conta disso a tarefa de extrair,
analisar e organizar esses dados se torna essencial e trabalhos relacionados
a classificac¸ao de texto vem ganhando cada vez mais destaque. A gerac¸ ˜ ao˜
de dados textuais pode ocorrer de diversas formas devida a vasta quantidade
de documentos dispon´ıveis em forma digital como site de noticias, avaliac¸oes ˜
de clientes, enciclopedias online, redes sociais, etc. e apesar de serem mais ´
dif´ıceis de lidar, uma vez compreendidos os dados textuais podem resultar em
uma fonte rica e complementar aos dados estruturados mais convencionais. No
ambito educacional, podemos citar as avaliac¸ ˆ oes como fonte textual, no Brasil ˜
existem exames aplicados nacionalmente afim de avaliar o n´ıvel educacional
do pa´ıs em diferentes estagios da educac¸ ´ ao. Direcionado ao ensino superior ˜
temos o Exame Nacional de Desempenho dos Estudantes (ENADE), ha diversos ´
trabalhos analisando estatisticamente os resultados desta prova usando como
base os microdados contendo as notas dos exames, quantidade de acertos por
questao, respostas aos question ˜ arios, etc. Em contrapartida, existem poucos ´
trabalhos explorando o conteudo e quest ´ oes da prova em si, em seu formato ˜
bruto de texto. Nesse contexto, o presente trabalho tem como objetivo aplicar
e avaliar o algoritmo k-nearest neighbors (KNN) na tarefa de classificac¸ao das ˜
questoes do ENADE para o curso de Ci ˜ encias da Computac¸ ˆ ao, em seus cinco ˜
anos de aplicac¸ao em temas previamente definidos.
Descrição
Palavras-chave
enade , algoritmo , knn