Classificação automática de questões do ENADE utilizando o algoritmo KNN
Carregando...
Tipo
TCC
Data
2021-06-14
Autores
Oliveira, Samuel
Orientador
Frango, Ismar
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Programa
Resumo
Grande parte dos dados gerados digitalmente estao em formato n ˜ ao˜
estruturado, mais precisamente em texto, por conta disso a tarefa de extrair,
analisar e organizar esses dados se torna essencial e trabalhos relacionados
a classificac¸ao de texto vem ganhando cada vez mais destaque. A gerac¸ ˜ ao˜
de dados textuais pode ocorrer de diversas formas devida a vasta quantidade
de documentos dispon´ıveis em forma digital como site de noticias, avaliac¸oes ˜
de clientes, enciclopedias online, redes sociais, etc. e apesar de serem mais ´
dif´ıceis de lidar, uma vez compreendidos os dados textuais podem resultar em
uma fonte rica e complementar aos dados estruturados mais convencionais. No
ambito educacional, podemos citar as avaliac¸ ˆ oes como fonte textual, no Brasil ˜
existem exames aplicados nacionalmente afim de avaliar o n´ıvel educacional
do pa´ıs em diferentes estagios da educac¸ ´ ao. Direcionado ao ensino superior ˜
temos o Exame Nacional de Desempenho dos Estudantes (ENADE), ha diversos ´
trabalhos analisando estatisticamente os resultados desta prova usando como
base os microdados contendo as notas dos exames, quantidade de acertos por
questao, respostas aos question ˜ arios, etc. Em contrapartida, existem poucos ´
trabalhos explorando o conteudo e quest ´ oes da prova em si, em seu formato ˜
bruto de texto. Nesse contexto, o presente trabalho tem como objetivo aplicar
e avaliar o algoritmo k-nearest neighbors (KNN) na tarefa de classificac¸ao das ˜
questoes do ENADE para o curso de Ci ˜ encias da Computac¸ ˆ ao, em seus cinco ˜
anos de aplicac¸ao em temas previamente definidos.
Descrição
Palavras-chave
enade , algoritmo , knn