Dissertações
URI Permanente desta comunidade
Navegar
Navegando Dissertações por Orientador "Castro, Leandro Nunes de"
Agora exibindo 1 - 3 de 3
Resultados por página
Opções de Ordenação
- DissertaçãoClassificação de gênero em dados do Twitter baseada na extração de meta-atributos textuaisLopes Filho, José Ahirton Batista (2016-02-17)
Escola de Engenharia Mackenzie (EE)
With the growth of social media in recent years, there has been an increase on the interest in the automatic characterization of users based on the informal content they generate. In this context, the labeling of users in demographic categories, such as age, ethnicity, origin and race,and the investigation of other attributes inherent to users, such as political preferences, personality and gender expression, has received a great deal of attention, especially based on Twitter data. The present work focuses on the task of gender classification by using 65 textual meta-attributes, commonly used in text attribution tasks, for the extraction of gender expression linguistic cues in tweets written in Portuguese.The work takes into account characters, syntax, words, structure and morphology, as well as selected psycolinguistic cues of short length, multi-genre, content free texts posted on Twitter to classify author's gender via four different machine-learning algorithms. The proposed meta-attributes in this process are also evaluated. - DissertaçãoUm framework para alocação de portifólios baseada em agrupamento particionalDuarte, Flávio Gabriel (2019-08-15)
Escola de Engenharia Mackenzie (EE)
Essa dissertação propõe um framework baseado em agrupamento particional para a alocação de recursos em um conjunto de ativos a partir da correlação entre eles. O objetivo do framework é fornecer uma técnica de alocação para ajudar investidores a melhorarem seu processo de investimento, sugerindo a alocação usando as informações sobre os grupos gerados a partir de um algoritmo de agrupamento. Este trabalho é diferente das abordagens já propostas na literatura, que utilizam essencialmente algoritmos de agrupamento hierárquico, pois ele está embasado em algoritmos particionais com diferentes propostas para alocação intragrupo e intergrupo. Para determinar o percentual de alocação dos ativos em cada grupo (intragrupo) foram propostas duas técnicas: o método da roleta e o método nebuloso. Para a alocação intergrupo foram utilizados um método baseado na roleta e um método equilibrado. Experimentos foram realizados utilizando dados da Bolsa de Valores Brasileira e os ativos elegíveis para entrarem na alocação foram os que faziam parte do índice Ibovespa no momento do rebalanceamento do portfólio. Os resultados foram comparados com outros métodos de alocação e com o próprio índice Ibovespa. O framework proposto ilustra o potencial das técnicas de aprendizagem de máquina na otimização do portfólio de ações. - DissertaçãoUma heurística de rotulação de builds com resultado não determinísticoCosta , Júlio César de Lima (2020-08-18)
Escola de Engenharia Mackenzie (EE)
The constant search for code integration more and more frequently exposes the need to use automated mechanisms for compiling, running tests, packaging and delivering systems, bringing confidence to those who build and maintain software, as it provides quick feedback on to changes made. Software Engineering describes this process as a build. Because it is a process configured by humans and often also dependent on external services, machine resources and connectivity, they end up becoming sensitive, making some results non-deterministic, a factor that reduces confidence in feedback and increases the need for human research effort. Other areas also suffer loss, such as machine resources and the tomaket team. Given this problem, several studies that use the combination of Software Engineering and Data Science seek to identify non-deterministic results through intelligent algorithms, such as machine learning, thus reducing waste. However, the manual work of labeling builds to be used as input for training steps of the algorithms is quite costly see some cases, even unfeasible. This work proposes a heuristic of collection and automatic labeling of builds with a non-deterministic result and proposes the evolution of the heuristic through the use of clustering algorithms, improving its accuracy by 27%. The results of the labeling of builds with non-deterministic results in two audiences and open source reached a mark of 70% and 100% of accuracy in repositories with 650 and 1224 builds, respectively.