HSSMATCH: um modelo híbrido para semantic schema matching em arquiteturas orientadas a microsserviços
Date
2020-02-06Author
Borges, Paulo Renato Soares
Advisor
Silveira, Ismar Frango
Referee
Silva, Leandro Nunes de Castro
Referee
Omar, Nizam
Referee
Motz, Regina
Referee
Cechinel, Cristian
Metadata
Show full item recordAbstract
Os ecossistemas de software da atualidade possuem estilo arquitetural de
microsserviços e características específicas, sistemas e dados distribuídos em
diferentes fontes, o que dificulta o gerenciamento de dados. Como os modelos
conceituais do mundo real são diferentes entre os sistemas, há problemas para
integrar os dados e realizar a comunicação entre esses microsserviços, o que
implica na necessidade de matching entre os esquemas e mensagens. A
literatura evidencia problemas de matching como o tamanho do espaço de
busca, a heterogeneidade semântica dos dados, e as atualizações pelas quais
os esquemas passam constantemente, e mostra como lacunas a inadequação
das interfaces de usuários, a acomodação de alterações nas estruturas de
dados, e, ainda, a escassez de abordagens para uso prático. Assim, o presente
estudo teve por objetivo é apresentar um modelo híbrido de semantic schema
matching para microsserviços com capacidade de identificar similaridades entre
os elementos de dois esquemas em larga escala, que suporte a atualização dos
esquemas e seus dados e, considere os resultados da validação humana para
reuso. Para tanto, foi apresentada a arquitetura do modelo HSSMatch e
implementado o protótipo do HSSMatch System que permite ao usuário, por
meio de uma interface gráfica Web, gerenciar o processo de schema matching
de microsserviços. A avaliação desse protótipo, no que se refere à sua
adequação de design de interação, foi feita por meio de experimentos e
questionários aplicados a usuários que atuam na área de integração de dados e
comunicação entre sistemas de software. A avaliação também foi realizada em
experimentos com dois datasets, e mostrou aspectos que confirmam a hipótese
deste estudo, pois verificou-se melhoria na eficiência e eficácia do processo de
schema matching utilizando a abordagem híbrida que acomoda alterações nos
dados, reduz o espaço de busca e combina matchers em nível de esquema e de
instâncias. Como trabalhos futuros, podem ser explorados métodos
supervisionados de aprendizado de máquina para configuração semiautomática
de estratégias de schema matching, e ainda outras técnicas de particionamento
de esquemas, ontologias de domínio em prol da melhoria da qualidade do
resultado de schema matching para domínios específicos. Today's software ecosystems have an architectural style of microservices and
specific characteristics, systems and data distributed across different sources,
making data management difficult. Because real-world conceptual models differ
across systems, there are problems integrating data and carrying out
communication between these microservices, which implies the need for
matching between schemas and messages. The literature highlights matching
problems such as search space size, semantic heterogeneity of data, and
updates that schemas constantly go through, and shows as gaps the inadequacy
of the user interfaces, the accommodation of changes in data structures, and the
scarcity of approaches for practical use. Thus, the present study aimed to present
a hybrid model of semantic schema matching for microservices with the ability to
identify similarities between the elements of two large-scale schemes that
supports the updating of the schemes and their data and considers the results of
human validation for reuse. For this, the architecture of the HSSMatch model was
presented, and the prototype of the HSSMatch System was implemented,
allowing the user, through a web graphical interface, to manage the
microservices schema matching process. The evaluation of this prototype,
regarding its suitability of interaction design, was made through experiments and
questionnaires applied to users working in the area of data integration and
communication between software systems. The evaluation was also performed
in experiments with two datasets, and showed aspects that confirm the
hypothesis of this study, since there was an improvement in the efficiency and
effectiveness of the schema matching process using the hybrid approach that
accommodates data changes, reduces search space and combines matchers at
schema and instance levels. As future work, supervised machine learning
methods for semiautomatic configuration of schema matching strategies, as well
as other schema partitioning techniques, domain ontologies for improving the
quality of schema matching results for specific domains can be explored.
CNPq Area
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Citation
BORGES, Paulo Renato Soares. HSSMATCH: um modelo híbrido para semantic schema matching em arquiteturas orientadas a microsserviços. 2020. 136 f. Tese (doutorado em Engenharia Elétrica e Computação) - Universidade Presbiteriana Mackenzie, São Paulo, 2020.