Computational aesthetics in architecture: a framework for quantifying preferences using computer vision and artificial neural networks

dc.contributor.advisorBecker, Mirco
dc.contributor.authorSardenberg, Victor Carrilho
dc.date.accessioned2024-10-09T18:11:02Z
dc.date.available2024-10-09T18:11:02Z
dc.date.issued2024-07-04
dc.description.abstractThis research develops a computational aesthetics framework to predict the hedonic response of groups of people to architectural images. The theoretical basis relies on classical aesthetic theories of parts to whole, such as AlbertiĀ“s, combined with early 20th-century quantitative aesthetic metrics by G. D. Birkhoff and digitally-enabled contemporary technologies, such as Computer Vision (CV) and Artificial Neural Networks (ANN). This work focuses on the visual perception of architecture through perspectival images. CV is applied to identify parts in images, such as walls, doors, and windows. These parts are reorganized in diagrams to analyze the number of parts (DSP) and quantify their relations to the whole (DCG). The quantities derived from the diagrams inform two methods for quantifying and predicting the hedonic response of other images: 1. Birkhoff's Aesthetic Measure (AM) formula is adopted to reduce the complicated aesthetic experience into numbers. CV is applied to automate it, speeding up its application and making it unambiguous. The formula is calibrated to fit the audience's preferences better, producing a Calibrated Aesthetic Measure (cAM). 2. ANNs are trained because of their ability to find patterns in data. The numerical output from the DCG and DSP, the AM, and the cAM are used as inputs to train the model. This model is named the Predicted Hedonic Response (PHR) model. The described framework requires surveying specific audiences to incorporate their bias. Therefore, this research does not aim to develop a universal model of aesthetic evaluation but to embrace the specificity of each group of individuals. The framework is applied to navigate design spaces for parametric models and generative adversarial networks. The thesis discusses the implications of quantification in architectural evaluation, parts to whole relationship paradigms, and the role of images and playing in architecture. Finally, it concludes that the computational aesthetics framework build is a heuristic for predicting the aesthetic preferences of groups.
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/39572
dc.language.isoen
dc.language.isode
dc.publisherUniversidade Presbiteriana Mackenzie
dc.subjectcomputational aesthetics
dc.subjectartificial neural networks
dc.subjectaesthetic measure
dc.titleComputational aesthetics in architecture: a framework for quantifying preferences using computer vision and artificial neural networks
dc.typeTese
local.contributor.advisorOrcidhttps://orcid.org/0000-0001-8488-2108
local.contributor.authorLatteshttp://lattes.cnpq.br/2463492214863820
local.contributor.authorOrcidhttps://orcid.org/0000-0001-6089-0189
local.contributor.board1Hoffman, Holger
local.contributor.board2Nolte, Tobias
local.contributor.board2Orcidhttps://orcid.org/0000-0002-9341-7723
local.contributor.board3Castro, Luiz Guilherme Rivera de
local.contributor.board3Latteshttp://lattes.cnpq.br/3552510477284234
local.contributor.board3Orcidhttps://orcid.org/0000-0002-0963-3002
local.contributor.coadvisorGuatelli, Igor
local.contributor.coadvisorLatteshttp://lattes.cnpq.br/0684027099625255
local.contributor.coadvisorOrcidhttps://orcid.org/0000-0002-3937-8073
local.description.abstractenIn diesem Forschungsvorhaben wird ein computergestĆ¼tzte Vorgehensweise zur Vorhersage der Ƥsthetischen hedonischen Reaktion von Personengruppen auf Architekturbilder entwickelt. Die theoretische Grundlage beruht auf klassischen Ƥsthetischen Theorien, wie bspw. Alberties Theorie Ć¼ber die Beziehung zwischen Teilen und dem Ganzen. Diese Theorien werden kombiniert mit quantitativen Ƥsthetischen Metriken von G. D. Birkhoff aus dem frĆ¼hen 20. Jahrhundert sowie modernen digitalen Technologien wie Computer Vision (CV) und kĆ¼nstlichen neuronalen Netzen (ANN). Die Arbeit konzentriert sich auf die visuelle Wahrnehmung von Architektur durch perspektivische Bilder. CV wird angewendet, um Teile in Bildern zu identifizieren, z. B. WƤnde, TĆ¼ren und Fenster. Diese Teile werden in Diagrammen reorganisiert, um die Anzahl der Teile zu analysieren (DSP) und ihre Beziehungen zum Ganzen zu quantifizieren (DCG). Die aus den Diagrammen abgeleiteten GrĆ¶ĆŸen dienen als Grundlage fĆ¼r zwei Methoden zur Quantifizierung und Vorhersage der hedonischen Reaktion auf andere Bilder: 1. Birkhoffs Formel fĆ¼r das Ƥsthetische MaƟ (AM) wird verwendet, um die komplizierte Ƥsthetische Erfahrung in Zahlen zu fassen. CV wird angewandt, um sie zu automatisieren, ihre Anwendung zu beschleunigen und sie eindeutig evaluierbar zu machen. Die Formel wird kalibriert, um den Vorlieben des Publikums besser gerecht zu werden, wodurch ein kalibriertes Ƥsthetisches MaƟ (cAM) entsteht. 2. ANNs werden trainiert, um spezifische Muster in den Daten zu identifizieren. FĆ¼r den Trainingsprozess des Modells werden die numerische Ausgabe von DCG und DSP, wie auch das AM und das cAM als Input verwendet. Dieses Modell wird als Predicted Hedonic Response (PHR)-Modell bezeichnet. Die beschriebene Computer-basiert Instrumentarium erfordert die Befragung bestimmter Zielgruppen und die BerĆ¼cksichtigung ihrer Voreingenommenheit. Daher zielt diese Forschung nicht darauf ab, ein universelles Modell der Ƥsthetischen Bewertung zu entwickeln, sondern die Besonderheiten jeweiliger Personengruppen einzubeziehen. Das Verfahren wird bei der Navigation durch EntwurfsrƤume parametrischer Modelle und generativer adversarialer Netzwerke angewendet. Die Arbeit diskutiert die Auswirkungen der Quantifizierung in der architektonischen Bewertung, Paradigmen der Beziehung zwischen Teilen und dem Ganzen und die Rolle von Bildern und Spielen in der Architektur. AbschlieƟend wird die Schlussfolgerung gezogen, dass das entwickelte computerbasierte Ƥsthetische Verfahren eine Heuristik zur Vorhersage der Ƥsthetischen PrƤferenzen von Gruppen darstellt.
local.keywordscomputerƤsthetik
local.keywordskĆ¼nstliche neuronale netze
local.keywordsasthetisches maƟ
local.publisher.countryBrasil
local.publisher.departmentFaculdade de Arquitetura e Urbanismo (FAU)
local.publisher.initialsUPM
local.publisher.programArquitetura e Urbanismo
local.subject.cnpqCNPQ::CIENCIAS SOCIAIS APLICADAS::ARQUITETURA E URBANISMO
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Victor Sardenberg....pdf
Tamanho:
28.31 MB
Formato:
Adobe Portable Document Format
DescriĆ§Ć£o:
LicenƧa do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.22 KB
Formato:
Item-specific license agreed upon to submission
DescriĆ§Ć£o: