Computational aesthetics in architecture: a framework for quantifying preferences using computer vision and artificial neural networks
dc.contributor.advisor | Becker, Mirco | |
dc.contributor.author | Sardenberg, Victor Carrilho | |
dc.date.accessioned | 2024-10-09T18:11:02Z | |
dc.date.available | 2024-10-09T18:11:02Z | |
dc.date.issued | 2024-07-04 | |
dc.description.abstract | This research develops a computational aesthetics framework to predict the hedonic response of groups of people to architectural images. The theoretical basis relies on classical aesthetic theories of parts to whole, such as AlbertiĀ“s, combined with early 20th-century quantitative aesthetic metrics by G. D. Birkhoff and digitally-enabled contemporary technologies, such as Computer Vision (CV) and Artificial Neural Networks (ANN). This work focuses on the visual perception of architecture through perspectival images. CV is applied to identify parts in images, such as walls, doors, and windows. These parts are reorganized in diagrams to analyze the number of parts (DSP) and quantify their relations to the whole (DCG). The quantities derived from the diagrams inform two methods for quantifying and predicting the hedonic response of other images: 1. Birkhoff's Aesthetic Measure (AM) formula is adopted to reduce the complicated aesthetic experience into numbers. CV is applied to automate it, speeding up its application and making it unambiguous. The formula is calibrated to fit the audience's preferences better, producing a Calibrated Aesthetic Measure (cAM). 2. ANNs are trained because of their ability to find patterns in data. The numerical output from the DCG and DSP, the AM, and the cAM are used as inputs to train the model. This model is named the Predicted Hedonic Response (PHR) model. The described framework requires surveying specific audiences to incorporate their bias. Therefore, this research does not aim to develop a universal model of aesthetic evaluation but to embrace the specificity of each group of individuals. The framework is applied to navigate design spaces for parametric models and generative adversarial networks. The thesis discusses the implications of quantification in architectural evaluation, parts to whole relationship paradigms, and the role of images and playing in architecture. Finally, it concludes that the computational aesthetics framework build is a heuristic for predicting the aesthetic preferences of groups. | |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/39572 | |
dc.language.iso | en | |
dc.language.iso | de | |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.subject | computational aesthetics | |
dc.subject | artificial neural networks | |
dc.subject | aesthetic measure | |
dc.title | Computational aesthetics in architecture: a framework for quantifying preferences using computer vision and artificial neural networks | |
dc.type | Tese | |
local.contributor.advisorOrcid | https://orcid.org/0000-0001-8488-2108 | |
local.contributor.authorLattes | http://lattes.cnpq.br/2463492214863820 | |
local.contributor.authorOrcid | https://orcid.org/0000-0001-6089-0189 | |
local.contributor.board1 | Hoffman, Holger | |
local.contributor.board2 | Nolte, Tobias | |
local.contributor.board2Orcid | https://orcid.org/0000-0002-9341-7723 | |
local.contributor.board3 | Castro, Luiz Guilherme Rivera de | |
local.contributor.board3Lattes | http://lattes.cnpq.br/3552510477284234 | |
local.contributor.board3Orcid | https://orcid.org/0000-0002-0963-3002 | |
local.contributor.coadvisor | Guatelli, Igor | |
local.contributor.coadvisorLattes | http://lattes.cnpq.br/0684027099625255 | |
local.contributor.coadvisorOrcid | https://orcid.org/0000-0002-3937-8073 | |
local.description.abstracten | In diesem Forschungsvorhaben wird ein computergestĆ¼tzte Vorgehensweise zur Vorhersage der Ƥsthetischen hedonischen Reaktion von Personengruppen auf Architekturbilder entwickelt. Die theoretische Grundlage beruht auf klassischen Ƥsthetischen Theorien, wie bspw. Alberties Theorie Ć¼ber die Beziehung zwischen Teilen und dem Ganzen. Diese Theorien werden kombiniert mit quantitativen Ƥsthetischen Metriken von G. D. Birkhoff aus dem frĆ¼hen 20. Jahrhundert sowie modernen digitalen Technologien wie Computer Vision (CV) und kĆ¼nstlichen neuronalen Netzen (ANN). Die Arbeit konzentriert sich auf die visuelle Wahrnehmung von Architektur durch perspektivische Bilder. CV wird angewendet, um Teile in Bildern zu identifizieren, z. B. WƤnde, TĆ¼ren und Fenster. Diese Teile werden in Diagrammen reorganisiert, um die Anzahl der Teile zu analysieren (DSP) und ihre Beziehungen zum Ganzen zu quantifizieren (DCG). Die aus den Diagrammen abgeleiteten GrƶĆen dienen als Grundlage fĆ¼r zwei Methoden zur Quantifizierung und Vorhersage der hedonischen Reaktion auf andere Bilder: 1. Birkhoffs Formel fĆ¼r das Ƥsthetische MaĆ (AM) wird verwendet, um die komplizierte Ƥsthetische Erfahrung in Zahlen zu fassen. CV wird angewandt, um sie zu automatisieren, ihre Anwendung zu beschleunigen und sie eindeutig evaluierbar zu machen. Die Formel wird kalibriert, um den Vorlieben des Publikums besser gerecht zu werden, wodurch ein kalibriertes Ƥsthetisches MaĆ (cAM) entsteht. 2. ANNs werden trainiert, um spezifische Muster in den Daten zu identifizieren. FĆ¼r den Trainingsprozess des Modells werden die numerische Ausgabe von DCG und DSP, wie auch das AM und das cAM als Input verwendet. Dieses Modell wird als Predicted Hedonic Response (PHR)-Modell bezeichnet. Die beschriebene Computer-basiert Instrumentarium erfordert die Befragung bestimmter Zielgruppen und die BerĆ¼cksichtigung ihrer Voreingenommenheit. Daher zielt diese Forschung nicht darauf ab, ein universelles Modell der Ƥsthetischen Bewertung zu entwickeln, sondern die Besonderheiten jeweiliger Personengruppen einzubeziehen. Das Verfahren wird bei der Navigation durch EntwurfsrƤume parametrischer Modelle und generativer adversarialer Netzwerke angewendet. Die Arbeit diskutiert die Auswirkungen der Quantifizierung in der architektonischen Bewertung, Paradigmen der Beziehung zwischen Teilen und dem Ganzen und die Rolle von Bildern und Spielen in der Architektur. AbschlieĆend wird die Schlussfolgerung gezogen, dass das entwickelte computerbasierte Ƥsthetische Verfahren eine Heuristik zur Vorhersage der Ƥsthetischen PrƤferenzen von Gruppen darstellt. | |
local.keywords | computerƤsthetik | |
local.keywords | kĆ¼nstliche neuronale netze | |
local.keywords | asthetisches maĆ | |
local.publisher.country | Brasil | |
local.publisher.department | Faculdade de Arquitetura e Urbanismo (FAU) | |
local.publisher.initials | UPM | |
local.publisher.program | Arquitetura e Urbanismo | |
local.subject.cnpq | CNPQ::CIENCIAS SOCIAIS APLICADAS::ARQUITETURA E URBANISMO |