Aprendizagem profunda para análise da ocupação do espaço público avaliando a presença de modais de trânsito
DOI:
https://doi.org/10.46421/sbtic.v4i00.2617Palavras-chave:
Detecção de Objetos, Redes Neurais Convulsionais, Máscara-CNN, análise urbana, Aprendizado profundoResumo
No campo da Arquitetura, Engenharia e Construção (AEC), o Machine Learning (ML) tem sido usado em aplicações como design generativo, análises de desempenho e reconhecimento de imagens, entre outros. Neste contexto, o objetivo deste trabalho foi verificar a aplicação de Deep Learning (DL) por meio de Convolutional Neural Networks (CNNs) para Object Detection (Detecção de Objetos). O objetivo do código de DL neste trabalho foi quantificar a presença de diferentes modais de trânsito em determinada área urbana para subsidiar a análise de ocupação do espaço público. O código Detectron/Mask R-CNN de detecção de instâncias em imagens associado ao dataset COCO foi capaz de identificar padrões de ocupação do espaço urbano coerentes com o contexto existente na rua de uso misto, comercial e residencial, com lazer noturno. O padrão dá destaque aos modais de trânsito, carro e pedestres. Foram listadas considerações, que podem auxiliar futuros trabalhos acerca da detecção de instâncias em imagens de câmeras urbanas com o código e dataset empregados.
Downloads
Referências
ALPAYDIN, Ethem. Machine Learning. MIT Press, 2016.
ANDRADE, Fábio Felippe de. O método de melhorias PDCA. 2003. Dissertação de Mestrado. Universidade de São Paulo.
ARNOLD, Ludovic et al. An Introduction to Deep Learning. In: European Symposium on Artificial Neural Networks (ESANN). ESANN, 2011, Bruges, Belgium.
CARRARA, Fabio et al. Adversarial image detection in deep neural networks. Multimedia Tools and Applications, v. 78, n. 3, p. 2815-2835, 2019. https://doi.org/10.1007/s11042-018-5853-4
GAO, Lianli et al. Unsupervised urban scene segmentation via domain adaptation. Neurocomputing, v. 406, p. 295-301, 2020.
GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. MIT press, 2016.
HALDAR, Malay et al. Applying deep learning to airbnb search. In: Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019. p. 1927-1935. https://doi.org/10.1145/3292500.3330658
HE, K.; Gkioxari, G.; Dollár, P.; Girshick, R. Mask R-CNN. In: Proceedings of the IEEE international conference on computer vision. 2017. p. 2961-2969.
JI, Shunping et al. Building instance change detection from large-scale aerial images using convolutional neural networks and simulated samples. Remote Sensing, v. 11, n. 11, p. 1343, 2019.
KANG, Jian et al. Building instance classification using street view images. ISPRS journal of photogrammetry and remote sensing, v. 145, p. 44-59, 2018.
LATEEF, Fahad; RUICHEK, Yassine. Survey on semantic segmentation using deep learning techniques. Neurocomputing, v. 338, p. 321-348, 2019.
LIN, Tsung-Yi et al. Microsoft coco: Common objects in context. In: European conference on computer vision. Springer, Cham, 2014. p. 740-755. https://doi.org/10.1007/978-3-319-10602-1_48
LOU, Lu et al. Detecting and counting the moving vehicles using mask R-CNN. In: 2019 IEEE 8th Data Driven Control and Learning Systems Conference (DDCLS). IEEE, 2019. p. 987-992.
SHAWAHNA, Ahmad; SAIT, Sadiq M.; EL-MALEH, Aiman. FPGA-based accelerators of deep learning networks for learning and classification: A review. IEEE Access, v. 7, p. 7823-7859, 2018. doi: 10.1109/ACCESS.2018.2890150.
ZHAO, Wenzhi et al. Exploring semantic elements for urban scene recognition: Deep integration of high-resolution imagery and OpenStreetMap (OSM). ISPRS Journal of Photogrammetry and Remote Sensing, v. 151, p. 237-250, 2019.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2023 SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO NA CONSTRUÇÃO
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Adota-se Atribuição 4.0 Internacional (CC BY 4.0). Ver detalhamento em https://creativecommons.org/licenses/by/4.0/deed.pt_BR