Excerpt from PDF:

14th International Conference on Computer and Knowledge Engineering (ICCKE 2024), November 19-20, 2024, Ferdowsi University of Mashhad Enhancing Vehicle Make and Model Recognition with 3D Attention Modules Narges Semiromizadeh, Omid Nejati Manzari, Shahriar B. Shokouhi, Sattar Mirzakuchaki School of Electrical Engineering, Iran University of Science and Technology, Tehran, Iran Abstract—Vehicle make and model recognition (VMMR) is a crucial component of the Intelligent Transport System, garnering significant attention in recent years. VMMR has been widely utilized for detecting suspicious vehicles, monitoring urban traf- fic, and autonomous driving systems. The complexity of VMMR arises from the subtle visual distinctions among vehicle models and the wide variety of classes produced by manufacturers. Convolutional Neural Networks (CNNs), a prominent type of deep learning model, have been extensively employed in various computer vision tasks, including VMMR, yielding remarkable results. As VMMR is a fine-grained classification problem, it primarily faces inter-class similarity and intra-class variation challenges. In this study, we implement an attention module to address these challenges and enhance the model’s focus on critical areas containing distinguishing features. This module, which does not increase the parameters of the original model, generates three-dimensional (3-D) attention weights to refine the feature map. Our proposed model integrates the attention module into two different locations within the middle section of a convolutional model, where the feature maps from these sections offer sufficient information about the input frames without being overly detailed or overly coarse. The performance of our proposed model, along with state-of-the-art (SOTA) convolutional and transformer-based models, was evaluated using the Stanford Cars dataset. Our proposed model achieved the highest accuracy, 90.69%, among the compared models. Keywords—Deep Learning, Vehicle recognition, Attention mod- ule I. INTRODUCTION In the field of Intelligent Transportation Systems (ITS), a novel topic pertaining to vehicle analysis is VMMR. In the automotive industry, the term “make” denotes the producer of a specific vehicle (such as Hyundai, Ford, and Toyota), whereas “model” specifies a certain kind of vehicle created by these producers (such as Azera, Corolla, and Focus). Traffic control, surveillance, traffic statistics, law enforcement, self-driving vehicles, and the detection of suspicious vehicles are just a few of the fields in which VMMR systems are extensively utilized [1]. VMMR can be regarded as a kind of fine-grained classifica- tion, which aims to identify and distinguish between categories with very similar features in a classification problem. The enormous existing categories, low inter-class and high intra- class variance make VMMR a highly challenging problem. The appearance of subtle visual disparities in specific cases can make recognition extremely difficult, even for humans [2]. Nowadays, deep learning networks are frequently used in varying computer vision tasks, one of which is image recognition. CNNs, as one of the deep learning models, have remarkably enhanced the performing of vision-related tasks due to their rich representational power [3–6]. Many of the proposed methods for VMMR have utilized CNN-based models and have achieved remarkable results. Transformer is also a kind of deep neural network that was first used in the field of natural language …더보기

This paper was uploaded based on materials provided by arXiv.
This paper is an open academic resource, and the original text can be accessed on arXiv.
Source: arXiv – A free repository for scientific and technical researchers.
This paper is provided for academic research purposes, and the original can be downloaded from arXiv.
Visit arXiv to explore more recent papers!

This paper was uploaded based on materials provided by arXiv.
This paper is an open academic resource, and the original text can be accessed on arXiv.
Source: arXiv – A free repository for scientific and technical researchers.
This paper is provided for academic research purposes, and the original can be downloaded from arXiv.
Visit arXiv to explore more recent papers!

번역 (Translation):

컴퓨터 및 지식 공학에 관한 14 번째 국제 회의 (ICCKE 2024), 2024 년 11 월 19 일, 20 일, Mashhad의 Ferdowsi University, 3D주의 모듈로 차량 제조업 및 모델 인식을 향상시키고 Semiromizadeh, Omid Nejati Manzari, Shahriar B. Shokouhi, Sattar Mirzakuchaki School of Science, Tehran, Tehrran, Tehran, Tehran, Tehran, Tehran School of Wecrance of Electrical Engineering 초록 – 차량 제조업체 및 모델 인식 (VMMR)은 지능형 운송 시스템의 중요한 구성 요소로 최근 몇 년 동안 상당한 관심을 끌고 있습니다. VMMR은 의심스러운 차량을 감지하고 도시 트래픽을 모니터링하며 자율 주행 시스템을 감지하는 데 널리 사용되었습니다. VMMR의 복잡성은 차량 모델과 제조업체가 생산하는 다양한 클래스 간의 미묘한 시각적 차이에서 발생합니다. 눈에 띄는 유형의 딥 러닝 모델 인 CNN (Convolutional Neural Networks)은 VMMR을 포함한 다양한 컴퓨터 비전 작업에 광범위하게 사용되어 놀라운 결과를 얻었습니다. VMMR은 세밀한 분류 문제이므로 주로 등급 간 유사성과 클래스 내 변동 문제에 직면 해 있습니다. 이 연구에서는 이러한 문제를 해결하고 구별되는 기능을 포함하는 중요한 영역에 대한 모델의 초점을 향상시키기위한주의 모듈을 구현합니다. 원래 모델의 매개 변수를 증가시키지 않는이 모듈은 피처 맵을 개선하기 위해 3 차원 (3 차원)주의 가중치를 생성합니다. 우리의 제안 된 모델은주의 모듈을 Convolutional 모델의 중간 섹션 내의 두 가지 위치에 통합하며,이 섹션의 기능 맵은 지나치게 상세하거나 지나치게 거칠지 않은 입력 프레임에 대한 충분한 정보를 제공합니다. 제안 된 모델의 성능은 최첨단 (SOTA) 컨볼 루션 및 변압기 기반 모델과 함께 Stanford Cars 데이터 세트를 사용하여 평가되었습니다. 제안 된 모델은 비교 모델 중에서 가장 높은 정확도 인 90.69%를 달성했습니다. 키워드- 가파른 학습, 차량 인식,주의 모드 I. 지능형 운송 시스템 (ITS) 분야에서 차량 분석과 관련된 새로운 주제는 VMMR입니다. 자동차 산업에서 “Make”라는 용어는 특정 차량 (현대, 포드 및 토요타 등)의 생산자를 나타내며 “모델”은 이러한 생산자 (예 : Azera, Corolla 및 Focus)가 만든 특정 종류의 차량을 지정합니다. 교통 통제, 감시, 교통 통계, 법 집행, 자율 주행 차량 및 의심스러운 차량의 탐지는 VMMR 시스템이 광범위하게 활용되는 분야 중 일부에 불과합니다 [1]. VMMR은 일종의 세밀한 분류로 간주 될 수 있으며, 이는 분류 문제에서 매우 유사한 기능을 갖춘 범주를 식별하고 구별하는 것을 목표로합니다. 거대한 기존 카테고리, 낮은 클래스 및 높은 클래스 내 분산은 VMMR이 매우 어려운 문제로 만듭니다. 특정한 경우에 미묘한 시각적 불균형이 나타나면 인간에게도 인식이 매우 어려워 질 수 있습니다 [2]. 오늘날, 딥 러닝 네트워크는 다양한 컴퓨터 비전 작업에 자주 사용되며 그 중 하나는 이미지 인식입니다. 딥 러닝 모델 중 하나 인 CNN은 풍부한 표현력으로 인해 비전 관련 작업 수행을 현저하게 향상 시켰습니다 [3-6]. VMMR에 대한 제안 된 많은 방법은 CNN 기반 모델을 활용했으며 놀라운 결과를 얻었습니다. Transformer는 또한 자연 언어 분야에서 처음 사용 된 일종의 깊은 신경망입니다 … 더보기

이 논문은 arXiv에서 제공되는 자료를 바탕으로 업로드되었습니다.
본 논문은 공개된 학술 자료이며, 원문은 arXiv에서 확인할 수 있습니다.
출처: arXiv – 과학 및 기술 연구자들을 위한 무료 논문 저장소.
이 논문은 학술 연구 목적으로 제공되며, 원문은 arXiv에서 다운로드할 수 있습니다.
더 많은 최신 논문을 보려면 arXiv를 방문하세요!

이 논문은 arXiv에서 제공되는 자료를 바탕으로 업로드되었습니다.
본 논문은 공개된 학술 자료이며, 원문은 arXiv에서 확인할 수 있습니다.
출처: arXiv – 과학 및 기술 연구자들을 위한 무료 논문 저장소.
이 논문은 학술 연구 목적으로 제공되며, 원문은 arXiv에서 다운로드할 수 있습니다.
더 많은 최신 논문을 보려면 arXiv를 방문하세요!

PDF 다운로드

Leave a comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다