본문 바로가기
Autonomous Vehicle/Paper reading & summary

[논문리딩] 기계학습 기반 객체 분류를 통한 특징 지도 작성

by kim.jeff 2020. 8. 17.

  국민대학교 무인차량 연구실에서 연구했던 자료 관련한 논문 하나를 가져왔습니다. 본 논문을 읽어보면서 특징 지도가 어떻게 만들어지고 어떻게 쓰일지 생각해보고 정리해보는 시간 갖도록 하겠습니다.

 


 

기계학습 기반 객체 분류를 통한 특징 지도 작성[1]

Feature Mapping with Machine Learning Based Oject Classification

저자 : 국민대학교 자동차공학전문대학원 강동완 박사과정 등 4명

 

 

알아두어야 할 키워드

LiDAR (Light detecting and Ranging)

  라이다(LiDAR : Light Detection And Ranging)는 레이저를 이용하여 사물을 감지하고 거리를 측정하는 기술로서 지적, 건설, 국방, 우주 등 다양한 분야에 응용되었고, 최근 자율주행 자동차 및 이동체(로봇) 등에 핵심 기술로 적용되고 있습니다. 라이다는 레이저(광학) 송신 및 수신 모듈, 신호처리 모듈로 구분할 수 있으며, 레이저 신호 변조 방법에 따라 ToF(Time of flight) 방식과 PS(Phase shift) 방식으로 구분될 수 있습니다. ToF 방식은 레이저를 발사하여 레이저 펄스 신호가 전방의 물체에 반사되어 돌아온 시간을 측정하여 거리를 측정하고, PS 방식은 특정 주파수를 지속적으로 변조한 레이저를 방출해 전방의 물체에 반사된 위상의 변화량을 측정하여 거리를 측정합니다.

 

MMS (Moblie Mapping System)

  여러 맵을 만들기 위한 이동형 장비(차량), 여러 센서를 혼합하여 맵을 정밀하게 측정하고 만든다.

 

SVM (Support Vector Machine)

  서포트 벡터 머신(support vector machine, SVM[1].[2])은 기계 학습의 분야 중 하나로 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사용한다. 두 카테고리 중 어느 하나에 속한 데이터의 집합이 주어졌을 때, SVM 알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 비확률적 이진 선형 분류 모델을 만든다. 만들어진 분류 모델은 데이터가 사상된 공간에서 경계로 표현되는데 SVM 알고리즘은 그중 가장 큰 폭을 가진 경계를 찾는 알고리즘이다. SVM은 선형 분류와 더불어 비선형 분류에서도 사용될 수 있다. 비선형 분류를 하기 위해서 주어진 데이터를 고차원 특징 공간으로 사상하는 작업이 필요한데, 이를 효율적으로 하기 위해 커널 트릭을 사용하기도 한다 [2].

 

LAS 데이터

: ASPRS(American Society of Photogrammetry and Remote Sensing)에서 정의한 산업 표준 파일 형식 

 

RANSAC (RANdom SAmple Consensus)

: 무작위로 샘플 데이터들을 뽑은 다음 최대로 컨센서스(많은 수의 데이터에서 지지를 받는)가 형성된 데이터를 선택하는 방식[3]. 

최소자승법으로의 근사화(fitting)과 RANSAC의 근사화의 차이[3]

 

자세한 사항은 다크 프로그래머님의 영상처리에서의 RANSAC에 대한 글을 참조하세요. https://darkpgmr.tistory.com/61

 

RANSAC의 이해와 영상처리 활용

영상처리나 컴퓨터 비전을 하면서 RANSAC을 모르면 간첩일 정도로 RANSAC은 너무나 유명한, 그리고 널리 사용되는 방법이다. RANSAC이 유명한 만큼 이미 인터넷에 관련된 글들이 꽤 있다. 그럼에도 ��

darkpgmr.tistory.com

 

Weighted least square linear

: 가중 선형 회귀라고도하는 가중 최소 제곱은 오차 공분산 행렬이 항등 행렬과 다르게 허용되는 보통 최소 제곱과 선형 회귀의 일반화입니다. WLS는 또한 위의 행렬이 대각선 인 일반화된 최소 제곱의 특수화입니다 [4].

Linear Spline

: 스플라인 보간법. 전체 구간을 소구간별로 나누어 저차수의 다항식으로 매끄러운 함수를 구하는 방법[5].

 


[서론 및 배경]

  인지센서를 이용하여 위치인식하는 기술은 크게 두가지로 지도를 사용하는 방법과 지도를 사용하지 않는 방법으로 나뉜다. 그중 지도를 사용하는 방법에서 지도의 정확도와 지도의 구성에 따라서 성능이 달라진다. 정밀지도는 그중 지도의 정확도를 향상시키는 방법으로 무인이동체의 위치 인식 기술 문제를 해결하는 대안으로 관심을 받고 있다. 현대엠엔소프트의 경우에 국내 최초로 MMS 기반 정밀지도 구축 시스템을 도입했으며, 다양한 센서로 3차원 정밀지도를 구축하고 있다. 

 

[관련 연구]

  포인트 클라우드를 다루는 관련 연구에 대해서 보통 정보를 취득하기위해서 통계학적인 방법과 이미지처리에서 사용하던 연구를 사용하였다. 최근에는 기계학습과 딥러닝을 이용한 방법들이 시도되고 있다. 포인트 클라우드로부터 도로형상을 추출하기 위해서는 대부분 Hough Transform, RANSAC (RAndom SAmple Consensus), Weighted least square linear과 같은 모델링을 통한 피팅 방법들이 있어왔다. 피팅 방법은 데이터를 모델로 나타내며 데이터를 단순화 할 수 있다. 하지만 모델은 오버피팅이나 언더피팅이 되어 다양한 환경에서의 적용이 힘들다는 단점을 갖는다. 그렇기 때문에 도로 표식 추출방법으로 반사적 특징이 뚜렷하다는 점을 이용하여 GRF(Geo-Referenced Feature)를 사용하여 이미지를 세분화하고 반사강도를 정규화한 뒤 모양과 크기를 이용하여 도로 표식을 추출한다. 이 추출된 데이터들이 대부분 강도 데이터에 전역임계값을 적용하기 때문에 노이즈에 따라 결과가 상이하게 다르다. 데이터들을 지역적으로 임계값을 찾아 적용하는 방법으로 앞선 연구들의 단점들을 최소화 한다.

 

[본 연구의 특징]

연구의 목적 : 지도객체의 정탐률의 향상, 오탐률을 최소화 보정 알고리즘 개발

세부 연구의 목적 : 노이즈 제거와 특징기반의 지도 작성

 

[시스템의 환경]

데이터의 좌표계 : UTM - 52 좌표계

데이터 형식 : LAS 형식 

 

[정의] 

노이즈 : 도로위의 이동물체와 도로시설 이외의 물체들을 노이즈라고 정의

 

[기계학습 사용 모델]

SVM(Support Vector Machine) 이용

 

알고리즘 수행 시스템 목차

1. 관심 영역 추출 

연산속도나 데이터의 메모리 최소화를 위해  관심영역을 추출한다.

거리에 따른 구간의 분할(20m) - Linear Spline 보간법 이용하여 부족한 주행 데이터 보강 - 관심영역 설정

 

2. 객체 분할

실선, 점선, 중앙분리대, 가드레일과 같은 객체를 추출하기 위해 우선 객체들을 분할시켜야 한다.

지면 데이터의 높이 차이를 통한 제거 (20m로 분할된 데이터에도 높이차가 상당히 크기때문에, 2미터마다 새로운 임계값을 적용) -  30cm이상의 데이터와 이하의 데이터 분할 - 30cm이하의 데이터의 경우 아스팔트와 차선의 평균적인 Intensity(반사도)가 다르기 때문에 차선을 필터링 - 30cm이상의 데이터의 경우 가드레일, 중앙분리대, 이동물체 추출위해 분리 - 거리에 따라 반사강도가 낮아지는 특징때문에 차량의 진행방향에 따라 지역을 분할하여 처리

 

3. 군집화 

객체를 추출하기 위해 군집화를 한다. 데이터의 군집은 거리, 밀도, 확률과 같은 관계성을 고려한다. 본 논문에서는 Euclidean Clustering, DBSCAN을 고려하였다. 

유클리디언 클러스터링의경우 다른객체가 한 객체로 군집화 or 한 객체가 두 객체로 군집화 되는 문제점 발생.

DBSCAN의 경우 임계값에 따라 데이터가 소실되는 문제점.

차량의 주행속도와 센서의 측정속도로 인한 편차의 커짐 -> 고정된 임계값

 

보통의 경우 적응형 임계값을 통해 군집화, 본 시스템에서는 DBSCAN과 EC를 함께 진행하여 문제를 해결하였다. DBSCAN을 통해 일정 밀도 이하의 군집은 노이즈로 가정하여 제거 후 유클리디언 클러스터링을 통한 군집화를 하였다.

 

4. 분류알고리즘

 - 분류객체와 객체의 특징을 정의

 - SVM 모델을 이용하여 지도학습을 실행 

( 주어진 데이터 집합을 바탕으로 새로운 데이터가 어느 집합에 속할지를 판단하는 비확률적 이진 선형 분류 모델을 만듦. 데이터가 사상된 공간에서 경계 초평면을 찾는 알고리즘. 클래스를 구분하는 초평면은 여러개가 존재하게 되지만 최대화된 초평면은 하나만 존재. 비선형적인 데이터 분류를 위해 다항식을 이용하는 Polynomial 커널 이용. SVM모델을 사용하였는데, 효과적인 분류를 위해서 특징을 추출하여 정의)

 

결론

  0.94의 신뢰성 확보 및 지도의 경량화. 수작업으로 이루어지던 지도 작성에 도움을 줌.

 

 


<참고문헌 및 출처>

[1] 강동완 등 4명, 기계학습 기반 객체 분류를 통한 특징 지도 작성, 한국자동차공학회 논문지 ,2020(https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09346000)

[2] 위키백과, 서포트 벡터 머신, 2020.08.17(https://ko.wikipedia.org/wiki/%EC%84%9C%ED%8F%AC%ED%8A%B8_%EB%B2%A1%ED%84%B0_%EB%A8%B8%EC%8B%A0)

[3]다크프로그래머, RANSAC의 이해와 영상처리 활용, 2020.08.17 (https://darkpgmr.tistory.com/61)

[4]위키백과, 가중선형회귀, 

[5]위키백과, 스플라인 보간법 ,https://ko.wikipedia.org/wiki/%EC%8A%A4%ED%94%8C%EB%9D%BC%EC%9D%B8_%EB%B3%B4%EA%B0%84%EB%B2%95