기계 학습을 위한 특징 및 데이터셋 선택 통합 프레임워크(An) integrated framework of feature and dataset selection for machine learning

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 155
  • Download : 0
반도체 제조 회사는 제품의 품질을 모니터링 하기 위해 다양한 데이터를 생성한다. 모니터링을 위해 생성되는 데이터의 양은 많지만 대부분은 결함이 없는 데이터이며 일부만 결함이 존재한다. 데이터의 결함 여부를 예측하기 위해서는 사람의 경험치에 의한 판단이 필요하다. 이러한 수동작업을 줄이는 한 가지 방법은 새로운 입력 데이터에 대해 결함을 자동으로 예측할 수 있도록 경험적 데이터로 모델을 학습하는 프로세스인 기계학습(Machine Learning)을 사용하는 것이다. 인간의 판단을 기계학습으로 대체하는 데 있어 중요한 과제는 모델의 정확도를 충족할 학습 데이터가 충분하지 않을 수 있다는 것이다. 결과적으로, 초기에는 데이터가 충분하지 않기 때문에 신제품에 대한 모델을 학습하기 어려울 수 있다. 한 가지 대안은 다른 제품으로 훈련된 모델을 활용하는 전이학습(Transfer Learning)을 사용하는 것이지만, 다른 제품의 학습데이터가 너무 달라 모델 학습에 혼란만 주는 경우 오히려 모델의 정확도만 떨어질 수 있다. 본 논문에서는 이전에 생성된 데이터를 최대한 활용하면서 다양한 제품에 대해 결함 감지 모델을 학습시키는 문제를 연구한다. 이 시나리오는 유사한 제품이 많이 생산되고 신제품이 추가 될 때 일반적이다. 단순한 접근 방식은 제품 당 하나의 모델을 개별적으로 학습하는 것이지만 학습 데이터가 부족하여 모델의 정확도가 만족스럽지 않을 수 있다. 대신, 현재 훈련중인 학습모델을 개선 할 수 있는 유사한 제품을 검색한다. 각 제품에 대해 먼저 제품 계층 정보를 활용하여 후보 데이터셋을 선택한다. 그 다음 특징선택(Feature Selection) 기법을 확장하여 경험적으로 모델 정확도에 가장 도움이 되는 후보에서 데이터셋을 선택한다. 데이터셋 선택 외에도 모델 정확도를 더욱 향상시키기 위해 특징 선택을 수행할 수도 있다. 따라서 우리가 제안하는 알고리즘은 전체적으로 데이터셋과 특징을 함께 선택한다. 실험에 따르면 알고리즘이 데이터셋 선택과 특징 선택 양쪽 모두 또는 어느 한쪽만 선택하는 다양한 기준보다 우수한 성능을 보이는 것을 알 수 있다.
Advisors
황의종researcherWhang, Steven Euijongresearcher
Description
한국과학기술원 :전기및전자공학부,
Publisher
한국과학기술원
Issue Date
2021
Identifier
325007
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 전기및전자공학부, 2021.8,[iv, 27 p. :]

Keywords

기계학습▼a특징 선택▼a데이터셋 선택▼a특징 및 데이터셋 혼합 선택▼a다층퍼셉트론; Machine Learning▼afeature selection▼adataset selection▼afeature and dataset mixed selection▼aMultilayer perceptrons

URI
http://hdl.handle.net/10203/296084
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=963404&flag=dissertation
Appears in Collection
EE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0