강화학습 접근법을 이용한 시간 변동성이 있는 양팔 클러스터 장비의 스케줄링Scheduling dual-armed cluster tools with time variation by reinforcement learning

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 623
  • Download : 0
본 논문에서는 반도체 제조 공정에서 사용되는 양팔 클러스터 장비를 연구한다. 클러스터 장비는 한 번에 한 장의 웨이퍼를 가공하는 대표적인 반도체 공정 장비로 반도체 산업에서 널리 사용되고 있다. 클러스터 장비 스케줄링을 위한 다양한 연구가 진행됐지만, 대부분의 연구는 확정적인 공정 및 공정 소요 시간을 고려하며 예외 상황을 고려하지 않는 환경을 가정해왔다. 따라서 해당 연구들은 장비 상태에 무관한 고정적인 로봇 작업 순서에 초점을 맞추어 진행되어왔다. 본 연구에서는 공정 소요 시간의 변동성이 있는 환경에서, 장비 상태에 따라 다음 로봇 작업을 동적으로 결정하는 스케줄링 방법을 제안한다. 장비 시뮬레이션으로 생성한 데이터를 바탕으로 동적 스케줄링 규칙을 학습하는 강화학습 방식을 적용한다. 클러스터 장비와 시간 변동성의 특성을 반영한 상태 정의, 새로운 행동-선택 규칙, 그리고 확장된 입력 특징 구조를 제시하며, 딥 신경망 구조를 사용하여 얻은 학습된 스케줄을 바탕으로 메이크스팬을 측정하고 스왑 시퀀스에서의 메이크스팬과 비교를 통해 학습된 스케줄의 성능을 비교하고 분석한다. 메이크스팬 비교를 통해 강화학습은 스왑 시퀀스와 비슷하거나 더 나은 성능을 나타내는 스케줄링 규칙을 얻었음을 확인하였다. 또한, 학습된 스케줄링 규칙이 다른 공정 시간을 갖는 문제 인스턴스에 대해서도 효율적으로 일반화됨을 보였으며, 웨이퍼 공정 후 챔버를 클리닝하는 상황에서도 강화학습 방법이 적용되는 것을 확인하였다.
Advisors
이태억researcherLee, Tae-Eogresearcher
Description
한국과학기술원 :산업및시스템공학과,
Publisher
한국과학기술원
Issue Date
2018
Identifier
325007
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 산업및시스템공학과, 2018.2,[vi, 42 p. :]

Keywords

양팔 클러스터 장비▼a스케줄링▼a공정 시간 변동▼a강화학습▼a딥 강화학습; dual-armed cluster tool▼ascheduling▼aprocessing time variation▼areinforcement learning▼adeep reinforcement learning

URI
http://hdl.handle.net/10203/266263
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=733837&flag=dissertation
Appears in Collection
IE-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0