질문 요약
input을 최소화하면서 가고 싶다할때 상대적인 비를 결정해줄 수 있는 값들'이라하셔는데 무슨 값을 얘기하는 거죠?? k값요?
답변 요약
LQR에서 제어는 적분항 속의 값(x^T Q x + u^T R u)을 가장 최소화하는 방향으로 이루어집니다. 이 적분항은 머신러닝의 손실 함수처럼 작용합니다. Q와 R 행렬을 통해 어떤 값에 더 비중을 두고 제어할지를 결정할 수 있습니다. 예를 들어, state 변수 x가 [x, y, z] 위치일 때, x 방향으로 빠르게 수렴하고 나머지 방향은 천천히 수렴하고 싶다면 Q를 diag(100,1,1)로 설정하면 됩니다. 그러면 x 방향 변위를 더 민감하게 인식하여 x 방향으로 빨리 수렴하도록 제어할 수 있습니다.
Unsplash 추천 이미지 (키워드 : control systems, LQR control, machine learning loss function, state variable control, Q matrix, R matrix,xyz position, system convergence, control sensitivity, engineering lecture )
LQR 제어에서 Q와 R 값의 역할
선형 2차 조절기(LQR, Linear Quadratic Regulator)는 상태 피드백 제어 시스템을 설계할 때 많이 사용되는 방법입니다. LQR 제어는 시스템의 상태 x와 제어 입력 u 사이의 관계를 조절하여 시스템의 성능을 최적화하는 것을 목표로 합니다. 이 글에서는 LQR 제어에서 Q와 R 매트릭스의 역할에 대해 알아보겠습니다.
적분항 최소화
LQR 제어는 다음과 같은 성능 지표를 최소화하는 방향으로 컨트롤러를 설계합니다:
$$ J = \int_0^\infty (x^T Q x + u^T R u) \, dt $$이 성능 지표는 머신러닝에서 손실 함수(Loss Function)와 유사하게 작용합니다. 성능 지표를 최소화하기 위해서는 주어진 시스템의 상태 변수 x와 제어 입력 u를 적절히 조절해야 합니다.
Q와 R 매트릭스의 역할
Q와 R 매트릭스는 LQR 성능 지표에서 각각 상태 변수와 제어 입력에 대한 가중치를 나타냅니다. 이 매트릭스를 통해 어떤 값에 더 비중을 두고 제어할지를 결정할 수 있습니다.
Q 매트릭스
Q 매트릭스는 상태 변수 x에 대한 가중치를 나타냅니다. 예를 들어, 상태 변수가 위치 [x, y, z]로 구성되어 있다고 가정합시다. 만약 x 방향으로 빠르게 수렴하고 나머지 방향은 천천히 수렴하고 싶다면 Q를 다음과 같이 설정할 수 있습니다:
$$ Q = \text{diag}(100, 1, 1) $$이렇게 설정하면 x 방향 변위를 더 민감하게 인식하여 x 방향으로 빨리 수렴하도록 제어할 수 있습니다. 즉, Q 매트릭스를 통해 특정 상태 변수에 대한 중요도를 조절할 수 있습니다.
R 매트릭스
R 매트릭스는 제어 입력 u에 대한 가중치를 나타냅니다. 제어 입력을 최소화하고 싶을 때 R 매트릭스를 조절하여 제어 입력의 크기를 제어할 수 있습니다. 예를 들어, 제어 입력이 두 개 [u1, u2]로 구성되어 있다고 가정합시다. 만약 첫 번째 제어 입력 u1을 더 작게 유지하고 싶다면 R을 다음과 같이 설정할 수 있습니다:
$$ R = \text{diag}(10, 1) $$이렇게 설정하면 제어 입력 u1에 더 큰 가중치를 두어 u1을 작게 유지하도록 제어할 수 있습니다.
Q와 R 매트릭스의 조절
Q와 R 매트릭스를 적절히 조절함으로써 시스템의 성능을 최적화할 수 있습니다. Q와 R의 크기와 비율을 조절하여 시스템이 특정 상태 변수에 더 빠르게 수렴하거나 제어 입력을 더 작게 유지하도록 할 수 있습니다. 예를 들어, 다음과 같은 경우를 생각해 볼 수 있습니다:
- 상태 변수 [x, y, z] 중 x 방향으로 빠르게 수렴하고 싶다면 Q를 diag(100, 1, 1)로 설정합니다.
- 제어 입력 [u1, u2] 중 u1을 더 작게 유지하고 싶다면 R을 diag(10, 1)로 설정합니다.
- 전체적인 제어 입력을 최소화하고 싶다면 R의 값을 전반적으로 증가시킬 수 있습니다.
결론
LQR 제어는 상태 변수와 제어 입력에 대한 가중치를 조절하여 시스템의 성능을 최적화하는 방법입니다. Q 매트릭스는 상태 변수에 대한 가중치를, R 매트릭스는 제어 입력에 대한 가중치를 나타냅니다. 이들을 적절히 조절함으로써 시스템이 특정 상태 변수에 더 빠르게 수렴하거나 제어 입력을 더 작게 유지하도록 할 수 있습니다. 이를 통해 원하는 시스템의 성능을 달성할 수 있습니다.
추가적으로 LQR 제어에 대한 자세한 내용은 아래 링크를 참고하세요:
LQR 제어 - Wikipedia유니스터디 바로가기 : https://www.unistudy.co.kr/megauni.asp
학습Q&A 바로가기 : https://www.unistudy.co.kr/community/qna_list.asp
0 댓글