Phuoc DIU KHIN TI U VA DIU KHIN T
Phuoc DIU KHIN TI U VA DIU KHIN T
Chất l ợng đ ợc đánh giá bằng giá trị c a hàm mục tiêu Chỉnh định T i u tham
1. Không ràng buộc, nếu P Rn . Khi đó nó được viết thành: p* arg min J ( p )
2. Có ràng buộc, nếu P Rn
3. Lồi, nếu P là tập lồi và J (p ) là hàm lồi
1. Gradient 1. QP
2. Newton-Raphson 2. SQP
3. Gauss-Newton 3. Interior point
1. Hàm truyền G (z )
toán của đối tượng
1 a1z 1 an z n
2. Đo tín hiệu vào ra uk , yk , k 1, , N rồi từ đó xác định các tham số của mô hình
là b0 , ,bm ,a1 , ,an sao cho kỳ vọng (giá trị trung bình) của bình phương sai
lệch giữa mô hình với đối tượng là nhỏ nhất.
Chú ý: Phải đảm bảo tín hiệu vào ra đo đ ợc là đang ở giai đoạn quá độ c a hệ th ng
nu ny
Khi không có nhiễu uk Đ i t ợng
yk
1
p * X T DX
đi u khi n
y col y1 , , yN , X col x T1 , , x TN
a1 , ,an Thuật toán
b0 , ,bm nhận dạng
quan của các tín hiệu vào ra:
y col ruy (0), , ruy (N / ) với N / N 5
xTl col ruy (l 1), , ruy (l n ), ru (l ), , ru (l m )
GS. Nguyễn Doãn Phước 4
ng dụng t i u hóa uk Đ i t ợng
yk
đi u khi n
Quan sát trạng thái t i u
x k 1 Ax k Bu k
1. Mô hình trạng thái
xk
Bộ quan sát
yk C x k Du k
t i u
2. Đo tín hiệu vào ra u k i , y , i 0,1, , N trong quá khứ rồi từ đó xác định trạng
k i
thái của hệ x k ở thời điểm hiện tại t kTa sao cho tổng bình phương sai lệch giữa
trạng thái quan sát được và trạng thái thực là nhỏ nhất.
u k N
X T X X T a AN 1B , , AB , B
K t quả:
1
x k AN
u k 2
u k 1
C y k N D
u k N
u k N 1
trong đó
CA y k N 1 CB
D
X , a
N 1
CA y CAN 2B CAN 3B D u k 1
N
k 1 N 1
CB
y CA B CAN 2B
CA CAB CB D u k
k
GS. Nguyễn Doãn Phước 5
ng dụng t i u hóa
Quan sát trạng thái Kalman
x k 1 Ak x k Bk u k n k
1. Mô hình trạng thái
nk
vk
yk C k x k Dk u k v k
uk yk
Đ i t ợng
đi u khi n
2. Đo tín hiệu vào ra u k , y ở thời điểm hiện tại rồi từ đó xác
k
định trạng thái của hệ sao cho kỳ vọng của tổng bình phương
xk
Bộ quan sát
sai lệch giữa trạng thái quan sát được x k và trạng thái thực x k t i u Kalman
là nhỏ nhất.
K t quả:
1. Chọn K 0 tùy ý. Thực hiện lần lượt bước tính sau với k 1, 2,
2. Tính Pk Ak 1Kk 1AkT1 N
với N là ma trận tương quan của nhiễu n k
1
Lk PkC kT C k PkC kT V
Kk I LkC k Pk
với V là ma trận tương quan của nhiễu v k
x k/ Ak 1x k 1 Bk 1u k 1
k k 1 k N
xây dựng từ chỉ tiêu chất lượng muốn có của hệ.
t
Chẳng hạn:
J (p ) (w k i y k i )T Q (w k i y k i ) uTk i Ru k i
N
i 0
khi chất lượng yêu cầu là bám ổn định, trong đó Q , R là hai ma trận đối xứng xác
định dương tùy chọn.
3. Tối ưu hóa: Là thuật toán tối ưu được áp dụng để tìm nghiệm p arg minN J (p ) . Trong
*
p U
col (u *k , , u *k N
*
số nghiệm tối ưu p *
) tìm được thì chỉ sử dụng phần tử đầu tiên u k
Xây dựng bộ điều khiển dự báo để tín hiệu ra y k bám theo tín hiệu mẫu w k
i 0
sẽ được u k I , 0, , 0 p
TQ x k w
1
trong đó p TQ R
wk uk
CAN 1 CAN 2B CB D
N 2 N 3
w k 1 , CA
, p u k 1
CA B D 0
w
,
w k N u k N
C D 0
Q diag qi , R diag ri
0
Phân loại
1. Theo trạng thái đầu là cho trước hoặc bất kỳ
2. Theo trạng thái cuối là cho trước hoặc bất kỳ
3. Theo thời gian xảy ra quá trình tối ưu là cho trước hoặc cũng là biến tối ưu cần tìm
H
3. Sử dụng thêm quan hệ Euler-Langange p
T
trong đó biến p phải thỏa mãn
điều kiện biên: x
p (0) 0 khi có điểm trạng thái đầu x 0 là bất kỳ
p (T ) 0 khi có điểm trạng thái cuối xT là bất kỳ
Tính chất cơ bản của hàm Hamilton: Dọc theo quỹ đạo tối ưu thì hàm Hamilton sẽ:
1. Có giá trị là hằng số
2. Nếu xT là bất kỳ và T thì có giá trị bằng 0
x Ax Bu , J (u ) xTQx uT Ru dt , Q QT 0, R RT 0
trong đó P P 0 là nghiệm
0
PBR 1BT P AT P PA Q
u x
Bộ điều khiển LQR: RLQR R 1BT P
Đ i t ợng
tuy n tính
Bộ đi u
Một số điều kiện đủ để hệ kín ổn định:
1. Khi bài toán có Q Q 0
khi n LQR
T
k
ng dụng LQR vào đi u khi n dự báo hệ song tuy n (*)
x A(x )x B (x )u
Bài toán: Cho hệ song tuyến
t
y C (x )x D (x )u
tk tk 1
và tín hiệu mẫu w (t ) . Hãy tìm bộ điều khiển phản hồi trạng thái để tín hiệu ra y (t ) bám
theo được tín hiệu mẫu.
khoảng thời gian k để thực hiện, mặc dù rất nhỏ, nên khi tk t tk 1 tk k ta có thể xấp
Kết quả: Vì nguyên tắc điều khiển dự báo làm việc theo vòng lặp và mỗi vòng lặp cần có một
1. Tại thời điểm tk đo x k x (tk ) và tùy chọn Qk , Rk đối xứng xác định dương
4. Đưa u RLQR (x x s ) u s vào điều khiển và quay về 1. để tính u tại thời điểm tk 1
1. Gán BN (x N ) 0 và k N 1
2. Tính u k (x k ) arg min g (x k , u k ) Bk 1 f (x k , u k )
*
uk
và từ đó là Bk (x k ) g (x k , u k ) Bk 1 f (x k , u k )
* *
Với bài toán có hệ là tuyến tính, hàm mục tiêu dạng toàn phương:
x k 1 Ax k Bu k , J x N 1Lx N 1 x Tk Qx k uTk Ru k
1 T N
2 k 0
trong đó N có thể là hữu hạn N hoặc vô hạn N , thì tín hiệu điều khiển tối ưu có
1
dạng on-line: u R BT P B
k 1 BT Pk 1Ax k trong đó Pk là nghiệm của phương trình
k
đại số Riccati:
1
1. Khi N là hữu hạn: Pk Q A Pk 1A A Pk 1B R B Pk 1B BT Pk 1A
T T T
trong đó: PN 1 L
1
P Q A PA A PB R B PB
T T T
BT PA
x k 1 A(x k )x k B (x k )u k
Bài toán: Cho hệ song tuyến
y k C (x k )x k D (x k )u k
và dãy giá trị tín hiệu mẫu {wk } . Tìm bộ điều khiển phản
hồi trạng thái để đầu ra y k bám theo được tín hiệu mẫu.
Kết quả: Vì là phản hồi trạng thái nên ở thời điểm hiện tại,
khi đã có x k hệ đã cho luôn biểu diễn được dưới dạng
tham số hằng (LTI):
x k 1 k x k k u k với k A(x k ), k B (x k ), k C (x k ), k D (x k )
1. Tại thời điểm k đo x k và tùy chọn Qk , Rk đối xứng xác định dương
x s , u s thỏa mãn x s k x s k u s và w k k x s k u s
2. Tính
1
3. Xác định RLQR Rk kT P
kT P k
1
với P Qk kT P k kT P k Rk kT P k kT P k
4. Đưa u k u s RLQR (x k x s ) vào điều khiển và gán k k 1 rồi quay về 1.
2. Nếu ký hiệu M (x , p ) max H (x , u , p ) thì tại điểm cuối T sẽ có: M x (T ), p (T ) 0
uU
3. Nếu sử dụng biến đồng trạng thái thỏa mãn quan hệ Euler-Lagrange p H x
T
thì điều kiện 2 trên còn đúng với mọi 0 t T , tức là dọc theo quỹ đạo tối ưu có:
M (x * , p * ) H (x * , u * , p * ) 0
4. Nếu bài toán có thêm điều kiện ràng buộc về điểm đầu hoặc điểm cuối x (0) S 0 , x (T ) ST
thì còn có: p (0) S 0 hoặc p (T ) ST
z 2 Lf (x )
Với hệ phi tuyến affine bậc 2 một đầu vào:
x f (x ) h (x )u , x (x1 , x 2 )T , f (0) 0
thì bộ điều khiển:
k sgn (x ) khi (x ) 2k (x ) L (x ) L (x ) 0
u r (x ) k sgn (x ) khi (x ) 0 , (x ) 0
f f
0 khi (x ) L (x ) 0
f z1 (x )
(x )
Lh (x ) h (x ) 0 và Lh Lf (x ) 0, x
x
sẽ làm hệ ổn định tiệm cận tại gốc sau khoảng thời gian hữu hạn,
tức là sau khi bị nhiễu tức thời đánh bật ra khỏi gốc thì bộ điều
khiển trên sẽ kéo hệ về trở lại gốc sau một khoảng thời gian T
3. Tìm hàm r (x ) để W x , r (x ) trở thành xác định âm. Khi đó V (x ) được gọi là hàm
điều khiển Lyapunov (CLF)
GS. Nguyễn Doãn Phước 18
Đi u khi n thích nghi
Ph ơng pháp backstepping
x f (x ) H (x )z
Xét hệ truyền ngược
z (x , z ) G (x , z )u
trong đó z là một phần vector trạng thái col x , z , có số
chiều đúng bằng số các tín hiệu vào u là m và ma trận
vuông G (x , z ) kiểu m m là không suy biến.
Nếu hệ con x f (x ) H (x )z đã có hàm Lyapunov Vz (x ) cùng một bộ điều khiển phản
hồi trạng thái r z (x ) thỏa mãn r z (0) 0 làm nó ổn định tiệm cận, thì hệ truyền ngược đã
cho cũng sẽ có hàm điều khiển Lyapunov là:
V (x , z ) Vz (x )
1
2
z r z (x ) Q z r z (x )
T
với Q là ma trận xác định dương tùy chọn
u r (x ) ax f (x ) , a 0
1
h (x )
GS. Nguyễn Doãn Phước 19
Đi u khi n thích nghi
Đi u khi n thích nghi giả định rõ
Bài toán: Cho hệ tham số hằng bất định Cơ cấu
x f (x ) G (x ) H (x )u
chỉnh định
w
trong đó là vector các tham số hằng không xác định được
Bộ đi u u Đ i t ợng x
khi n đi u khi n
2. Thay không biết bởi hàm phụ huộc thời gian (t ) . Sau đó sử dụng hàm CLF thích
nghi:
V (x , ) Vc (x , ) ( ) Q ( ) với Q QT 0 tùy chọn
1 T
Vc
f (x ) G (x ) H (x )r c (x , ) 0
2
x
thỏa mãn điều hiển nhiên
để tìm cơ cấu chỉnh định cho tức là tìm d dt sao cho có được dV dt xác định
Vc x
u H (x )
T
x
x Vc
1. Bộ điều khiển: 2
H (x )
x
2. Cơ cấu chỉnh định: Q
1
G (x )
T
V
c
x
1. Nếu tìm được hàm CLF Vc (x ) không phụ thuộc thì bộ điều khiển sẽ đơn giản là:
u r c (x , )
Vc
H (x ) 0 ,
x
2. Bộ điều khiển và cơ cấu chỉnh định trên vẫn sử dụng được khi chỉ có
với x X nhưng khi x X lại có LfVc (x , ) 0,
đã có hàm CLF thích nghi V1 (x , ) cùng bộ điều khiển GAS z r 1 (x , ) thỏa mãn r 1 (0,0) 0
V1 V1
1
V1
p1 W (x )
x 1
f (x ) G (x ) H (x )r (x , )
1 1 1
trong đó W (x ) là hàm xác định âm, thì hệ đã cho cũng sẽ có bộ điều khiển thích nghi:
r
u 2 p1 f 1 G1 p H1z R
1
H1 f 2 G 2 p
T
r V
x x
(p ) 1 1 1
trong đó ( p ) là ma trận giả nghịch đảo bên phải của H , cùng với hai cơ cấu chỉnh định:
2 2
p Q G 2 (x , z )R z r 1 R
1
G1 z r 1 , p1 (x , )
T
r
T 1
x
có Q , R là hai ma trận đối xứng xác định dương tùy chọn
GS. Nguyễn Doãn Phước 22
Đi u khi n thích nghi R
Đi u khi n thích nghi theo mô hình mẫu w u Đ i t ợng x
tuy n tính
x Ax B u G (x )
Bài toán cơ cở: Xét hệ LTI chứa tham số bất định (đối tượng):
Cơ cấu
chỉnh định
x m Ax m Bw
mẫu
TTHCX
G (x )p có E E T 0 tùy chọn
w u Đ i t ợng x
phi tuy n
2. Mô hình tham số bất định M (q , )q C (q , q , )q g (q , ) u F q , q , q
Bài toán: Xác định bộ điều khiển để các biến khớp q (q1 , , qn )T
bám tiệm cận theo được quỹ đạo mẫu cho trước w (w1 , , wn )T
x1
x
x2
2 M (x 1 ) C (x )x 2 g (x 1 ) u
x 1
trong đó x 1 q và x 2 q
Các tính chất trên luôn đúng ngay cả khi hệ có chứa tham số bất định
e I
khi n Lagrange
và x , A , M (q , p ) F (q ,q,q)
1
e K1 K 2 I
, B
v w (w q ) w e , e w q
Đặc đi m:
3. giai đoạn thứ 2 của quá trình quá độ, khi đã có r 0 song chưa có e 0
Bộ điều khiển: u M w
K1e K 2e Cq g s (t )
trong đó K1 , K 2 là hai ma trận đối xứng xác định dương tùy chọn,
I
t
có A và Q Q 0 là tùy chọn.
K1 K 2
T
1. Phước,N.D: Tối ưu hóa trong điều khiển và điều khiển tối ưu. NXB Bách khoa (chuẩn bị xuất bản 2015).
2. Phước,N.D: Phân tích và điều khiển hệ phi tuyến. NXB Bách khoa, 2012.
3. Phước,N.D: Lý thuyết điều khiển nâng cao. NXB Khoa học và kỹ thuật, In lần thứ 3, 2009.
4. Phuoc,N.D. and Ha,L.T.T: Constrained output tracking control for time-varying bilinear systems via RHC
with infinite prediction horizon. Journal of Informatic and Cybernetic. Vietnam Academy of Science and
Technology, submited 2015.
5. Phước,N.D và Hà,L.T.T: Điều khiển bám thích nghi bền vững hệ phi tuyến có thành phần bất định hàm
không bị chặn. Tạp chí Khoa học và Công nghệ. Viện Hàn lâm Khoa học Việt Nam, số 53, tập 1, trang 9-
17, 2015.
6. Phước,N.D và Hà,L.T.T: Robust and adaptive tracking controller design for gearing transmission systems
by using its third oder model. Tạp chí KH&CN các trư ng Đại học kỹ thuật. Đại học Bách khoa Hà Nội.
Số 91, trang 12-17, 2012.
7. Phuoc,N.D.: Combining exact linearization and model reference techniques for design of adative global
asymptotic stabilizer to adaptive control of induction motor. Proceedings of EPE Conference 9.2005,
Germany. IEEE catalog number 05EX1132C. Vol.DS1-2, No. 251, trang P1-P8, 2005.