0% found this document useful (0 votes)
11 views

Stat1371 - Topic 4

Topic 4 Statistics
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
11 views

Stat1371 - Topic 4

Topic 4 Statistics
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 7

Chủ đề 4.

Biến ngẫu nhiên liên tục


1. Biến ngẫu nhiên liên tục.
- Là biến ngẫu nhiên mà mọi giá trị cũng có thể (vận tốc ô tô, nhiệt độ lúc 1h
chiều…).
- Một thuộc tính quan trọng (key property) của biến ngẫu nhiên liên tục
(continuous random variable) là nó đạt được xác suất bằng 0 với bất kì giá trị (duy
nhất) nào.
𝑃(𝑋 = 𝑥) = 0 với ∀𝑥 ∈ 𝑅

- Biến cố 𝑋 ∈ (𝑎, 𝑏] với khoảng độ dài 𝑏 − 𝑎 > 0.


+ Nếu X là biến ngẫu nhiên liên tục:
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

+ Chia (𝑎, 𝑏] thành n khoảng con ∆𝑥 bằng nhau:


𝑃(𝑎+(𝑖−1)∆𝑥<𝑋≤𝑎+𝑖∆𝑥)
𝑓̂(𝑖, ∆𝑥) = , với 𝑖 = 1,2, … , 𝑛
∆𝑥
sao cho: 𝑃(𝑎 < 𝑋 ≤ 𝑏) = ∑𝑛𝑖=1 𝑓̂(𝑖, ∆𝑥) ∗ ∆𝑥

- Xét bất kì chuỗi 𝑖 = 𝑖(𝑛) sao cho:


lim (𝑎 + 𝑖∆𝑥) = 𝑥 ∈ (𝑎, 𝑏]
𝑛→∞
và cho 𝑓 ≥ 0 là hàm tích phân (intergrable function) trên R sao cho:
𝑓(𝑥) = lim 𝑓̂(𝑖, ∆𝑥)
𝑛→∞
Thì:
𝑏
𝑃(𝑎 < 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎

2. Hàm mật độ xác suất.


- Hàm mật độ xác suất (pdf) hay đơn giản là mật độ xác suất là hàm không âm
𝑓(𝑥) ≥ 0 nào thỏa mãn:

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
- Ta cũng định nghĩa hàm phân bố xác suất (cdf):
𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞
- Hàm phân bố xác suất là hàm thỏa mãn:
+ 0 ≤ 𝐹(𝑥) ≤ 1 do 𝐹 biểu diễn một số xác suất.
+ 𝐹(𝑥) là một hàm không giảm của x.
+ Nếu 𝑎 < 𝑏 thì:
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑋 ≤ 𝑏) − 𝑃(𝑋 ≤ 𝑎) = 𝐹(𝑏) − 𝐹(𝑎)
+ 𝐹(−∞) = 0; 𝐹(+∞) = 1.
Ví dụ: Tìm 𝑐 sao cho hàm không âm sau là một hàm mật độ xác suất của một biến
ngẫu nhiên liên tục:
0, 𝑣ớ𝑖 𝑥 ≤ 0
𝑓(𝑥) = { −4𝑥
𝑐𝑒 , 𝑣ớ𝑖 𝑥 > 0
Theo định nghĩa của 𝑓 ta có:
∞ ∞
∫ 𝑓(𝑥)𝑑𝑥 = 1 ⟹ ∫ 𝑐𝑒 −4𝑥 𝑑𝑥 = 1
−∞ 0
1
Đặt: 𝑦 = 4𝑥 ⟹ 𝑑𝑦 = 4𝑑𝑥 ⟹ 𝑑𝑥 = 𝑑𝑦, ta có:
4
∞ ∞
−4𝑥
𝑐 −𝑦
𝑐 ∞ −𝑦
∫ 𝑐𝑒 𝑑𝑥 = ∫ 𝑒 𝑑𝑦 = ∫ 𝑒 𝑑𝑦 = 1
0 0 4 4 0
𝑐
⟹ =1⟹𝑐=4
4

3. Giá trị trung bình của biến ngẫu nhiên liên tục.
- Gọi 𝑔 là hàm liên tục bất kì.
- Giá trị kì vọng của 𝑔(𝑋) của biến ngẫu nhiên liên tục X có mật độ xác suất 𝑓
được định nghĩa:

𝐸[𝑔(𝑋)] = ∫ 𝑔(𝑥)𝑓(𝑥)𝑑𝑥
−∞
- Giá trị kì vọng hay trung bình của X

𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞

4. Phương sai của biến ngẫu nhiên liên tục.



𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 − 𝜇2
−∞

5. Phân vị (hay phần trăm).


- Phân vị (quantile) thứ 𝑞 là giá trị 𝑥 sao cho:
𝑥
∫ 𝑓(𝑡)𝑑𝑡 = 𝑞%
−∞
- Trung bình (hay phân vị thứ 50) là giá trị 𝑥 sao cho:
𝑥
𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 = 0.5
−∞

6. Phân bố đồng đều.


- Phân bố đồng đều (uniform distribution) với tham số 𝑎 và 𝑏 sao cho 𝑎 < 𝑏 có
hàm mật độ xác suất:
1
1 , 𝑣ớ𝑖 𝑎 < 𝑥 < 𝑏
𝑓(𝑥) = ∗ 1(𝑎,𝑏) (𝑥) = { 𝑏 − 𝑎
𝑏−𝑎
0, 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑘ℎá𝑐
- Hàm phân phối xác suất (cdf) tương ứng:
0, 𝑣ớ𝑖 𝑥 ≤ 𝑎
𝑥−𝑎
𝐹(𝑥) = { , 𝑣ớ𝑖 𝑎 < 𝑥 ≤ 𝑏
𝑏−𝑎
1, 𝑣ớ𝑖 𝑥 > 𝑏
- Kí hiệu: 𝑋 ~ 𝑈(𝑎, 𝑏)
- Phân bố đồng đều tiêu chuẩn (standard uniform) là 𝑈(0,1)
- Hàm 1𝐴 (𝑥) gọi là hàm chỉ thị (indicator function) của tập A.
Nó bằng 1 nếu 𝑥 ∈ 𝐴 và bằng 0 nếu 𝑥 ∉ 𝐴.
- Nếu 𝑋 ~ 𝑈(𝑎, 𝑏) thì:
𝑎+𝑏
Kì vọng: 𝐸(𝑋) = 𝜇 =
2
(𝑏−𝑎)2
Phương sai: 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 =
12

7. Mật độ xác suất chuẩn:


- Mật độ xác suất chuẩn (normal probability density) được cho bởi:
(𝑥−𝜇)2
2) 1 −
𝑓(𝑥; 𝜇, 𝜎 = 𝑒 2𝜎2 với 𝑥 ∈ 𝑅
√2𝜋𝜎
- Nó có 2 thông số:
+ Thông số vị trí 𝜇 = 𝐸(𝑋) ∈ R
+ Thông số phân bố 𝜎 2 = 𝑉𝑎𝑟(𝑋) > 0
- Kí hiệu: 𝑋 ~ 𝑁(𝜇, 𝜎 2 )
* 𝜇 và 𝜎:
Cùng 𝜇, khác 𝜎 Cùng 𝜎, khác 𝜇

+ Hàm mật độ xác suất luôn đối xứng về 𝜇.


+ 𝜎 càng lớn, đồ thị hàm mật độ xác suất càng phân bố rộng.

8. Biến ngẫu nhiên tiêu chuẩn.


- Giá trị chuẩn với giá trị trung bình bằng 0 và phương sai bằng 1 gọi là biến ngẫu
nhiên tiêu chuẩn (standard normal random variable) và thường được kí hiệu là Z.
- Có 𝑍 ~ 𝑁(0,1)
với
−𝑧2
1
𝑓(𝑧) = 𝜙(𝑧) = 𝑒 2 với −∞ < 𝑧 < ∞
√2𝜋

9. Biến ngẫu nhiên chuẩn hóa.


- Hàm phân bố chuẩn 𝐹(𝑥; 𝜇, 𝜎 2 ) không có dạng chuẩn vì
𝑥 (𝑡−𝜇)2
2)
1 −
𝐹(𝑥; 𝜇, 𝜎 = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑒 2𝜎2 𝑑𝑡
√2𝜋𝜎 −∞
2
- Gọi 𝑋 ~ 𝑁(𝜇, 𝜎 ), suy ra tâm (tới giá trị trung bình bằng 0) và chuẩn hóa (tới
phương sai bằng 1) ngẫu nhiên
𝑋−𝜇
𝑍= ~ 𝑁(0,1)
𝜎
Kết quả:
𝑧
1 −𝑡 2
𝑃(𝑍 = 𝑧) = Φ(𝑧) = ∫ 𝑒 2 𝑑𝑡
−∞ √2𝜋
- Điều này có nghĩa là
𝑋−𝜇 𝑥−𝜇 𝑥−𝜇 𝑥−𝜇
𝑃(𝑋 ≤ 𝑥) = 𝑃 ( ≤ ) = 𝑃 (𝑍 ≤ ) = Φ( )
𝜎 𝜎 𝜎 𝜎
𝑥−𝜇
- Kí hiệu: 𝑧 = là điểm 𝑧 (𝑧-score)
𝜎

* Sự chuẩn hóa:
+ Nếu 𝑋 là biến ngẫu nhiên bất kì với giá trị trung bình 𝜇 và phương sai 𝜎 2 thì
𝑋−𝜇
𝑌=( )
𝜎
gọi là phiên bản chuẩn hóa (standardised version) của 𝑋.
𝑋−𝜇
+ Nếu 𝑌 = (
𝜎
) với 𝐸(𝑋) = 𝜇 và 𝑉𝑎𝑟(𝑋) = 𝜎 2
thì 𝐸(𝑌) = 0, và 𝑉𝑎𝑟(𝑌) = 1

10. Bảng xác suất tiêu chuẩn.


- Ta dùng bảng xác suất tiêu chuẩn (standard normal probability table) để tính
xác suất liên kết với bất kì điểm 𝑧 nào.

Ví dụ: Tính 𝑃(𝑍 ≤ 0.43)?


Ta lấy 𝑧 xấp xỉ 2 chữ số thập phân, xác định hàng thích hợp trong bảng với hàng
thập phân đầu tiên, sau đó xác định cột đại diện cho hàng thập phân thứ hai.
Giao điểm của hàng và cột là 𝑃(𝑍 ≤ 𝑧).
Từ bảng ta tính được 𝑃(𝑍 ≤ 0.43) = 0.6664.
Trường hợp ngoại lệ là khi kết thúc ở giữa hai ô, như tìm 𝑃(𝑍 ≤ 0.435)
Khi đó ta nên lấy trung bình của hai ô đó
1
𝑃(𝑍 ≤ 0.435) ≈ (𝑃(𝑍 ≤ 0.43) + 𝑃(𝑍 ≤ 0.44))
2
1
= (0.6664 + 0.6700) = 0.6682
2

*Đối với trường hợp không tiêu chuẩn


Ví dụ: Giả sử 𝑋 ~ 𝑁(3, 22 ). Tìm 𝑃(𝑋 ≤ 4) và 𝑃(𝑋 ≤ 1.24)
Ta có:
𝑋−3
𝑍= ~ 𝑁(0,1)
2
4−3
Điểm z cho 𝑃(𝑋 ≤ 4) là: 𝑧 = = 0.50
2
𝑋−3 4−3
và 𝑃(𝑋 ≤ 4) = 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ 0.50) = 0.6915
2 2
Với 𝑃(𝑋 ≤ 1.24)
𝑋 − 3 1.24 − 3
𝑃(𝑋 ≤ 1.24) == 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ −0.88) = 0.1894
2 2

* Đối với trường hợp 𝑃(𝑋 ≥ 𝑥)


Ví dụ: 𝑋 ~ 𝑁(1500, 3002 ). Tìm 𝑃(𝑋 ≥ 1630)
1630−1500
Điểm z cần tìm là: 𝑧 = = 0.43
300
𝑃(𝑋 ≥ 1630) = 𝑃(𝑍 ≥ 0.43) = 1 − 𝑃(𝑍 < 0.43) = 1 − 0.6664 = 0.3336

* Đối với trừng hợp 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏)


Ví dụ: 𝑋 ~ 𝑁(70, 3.32 ). Tìm 𝑃(69 ≤ 𝑋 ≤ 74)
69−70 74−70
𝑃(69 ≤ 𝑋 ≤ 74) = 𝑃 ( ≤𝑍≤ ) = 𝑃(−0.30 ≤ 𝑍 ≤ 1.21)
3.3 3.3
= 𝑃(𝑍 ≤ 1.21) − 𝑃(𝑍 ≤ −0.30) = 0.8869 − 0.3821 = 0.5048
với 𝑃(𝑍 ≤ −0.30) = 𝑃(𝑍 ≥ 0.30), vì Z đối xứng (symmetric) qua 0
= 1 − 𝑃(𝑍 ≤ 0.30), sử dụng quy tắc bổ sung
= 1 − 0.6179 = 0.3821

* Một số tính chất (identities) của biến ngẫu nhiên chuẩn.


+ 𝜙(−𝑧) = 𝜙(𝑧), vì tính đối xứng của biến chuẩn, 𝜙
+ Φ(−𝑧) = 1 − Φ(𝑧), vì tính đối xứng của biến chuẩn, 𝜙 và ∫ 𝜙(𝑡)𝑑𝑡 = 1
+ Với bất kì 𝑧 > 0
𝑃(|𝑍| ≤ 𝑧) = 𝑃(−𝑧 ≤ 𝑍 ≤ 𝑧) = Φ(𝑧) − Φ(−𝑧) = 2Φ(𝑧) − 1
+ 𝑃(|𝑍| ≥ 𝑧) = 2(1 − Φ(𝑧))

* Tìm phân vị.


Ví dụ: Cho 𝑋 ~ 𝑁(5, 32 ). Tìm hằng số 𝑐 sao cho 𝑃(𝑋 > 𝑐) = 0.1
Ta có: 0.1 = 𝑃(𝑋 > 𝑐) = 1 − 𝑃(𝑋 ≤ 𝑐) ⟹ 𝑃(𝑋 ≤ 𝑐) = 0.9
𝑐−5
Chuẩn hóa: 𝑃 (𝑍 ≤ ) = 0.9
3
𝑐−5
Mà 𝑃(𝑍 ≤ 𝑧) = 0.9 ⟹ 𝑧 = 1.28 ⟹ = 1.28 ⟹ 𝑐 = 5 + 3 ∗ 1.28 = 8.84
3
Một số phân vị thường dùng:
+ 𝑃(𝑍 ≤ 1.28) = 0.90
+ 𝑃(𝑍 ≤ 1.645) = 0.95
+ 𝑃(𝑍 ≤ 1.96) = 0.975

11. Quy luật 68 – 95 – 99.7.


- Quy tắc ngón tay cái (rule of thumb) cho xác suất thất bại trong khoảng 1, 2 và
3 độ lệch chuẩn của giá trị trung bình trong phân phối chuẩn.
𝜇−𝜎−𝜇 𝜇+𝜎−𝜇
𝑃(𝜇 − 𝜎 ≤ 𝑋 ≤ 𝜇 + 𝜎) = 𝑃 ( ≤𝑍≤ ) = 𝑃(−1 ≤ 𝑍 ≤ 1)
𝜎 𝜎
= 𝑃(𝑍 ≤ 1) − 𝑃(𝑍 ≤ −1) = 0.8413 − 0.1587 = 0.6826
Tương tự: 𝑃(𝜇 − 2𝜎 ≤ 𝑋 ≤ 𝜇 + 2𝜎) = 0.9544
𝑃(𝜇 − 3𝜎 ≤ 𝑋 ≤ 𝜇 + 3𝜎) = 0.9974

* Điều này có đúng với các phân phối khác?


Nếu 𝑋 ~ 𝑈(0,1) thì 𝐸(𝑋) = 𝜇 = 0.5 và 𝜎 = √1⁄12 = 0.2887
Vì 𝐹(𝑥) = 𝑥 ta có:
𝑃(𝜇 − 𝜎 ≤ 𝑋 ≤ 𝜇 + 𝜎) = 𝑃(𝑋 ≤ 𝜇 + 𝜎) − 𝑃(𝑋 ≤ 𝜇 − 𝜎) = 2𝜎 = 0.5774
Xác suất nhỏ hơn so với phân phối chuẩn.

12. Bất đẳng thức Chebyshev. (Chebyshev’s inequality)


- Nếu biến ngẫu nhiên 𝑋 có giá trị trung bình 𝜇 và phương sai 𝜎 2 , với mọi giá trị
hằng số 𝑐 dương:
1
𝑃(|𝑋 − 𝜇| ≥ 𝑐𝜎) ≤ 2
𝑐𝜎

13. Phân phối theo cấp số nhân.


- Nếu biến ngẫu nhiên có hàm mật độ xác suất (pdf)
0, 𝑣ớ𝑖 𝑥 ≤ 0
𝑓(𝑥) = { −𝜆𝑥
𝜆𝑒 , 𝑣ớ𝑖 𝑥 > 0
nó tuân theo phân phối theo cấp số nhân (exponential distribution).
- Hàm phân phối xác suất:
𝑥
−𝜆𝑥
𝐹(𝑥) = 1 − 𝑒 = ∫ 𝜆𝑒 −𝜆𝑡 𝑑𝑡
0
- Kí hiệu: 𝑋 ~ 𝐸𝑥𝑝(𝜆)
1
- Kì vọng: 𝐸(𝑋) =
𝜆
1
Phương sai: 𝑉𝑎𝑟(𝑋) =
𝜆2
−𝜆(𝑡+ℎ)
- 𝑃(𝑋 > 𝑡 + ℎ) = 𝑒 = 𝑒 −𝜆𝑡 ∗ 𝑒 −𝜆ℎ = 𝑃(𝑋 > 𝑡) ∗ 𝑃(𝑋 > ℎ)
vì vậy 𝑃(𝑋 > 𝑡 + ℎ|𝑋 > 𝑡) = 𝑃(𝑋 > ℎ) với 𝑡, ℎ > 0
14. Phân phối Gamma.
- Phân phối Gamma (gamma distribution) với tham số 𝛼 và 𝛽 có mật độ xác suất:
𝛽 𝛼 𝛼−1 −𝛽𝑥
𝑥 𝑒 , 𝑣ớ𝑖 𝑥, 𝛼, 𝛽 > 0
𝑓(𝑥) = { Γ(𝛼)
0, 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑘ℎá𝑐
- Kí hiệu: 𝑋 ~ Γ(𝛼, 𝛽)

* Γ(𝛼) là một hàm toán học đặc biệt (special mathematical function) gọi là hàm
gamma (gamma function) và được định nghĩa:

Γ(𝛼) = ∫ 𝑥 𝛼−1 𝑒 −𝑥 𝑑𝑥
0
+ Nó như hằng số chuẩn hóa (normalising constant) cho phân phối gamma với
𝛽 = 1.
+ Nó là một sự tổng quát hóa của 𝑛! với 𝑛 ∈ 𝑁
+ Γ(𝑛 + 1) = 𝑛!

- Nếu 𝑋 ~ Γ(𝛼, 𝛽) thì giá trị trung bình và phương sai của X là
𝛼 𝛼
𝜇 = 𝐸(𝑋) = và 𝜎 2 = 𝑉𝑎𝑟(𝑋) = 2
𝛽 𝛽

You might also like