0% found this document useful (0 votes)
15 views11 pages

Phần 1. Lý Thuyết Thống Kê Thpt

Uploaded by

mai tuyet
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
15 views11 pages

Phần 1. Lý Thuyết Thống Kê Thpt

Uploaded by

mai tuyet
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 11

HỆ THỐNG LÝ THUYẾT TOÁN THPT Điện thoại: 0946798489

PHẦN 1. LÝ THUYẾT VỀ TOÁN THỐNG KÊ


• Fanpage: Nguyễn Bảo Vương

Lớp 10

BÀI 1. CÁC SỐ ĐẶC TRƯNG ĐO XU THẾ TRUNG TÂM


1. SỐ TRUNG BÌNH VÀ TRUNG VỊ
A. SỐ TRUNG BÌNH
Số trung bình ( số trung bình cộng) của mẫu số liệu x1 , x2 ...xn , kí hiệu là x , được tính bằng công thức
x  x  ...  xn
x 1 2
n
Chú ý. Trong trường hợp mẫu số liệu cho dưới dạng bảng tần số thì số trung bình được tính theo công
m x  m2 x2  ...  mk xk
thức: x  1 1 , trong đó mk là tần số của giá trị xk và n  m 1 m2  ...  mk
n
Ý nghĩa. Số trung bình là giá trị trung bình cộng của các số trong mẫu số liệu, nó cho biết vị trí trung tâm
của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.
Ví dụ 1. Thống kê số cuốn sách mỗi bạn trong lớp đã đọc trong năm 2021, An thu được kết quả như bảng
bên. Hỏi trong năm 2021 , trung bình mổi bạn trong lớp đọc bao nhiêu cuốn sách?
Số cuốn sách 1 2 3 4 5
Số bạn 3 5 15 10 7
Lời giải
Số bạn trong lớp là n  3  5  15  10  7  40 (bạn).
Trong năm 2021, trung bình mỗi bạn trong lớp đọc số cuốn sách là:
3 1  5  2  15  3  10  4  7  5
 3,325 (cuốn).
40
Ý nghĩa. Số trung bình là giá trị trung bình cộng của các số trong mẫu số liệu, nó cho biết vị trí trung tâm
của mãu số liệu và có thể dùng để đại diện cho mẫu số liệu.
B. SỐ TRUNG VỊ
Để tìm trung vị (kí hiệu là Me) của một mẫu số liệu, ta thực hiện như sau:
Sắp xếp các giá trị trong mẫu số liệu theo thứ tự không giảm xác định số liệu phân bố n là chẵn hay lẻ
n 1
Nếu n lẻ thì số trung vị là số thứ
2
n n
Nếu n chẵn thì số trung vị là số trung bình cộng của hai số liên tiếp đứng thứ và  1
2 2
Ví dụ 2. Một công ty nhỏ gồm 1 giám đốc và 5 nhân viên, thu nhập mỗi tháng của giám đốc là 20 triệu
đồng, của nhân viên là 4 triệu đồng. Hãy tìm trung vị cho mẫu số liệu về lương của giám đốc và nhân
viên công ty được cho.
Lời giải
Để tìm trung vị của mẫu số liệu trên, ta làm như sau:
- Sắp xếp số liệu theo thứ tự không giảm:
4 4 44 4 20.
Hai giá tri chinh giua

- Dãy trên có hai giá trị chính giữa cùng bằng 4. Vậy trung vị của mẫu số liệu cũng bằng 4. Trong mẫu số
liệu được sắp xếp trên, số phần tử ở bên trái trung vị và số phần tử ở bên phải trung vị bằng nhau và bằng
3 . Lương của giám đốc cao hơn hẳn số trung bình, đây chính là giá tri bất thường. Nếu ta thay lương của
giám đốc là 30; 40;50 ;... (triệu đồng) thì trung vị vẫn không thay đổi trong khi số trung bình sẽ thay đổi.
Ý nghĩa. Trung vị là giá trị chia đôi mẫu số liệu, nghĩa là trong mẫu số liệu được sắp xếp theo thứ tự
không giảm thì giá trị trung vị ở vị trí chính giữa. Trung vị không bị ảnh hưởng bởi giá trị bất thường
trong khi số trung bình bị ảnh hưởng bởi giá trị bất thường.
2. TỨ PHÂN VỊ
Để tìm các tứ phân vị của mẫu số liệu có n giá trị, ta làm như sau:
- Sắp xếp mẫu số liệu theo thứ tự không giảm.
Facebook Nguyễn Vương https://www.facebook.com/phong.baovuong Trang 1
Blog: Nguyễn Bảo Vương: https://www.nbv.edu.vn/

- Tìm trung vị. Giá trị này là Q2 .


-Tìm trung vị của nửa số liệu bên trái Q2 (không bao gồm Q2 nến n lẻ). Giá trị này là Q1
-Tìm trung vị của nửa số liệu bên phải Q2 (không bao gồm Q2 nến n lẻ). Giá trị này là Q3 . Q1 , Q2 , Q3
được gọi là các tứ phân vị của mẫu số liệu.
Chú ý. Q1 được gọi là tứ phân vị thứ nhất hay tứ phân vị dưới, Q3 được gọi là tứ phân vị thứ ba hay tứ
phân vị trên
Ý nghĩa. Các điểm Q1 , Q2 , Q3 chia mẫu số liệu đã sắp xếp theo thứ tự từ nhỏ đến lớn thành bố phần, mỗi
phần đều chứa 25% giá trị

Ví dụ 3. Hàm lượng Natri (đơn vị miligam, 1mg  0, 001 g ) trong 100 g một số loại ngũ cốc được cho
như sau:

0 340 70 140 200 180 210 150 100 130


140 180 190 160 290 50 220 180 200 210.
Hãy tìm các tứ phân vị. Các tứ phân vị này cho ta thông tin gì?
Lời giải
- Sắp xếp các giá trị này theo thứ tự không giảm:
0 50 70 100 130 140 150 160 180 180 180 190 200 200 210 210 220 290 340
Hai giá trị chính giữa
- Vì n  20 là số chẵn nên Q2 là trung bình cộng của hai giá trị chính giữa Q2  180  180  : 2  180 .
- Ta tìm Q1 là trung vị của nửa số liệu bên trái Q2 .
0 50 70 100 130 140 140 150 160 180 và tìm được Q1  (130  140) : 2  135 .
- Ta tìm Q3 là trung vị của nửa số liệu bên phải Q2 .
180 180 190 200 200 210 210 220 290 và tìm được Q3  (200  210) : 2  205 .

Hình ảnh về sự phân bố của mẫu số liệu


Các tứ phân vị cho ta hình ảnh phân bố của mẫu số liệu. Khoảng cách từ Q1 đến Q2 là 45 trong khi
khoảng cách từ Q2 đến Q3 là 25 . Điều này cho thấy mẫu số liệu tập trung với mật độ cao ở bên phải của
Q2 và mật độ thấp ở bên trái của Q2 .
3. MỐT
Mốt của mẫu số liệu là giá trị xuất hiện với tần số lớn nhất
Ý nghĩa. Có thể dùng mốt để đo xu thế trung tâm của mẫu số liệu khi mẫu số liệu có nhiều giá trị trùng
nhau
Nhận xét. Mốt có thể không là duy nhất. Khi các giá trị trong mẫu số liệu xuất hiện với tần số như nhau
thì mẫu số liệu không có mốt.
Ví dụ 4. Thời gian truy cập Internet (đơn vị giờ) trong một ngày của một số học sinh lớp 10 được cho như
sau:
0 0 1 1 1 3 4 4 5 6
Trang 2 Fanpage Nguyễn Bảo Vương  https://www.facebook.com/tracnghiemtoanthpt489/
Điện thoại: 0946798489 HỆ THỐNG LÝ THUYẾT TOÁN THPT
Tìm mốt cho mẫu số liệu này.
Lời giải
Vì số học sinh truy cập Internet 1 giờ mỗi ngày là lớn nhất (có 3 học sinh) nên mốt là 1.

BÀI 2. CÁC SỐ ĐẶC TRƯNG ĐO ĐỘ PHÂN TÁN


1. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ
Khoảng biến thiên, kí hiệu là R , là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất trong mẫu số liệu.
Ý nghĩa. Khoảng biến thiên dùng để đo độ phân tán của mẫu số liệu. Khoảng biến thiên càng lớn thì mẫu
số liệu càng phân tán.
Ví dụ 1. Điểm kiểm tra học kì môn Toán của các bạn Tổ 1, Tổ 2 lớp 10 A được cho như sau:
Toå 1: 7 8 8 9 8 8 8
Toå 2: 10 6 8 9 9 7 8 7 8.
a) Điểm kiểm tra trung bình của hai tổ có như nhau không?
b) Tính các khoảng biến thiên của hai mẫu số liệu. Căn cứ trên chỉ số này, các bạn tổ nào học đồng đều
hơn?
Lời giải
a) Điểm kiểm tra trung bình của hai tồ đều bằng 8 .
b) Đối với Tổ 1: Điểm kiểm tra thấp nhất, cao nhất tương ứng là 7 ; 9 . Do đó khoảng biến thiên là:
R1  9  7  2 .
Đối với Tổ 2: Điểm kiểm tra thấp nhất, cao nhất tương ứng là 6; 10. Do đó khoảng biến thiên là:
R2  10  6  4 .
Do R2  R1 nên ta nói các bạn Tồ 1 học đều hơn các bạn Tồ 2 .
Nhận xét. Sử dụng khoảng biến thiên có ưu điểm đơn giản, dễ tính toán song khoảng biến thiên chỉ sử
dụng thông tin giá trị lớn nhất và giá trị nhỏ nhất mà bỏ quan thông tin từ tất cả các giá trị khác. Do đó,
khoảng biến thiên rất dễ bị ảnh hưởng bởi các giá trị bất thường.
Khoảng tứ phân vị, kí hiệu là Q , là hiệu số giữa tứ phân vị thứ ba và tứ phân vị thứ nhất, tức là:
Q  Q3  Q1 .
Ý nghĩa. Khoảng tứ phân vị cũng là một số đo độ phân tán của mẫu số liệu. Khoảng tứ phân vị càng lớn
thì mẫu số liệu càng phân tán.
Chú ý. Một số tài liệu gọi khoảng biến thiên là biên độ và khoảng tứ phân vị là độ trải giữa
Ví dụ 2. Mẫu số liệu sau cho biết số ghế trống tại một rạp chiếu phim trong 9 ngày:
7 8 22 20 15 18 19 13 11.
Tìm khoảng tứ phân vị cho mẫu số liệu này.
Lời giải
Trước hết, ta sắp xếp mẫu số liệu theo thứ tự không giảm:
7 8 11 13 15 18 19 20 22.
Mẫu số liệu gồm 9 giá trị nên trung vị là số ở vị trí chính giữa Q2  15 .
Nửa số liệu bên trái là 7,8,11,13 gồm 4 giá trị, hai phần tử chính giữa là 8,11 .
Do đó, Q1  (8  11) : 2  9,5 .
Nửa số liệu bên phải là 18,19, 20, 22 gồm 4 giá tri, hai phần tử chính giữa là 19,20 .
Do đó, Q3  (19  20) : 2  19,5 .
Vậy khoảng tứ phân vị cho mẫu số liệu là  Q  19,5  9,5  10 .
2. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
2 2 2

Phương sai là giá trị s 2 


 x  x   x
1 2  
 x  ...  xn  x 
n
2
Căn bậc hai của phương sai, s  s , được gọi là độ lệch chuẩn
Chú ý. Người ta còn sử dụng đại lượng để đo độ phân tán của mẫu số liệu:
2 2 2

s
2

 x  x   x
1 2 
 x  ...  xn  x  
n 1
Facebook Nguyễn Vương https://www.facebook.com/phong.baovuongTrang 3
Blog: Nguyễn Bảo Vương: https://www.nbv.edu.vn/
Ý nghĩa. Nếu số liệu càng phân tán thì phương sai và độ lệch chuẩn càng lớn.
Ví dụ 3. Mẫu số liệu sau đây cho biết sĩ số của 5 lớp khối 10 tại một trường Trung học:
43 45 46 41 40.
Tìm phương sai và độ lệch chuẩn cho mẫu số liệu này.
Lời giải
43  45  46  41  40
Số trung bình của mẫu số liệu là: x   43 .
5
Ta có bảng sau:
Giá tị ̣ Độ lệch Bình phương độ lệch
43 43  43  0 0
45 45  43  2 4
46 46  43  3 9
41 41  43  2 4
40 40  43  3 9
Tổng 26
26
Mẫu số liệu gồm 5 giá trị nên n  5 . Do đó phương sai là: s 2   5, 2 .
5
Độ lệch chuẩn là: s  5, 2  2, 28 .
3. PHÁT HIỆN SỐ LIỆU BẤT THƯỜNG HOẶC KHÔNG CHÍNH XÁC BẰNG BIỂU ĐỒ HỘP
Trong mẫu số liệu thống kê, có khi gặp những giá trị quá lớn hoặc quá nhỏ so với đa số các giá trị khác.
Những giá trị này được gọi là giá trị bất thường. Chúng xuất hiện trong mẫu số liệu có thể do nhầm lẫn
hay sai sót nào đó. Ta có thể dùng biểu đồ hộp để phát hiện những giá trị bất thường này.

Các giá trị lớn hơn Q3  1,5.Q hoặc bé hơn Q1  1,5.Q được xem là giá trị bất thường.
Ví dụ 4. Hàm lượng Natri (đơn vị mg) trong 100 g một số loại ngũ cốc được cho như sau:
0 340 70 140 200 180 210 150 100 130
140 180 190 160 290 50 220 180 200 210.
Tìm giá trị bất thường trong mẫu số liệu trên bằng cách sử dụng biều đồ hộp.
Lời giải
Từ mẫu số liệu ta tính được Q1  135 và Q3  205 . Do đó, khoảng tứ phân vị là:
 Q  205  135  70.
Biểu đồ hộp cho mẫu số liệu này là:

Ta có Q1  1,5   Q  30 và Q3  1,5   Q  310 nên trong mẫu số liệu có hai giá trị được xem là bất thường
là 340mg (Iớn hơn 310mg ) và 0mg (bé hơn 30mg ).

Trang 4 Fanpage Nguyễn Bảo Vương  https://www.facebook.com/tracnghiemtoanthpt489/


Điện thoại: 0946798489 HỆ THỐNG LÝ THUYẾT TOÁN THPT
Lớp 11

BÀI 3. CÁC SỐ ĐẶC TRƯNG ĐO XU THẾ TRUNG TÂM


1. SỐ TRUNG BÌNH CỦA MẪU SỐ LIỆU GHÉP NHÓM
Cho mẫu số liệu ghép nhóm
Nhóm  a1; a2    ai ; ai 1    ak ; ak 1 
Tần số m1  mi  mk
Bảng 3.2
Số trung bình của mẫu số liệu ghép nhóm kí hiệu là x .
m x  mk xk
x 1 1 .
n
a  ai 1
Trong đó n  m1  ...  mk là cỡ mẫu và xi  i (với i  1,...., k ) là giá trị đại diện của
2
nhóm  ai ; ai 1 
Chú ý. Đối với số liệu rời rạc, người ta thường cho các nhóm dưới dạng k1  k2 , trong đó
k1 , k2   . Nhóm k1  k2 được hiểu là nhóm gồm các giá trị k1 , k1  1,, k2 . Khi đó, ta cần hiệu
chỉnh mẫu dữ liệu ghép nhóm để đưa về dạng Bảng 3.2 trước khi thực hiện tính toán các số
đặc trưng bằng cách hiệu chỉnh nhóm k1  k2 với k1 , k2   thành nhóm  k1  0,5; k2  0,5 .
Chẳng hạn, với dữ liệu ghép nhóm điểm thi môn Toán trong Bảng 3.3 sau khi hiệu chỉnh ta
được Bảng 3.4 .

Ví dụ 1. Tìm cân nặng trung bình của học sinh lớp 11D cho trong Bảng 3.5.
Cân nặng [40,5; 45, 5) [45,5;50,5) [50,5;55,5) [55, 5;60,5) [60,5;65,5) [65,5;70, 5)
Số học sinh 10 7 16 4 2 3
Bảng 3.5. Cân nặng của học sinh lóp 11D
Giải
Trong mỗi khoảng cân nặng, giá trị đại diện là trung bình cộng của giá trị hai đầu mút nên ta có
bảng sau:
Cân nặng (kg ) 43 48 53 58 63 68
Số học sinh 10 7 16 4 2 3
Tổng số học sinh là n  42 . Cân nặng trung bình của học sinh lớp 11D là
10  43  7  48  16  53  4  58  2  63  3  68
x  51,81( kg ).
42
Ý nghĩa. Số trung bình của mẫu số liệu ghép nhóm xấp xỉ cho số trung bình của mẫu số liệu
gốc, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng đề đại diện cho mẫu số liệu.
2. TRUNG VỊ CỦA MẪU SỐ LIỆU GHÉP NHÓM
Cho mẫu số liệu ghép nhóm
Nhóm  a1; a2    ai ; ai 1    ak ; ak 1 
Tần số m1  mi  mk
Để tính trung vị của mẫu số liệu ghép nhóm, ta làm như sau:
Bước 1. Xác định nhóm chứa trung vị. Giả sử đó là nhóm thứ p :  a p ; a p 1  .
n
  m1  m p 1 
Bưóc 2. Trung vị là M e  a p  2   a p 1  a p  , trong đó n là cỡ mẫu, m p là
mp
tần số nhóm p . Với p  1 , ta quy ước m1  m p 1  0 .

Facebook Nguyễn Vương https://www.facebook.com/phong.baovuongTrang 5


Blog: Nguyễn Bảo Vương: https://www.nbv.edu.vn/
Ví dụ 2. Thời gian (phút) truy cập Internet mỗi buổi tối của một số học sinh được cho trong
bảng sau:
Thời gian (phút) [9, 5;12, 5) [12,5;15,5) [15,5;18,5) [18,5; 21,5) [21,5; 24,5)
Số học sinh 3 12 15 24 2
Tính trung vị của mẫu số liệu ghép nhóm này.
Giải
Cỡ mẫu là n  3  12  15  24  2  56 .
Gọi x1 ,, x56 là thời gian vào Internet của 56 học sinh và giả sử dãy này đã được sắp xếp theo
x x
thứ tự tăng dần. Khi đó, trung vị là 28 29 . Do 2 giá trị x28 , x29 thuộc nhóm [15,5;18,5) nên
2
nhóm này chứa trung vị. Do đó, p  3; a3  15,5; m3  15; m1  m2  3  12  15; a4  a3  3 và ta

56
 15
M   15,5  2  3  18,1.
15
Ý nghĩa. Trung vị của mẫu số liệu ghép nhóm xấp xỉ cho trung vị của mẫu số liệu gốc, nó chia
mẫu số liệu thành hai phần, mỗi phần chứa 50% giá trị.
3. TỨ PHÂN VỊ CỦA MẪU SỐ LIỆU GHÉP NHÓM
Cho mẫu số liệu ghép nhóm
Nhóm  a1; a2    ai ; ai1    ak ; ak 1 
Tần số m1  mi  mk
Để tính tứ phân vị thứ nhất Q1 của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa
Q1 , giả sử đó là nhóm thứ p :  a p ; a p 1  . Khi đó,
n
  m1  m p 1 
Q1  a p  4   a p 1  a p  ,
mp
trong đó, n là cỡ mẫu, m p là tần số nhóm p , với p  1 ta quy ước m1  m p 1  0 .
Để tính tứ phân vị thứ ba Q3 của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa Q3 .
Giả sử đó là nhóm thứ p :  a p ; a p 1  . Khi đó,
3n
  m1  m p 1 
Q3  a p  4   a p 1  a p  ,
mp
trong đó, n là cỡ mẫu, m p là tần số nhóm p , với p  1 ta quy ước m1  m p 1  0 .
Tứ phân vị thứ hai Q2 chính là trung vị M e .
Ví dụ 3. Tìm tứ phân vị thứ nhất Q1 và tứ phân vị thứ ba Q3 của mẫu số liệu ghép nhóm cho
trong Ví dụ 2.
Giải
Cỡ mẫu là n  56 .
x x
Tứ phân vị thứ nhất Q1 là 14 15 . Do x14 , x15 đều thuộc nhóm [12,5;15,5) nên nhóm này
2
chứa Q1 . Do đó, p  2; a2  12,5; m2  12; m1  3, a3  a2  3 và ta có
56
3
Q1  12,5  4  3  15, 25
12

Trang 6 Fanpage Nguyễn Bảo Vương  https://www.facebook.com/tracnghiemtoanthpt489/


Điện thoại: 0946798489 HỆ THỐNG LÝ THUYẾT TOÁN THPT
x x
Với tứ phân vị thứ ba Q3 là 42 43 . Do x42 , x43 đều thuộc nhóm [18,5; 21,5) nên nhóm này
2
chứa Q3 . Do đó, p  4; a4  18,5; m4  24; m1  m2  m3  3  12  15  30; a5  a4  3 và ta có
3.56
 30
Q3  18,5  4  3  20.
24
Nhận xét. Ta cũng có thể xác định nhóm chứa tứ phân vị thứ r nhờ tính chất: có khoảng
 r n 
  giá trị nhỏ hơn tứ phân vị này.
 4 
Ý nghĩa. Các tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ cho các tứ phân vị của mẫu số liệu
gốc, chúng chia mẫu số liệu thành 4 phần, mỗi phần chứa 25% giá trị.
4. MỐT CỦA MẪU SỐ LIỆU GHÉP NHÓM
Cho mẫu số liệu ghép nhóm
Nhóm  a1; a2    ai ; ai1    ak ; ak 1 
Tần số m1  mi  mk
Để tìm mốt của mẫu số liệu ghép nhóm, ta thực hiện theo các bước sau:
Bưóc 1. Xác định nhóm có tần số lớn nhất (gọi là nhóm chứa mốt), giả sử là nhóm j:  a j ; a j 1  .
m j  m j 1
Bước 2. Mốt được xác định là: M o  a j  h
 m j  m j 1    m j  m j 1 
trong đó m j là tần số của nhóm j (quy ước m0  mk 1  0 ) và h là độ dài của nhóm.
Lưu ý. Người ta chỉ định nghĩa mốt cho mẫu ghép nhóm có độ dài các nhóm bằng nhau. Một
mẫu có thể không có mốt hoặc có nhiều hơn một mốt.
Khi tần số của các nhóm số liệu bằng nhau thì mẫu số liệu ghép nhóm không có mốt.
Ví dụ 4. Bảng số liệu ghép nhóm sau cho biết chiều cao (cm) của 50 học sinh lớp 11A .
Khoảng chiều cao (cm) [145;150) [150;155) [155;160) [160;165) [165;170)
Số học sinh 7 14 10 10 9
Tính mốt của mẫu số liệu ghép nhóm này. Có thể kết luận gì từ giá trị tính được?
Giải
Tần số lớn nhất là 14 nên nhóm chứa mốt là nhóm [150;155) .
Ta có, j  2, a2  150, m2  14 , m1  7, m3  10, h  5 . Do đó
14  7
M 0  150   5  153,18.
(14  7)  (14  10)
Số học sinh có chiều cao khoảng 153,18 cm là nhiều nhất.
Ý nghĩa. Mốt của mẫu số liệu ghép nhóm xấp xỉ cho mốt của mẫu số liệu gốc, nó được dùng để
đo xu thế trung tâm của mẩu số liệu.

Lớp 12

Bài 4. KHOẢNG BIẾN THIÊN VÀ KHOẢNG TỨ PHÂN VỊ


1. KHOẢNG BIẾN THIÊN
Cho mẫu số liệu ghép nhóm:
Nhóm  a1; a2    a; ; ai 1    ak ; ak 1 
Tần số m1  mi  mk
trong đó các tần số m1  0, mk  0 và n  m1  mk là cỡ mẫu.
Khoảng biến thiên của mẫu số liệu ghép nhóm trên là R  ak 1  a1 .
Ý nghĩa. Khoảng biến thiên của mẫu số liệu ghép nhóm xấp xỉ cho khoảng biến thiên của mẫu số liệu
gốc. Khoảng biến thiên được dùng để đo mức độ phân tán của mâu số liệu ghép nhóm. Khoảng biến thiên
càng lớn thì mẫu số liệu càng phân tán.

Facebook Nguyễn Vương https://www.facebook.com/phong.baovuongTrang 7


Blog: Nguyễn Bảo Vương: https://www.nbv.edu.vn/
Ví dụ 1. Thống kê thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ 1, Tổ 2 lớp 12A, được kết
quả như bảng sau:
Thời gian sử dụng (phút) [0;10) [10;30) [30;60) [60;90)
Số học sinh Tổ 1 2 4 3 1
Số học sinh Tổ 2 5 1 3 0
Tìm khoảng biến thiên cho thời gian sử dụng mạng xã hội của học sinh mỗi tổ và giải thích ý nghĩa.
Giải
Gọi R1 , R2 tương ứng là khoảng biến thiên của mẫu số liệu ghép nhóm về thời gian sử dụng mạng xã hội
trong ngày của các bạn Tổ 1 và Tổ 2.
Ta có: R1  90  0  90 và R2  60  0  60 .
Do R1  R2 nên ta có thể kết luận rằng thời gian sử dụng mạng xã hội trong ngày của các bạn Tổ 1 phân
tán hơn thời gian sử dụng mạng xã hội của các bạn Tổ 2.
2. KHOẢNG TỨ PHÂN VỊ
Cho mẫu số liệu ghép nhóm:
Nhóm  a1; a2    a; ; ai 1    ak ; ak 1 
Tần số m1  mi  mk
r n
  m1  m p 1 
Tứ phân vị thứ r là Qr  a p  4   a p 1  a p  , trong đó  a p ; a p 1  là nhóm chứa tứ
mp
phân vị thứ r với r  1, 2,3 .
Khoảng tứ phân vị của mẫu số liệu ghép nhóm, kí hiệu là  Q , là hiệu số giữa tứ phân vị thứ ba Q3 và tứ
phân vị thứ nhất Q1 của mẫu số liệu đó, tức là  Q  Q3  Q1 .
Ý nghĩa. Khoảng tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ cho khoảng tứ phân vị của mẫu số liệu
gốc. Khoảng tứ phân vị cũng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm. Khoảng tứ
phân vị càng lớn thì mẫu số liệu càng phân tán.
Nhận xét. Do khoảng tứ phân vị của mẫu số liệu ghép nhóm chỉ phụ thuộc vào nửa giữa của mẫu số liệu,
nên không bị ảnh hưởng bởi các giá trị bất thường và có thể dùng đại lượng này để loại giá trị bất thường.
Ví dụ 2. Thời gian chờ khám bệnh của các bệnh nhân tại phòng khám X được cho trong bảng sau:
Thời gian (phút) [0;5) [5;10) [10;15) [15; 20)
Số bệnh nhân 3 12 15 8
a) Tìm khoảng tứ phân vị của mẫu số liệu ghép nhóm này.
b) Từ một mẫu số liệu về thời gian chờ khám bệnh của các bệnh nhân tại phòng khám Y người ta tính
được khoảng tứ phân vị bằng 9,23 . Hỏi thời gian chờ của bệnh nhân tại phòng khám nào phân tán hơn?
Giải
a) Cỡ mẫu là n  3  12  15  8  38 . Gọi x1 ,, x38 là thời gian chờ khám bệnh của 38 bệnh nhân này và
giả sử rằng dãy số liệu gốc này đã được sắp xếp theo thứ tự tăng dần. Tứ phân vị thứ nhất của mẫu số liệu
gốc là x10 nên nhóm chứa tứ phân vị thứ nhất là nhóm [5;10) và ta có:
 38 
  3
Q1  5   4   5  7,71.
 12 
 
Tứ phân vị thứ ba của mẫu số liệu gốc là x29 nên nhóm chứa tứ phân vị thứ ba là nhóm [10;15) và ta có:
 3  38 
 4  15 
Q3  10     5  14,5.
 15 
 
Vậy khoảng tứ phân vị của mẫu số liệu ghép nhóm là:  Q  Q3  Q1  14,5  7, 71  6, 79 .
b) Do  Q  6,79  9, 23 nên thời gian chờ của bệnh nhân tại phòng khám Y phân tán hơn thời gian chờ
của bệnh nhân tại phòng khám X .
Trang 8 Fanpage Nguyễn Bảo Vương  https://www.facebook.com/tracnghiemtoanthpt489/
Điện thoại: 0946798489 HỆ THỐNG LÝ THUYẾT TOÁN THPT
BÀI 5. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
1. PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
Cho mẫu số liệu ghép nhóm:
Nhóm  a1; a2    a; ; ai 1    ak ; ak 1 
Tần số m1  mi  mk
- Phương sai của mẫu số liệu ghép nhóm, kí hiệu là s 2 , là một số được tính theo công thức sau:
2 2
2 m1  x1  x   mk  xk  x  ai  ai 1
s  trong đó, n  m1  mk ; xi  với i  1, 2,, k là giá trị đại
n 2
m1 x1  mk xk
diện cho nhóm  ai ; ai 1  và x  là số trung bình của mẫu số liệu ghép nhóm.
n
- Độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu là s , là căn bậc hai số học của phương sai của mẫu
số liệu ghép nhóm, tức là s  s 2 .
1
Nhận xét. Ta có thể tính phương sai theo công thức: s 2 
n
 
m1  x12   mk  xk2  ( x )2 .
Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.
Ý nghĩa. Phương sai, độ lệch chuẩn của mẫu số liệu ghép nhóm là các xấp xỉ cho phương sai, độ lệch
chuẩn của mẫu số liệu gốc. Chúng được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm xung
quanh số trung bình của mẫu số liệu đó. Phương sai, độ lệch chuẩn càng lớn thì mẫu số liệu càng phân
tán.
Chú ý. Người ta còn sử dụng các đại lượng sau để đo mức độ phân tán của mâu số liệu ghép nhóm:
2 2
2 m1  x1  x   mk  xk  x 
sˆ  , sˆ  sˆ 2 .
n 1
Ví dụ 1. Người ta theo dõi sự thay đổi cân nặng, được tính bằng hiệu cân nặng trước và sau ba tháng áp
dụng chế độ ăn kiêng của một số người cho kết quả như sau:
Thay đổi cân nặng (kg ) [1;0) [0;1) [1; 2) [2;3) [3; 4)
Số người nam 2 3 5 3 2
Số người nữ 2 7 12 7 2
Tính số trung bình, phương sai, độ lệch chuẩn và nhận xét về sự thay đổi cân nặng của người nam, người
nữ sau ba tháng áp dụng chế độ ăn kiêng.
Giải
Chọn giá trị đại diện cho các nhóm số liệu, ta có:
Giá trị đại diện 0, 5 0,5 1,5 2,5 3,5
Số người nam 2 3 5 3 2
Số người nữ 2 7 12 7 2
Tổng số người nam là: n1  2  3  5  3  2  15 .
Tổng số người nư là: n2  2  7  12  7  2  30 .
Thay đổi cân nặng trung bình của người nam là:
1
x1  [2  (0, 5)  3  0,5  5 1,5  3  2,5  2  3,5]  1, 5( kg ).
15
Thay đổi cân nặng trung bình của người nữ là:
1
x2  [2  (0,5)  7  0,5  12 1, 5  7  2,5  2  3,5]  1, 5( kg ).
30
Phương sai và độ lệch chuẩn của mẫu số liệu về thay đổi cân nặng của người nam là:
1
s12   2  (0,5) 2  3  0, 52  5 1,52  3  2,52  2  3,52   1,52  1, 212 ; s1  1, 21.
15
Phương sai và độ lệch chuẩn của mẫu số liệu về thay đổi cân nặng của người nữ là:
1
s22   2  (0,5)2  7  0,52  12 1, 52  7  2, 52  2  3,52   1, 52  2, 062 ; s2  2, 06.
30
Như vậy, sau ba tháng áp dụng chế độ ăn kiêng này, về trung bình sự thay đổi cân nặng của nam và nữ là
như nhau. Tuy nhiên, sự biến động về thay đổi cân nặng của nữ nhiều hơn so với của nam.
Facebook Nguyễn Vương https://www.facebook.com/phong.baovuongTrang 9
Blog: Nguyễn Bảo Vương: https://www.nbv.edu.vn/
2. SỬ DỤNG PHƯƠNG SAI, ĐỘ LỆCH CHUẨN ĐO ĐỘ RỦI RO
Trong tài chính, người ta có nhiều cách để đo độ rủi ro của một phương án đầu tư. Một trong các cách đó
là sử dụng độ lệch chuẩn của lợi nhuận thu được theo phương án đầu tư. Độ lệch chuẩn càng lớn thì
phương án đầu tư càng rủi ro.
Ví dụ 2. Anh An đầu tư số tiền bằng nhau vào hai lĩnh vực kinh doanh A, B . Anh An thống kê số tiền thu
được mỗi tháng trong vòng 60 tháng theo mỗi lĩnh vực cho kết quả như sau:
Số tiền (triệu đồng) [5;10) [10;15) [15; 20) [20; 25) [25;30)
Số tháng đầu tư vào lĩnh vực A 5 10 30 10 5
Số tháng đầu tư vào lĩnh vực B 20 5 10 5 20
So sánh giá trị trung bình và độ lệch chuẩn của số tiền thu được mỗi tháng khi đầu tư vào mỗi lĩnh vực A,
B. Đầu tư vào lĩnh vực nào "rủi ro" hơn?
Giải
Chọn giá trị đại diện cho các nhóm số liệu ta có:
Giá trị đại diện 7,5 12,5 17,5 22,5 27,5
Số tháng đầu tư vào lĩnh vực A 5 10 30 10 5
Số tháng đầu tư vào lĩnh vực B 20 5 10 5 20
Số tiền trung bình thu được khi đầu tư vào các lĩnh vực A, B tương ứng là:
1
x A  (5  7,5  5  27,5)  17,5
60
1
xB  (20  7,5  20  27,5)  17,5
60
Như vậy, về trung bình đầu tư vào các lĩnh vực A, B số tiền thu được hàng tháng như nhau. Độ lệch
chuẩn của số tiền thu được hàng tháng khi đầu tư vào các lĩnh vực A, B tương ứng là:
1
sA 
60
 
5  7,52  5  27,52  (17,5) 2  5

1
sB 
60
 
20  7,52  20  27,52  (17,5) 2  8, 42.
Như vậy, độ lệch chuẩn của mẫu số liệu về số tiền thu được hàng tháng khi đầu tư vào lĩnh vực B cao
hơn khi đầu tư vào lĩnh vực A . Người ta nói rằng, đầu tư vào lĩnh vực B là "rủi ro" hơn.
Ví dụ sau cho thấy không phải lúc nào ta cũng có thể dùng độ lệch chuẩn của lợi nhuận thu được để so
sánh độ rủi ro của các phương án đầu tư.
Ví dụ 3. Thống kê lợi nhuận hàng tháng (đơn vị: triệu đồng) trong 20 tháng của hai nhà đầu tư được cho
như sau:
Lợi nhuận [10; 20) [20;30) [30; 40) [40;50) [50;60)
Số tháng 2 4 8 4 2
Bảng 3.2. Lợi nhuận theo tháng của nhà đầu tư nhỏ
Lợi nhuận [510;520) [520;530) [530;540) [540;550) [550;560)
Số tháng 4 3 6 3 4
Bảng 3.3. Lợi nhuận theo tháng của nhà đầu tư lớn
Tính độ lệch chuẩn của hai mẫu số liệu ghép nhóm trên. Có nên dựa vào độ lệch chuẩn để so sánh độ rủi
ro của hai nhà đầu tư này không?
Giải
Chọn điểm đại diện cho các nhóm số liệu ta tính được các số đặc trưng như sau:
Lợi nhuận trung bình một tháng của các nhà đầu tư tương ứng là:
1 1
xA  (2 15  2  55)  35 (triệu đồng); xB  (4  515  4  555)  535 (triệu đồng).
20 20
Độ lệch chuẩn của lợi nhuận hàng tháng của hai nhà đầu tư tương ứng là:
1
sA 
20
 
2 152  2  552  (35)2  10,95

1
sB 
20
 
4  5152  4  5552  (535) 2  13, 78.

Trang 10 Fanpage Nguyễn Bảo Vương  https://www.facebook.com/tracnghiemtoanthpt489/


Điện thoại: 0946798489 HỆ THỐNG LÝ THUYẾT TOÁN THPT
Độ lệch chuẩn cho lợi nhuận hàng tháng của nhà đầu tư lớn cao hơn của nhà đầu tư nhỏ. Lợi nhuận trung
bình của hai nhà đầu tư khác nhau rất nhiều, do đó ta không nên dùng độ lệch chuẩn để so sánh mức độ
rủi ro của hai nhà đầu tư này.
Nhận xét. Ta không nên dùng phương sai hay độ lệch chuẩn để so sánh độ rủi ro của hai phương án đầu
tư khi lợi nhuận trung bình của hai phương án đầu tư này khác nhau rất nhiều.

Facebook Nguyễn Vương https://www.facebook.com/phong.baovuongTrang 11

You might also like