0% found this document useful (0 votes)
9 views

Evans Analytics2e PPT 04

Slide PTKD

Uploaded by

hotutram.2703
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PPTX, PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
9 views

Evans Analytics2e PPT 04

Slide PTKD

Uploaded by

hotutram.2703
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PPTX, PDF, TXT or read online on Scribd
You are on page 1/ 63

Chương 4

Các biện pháp thống


kê mô tả
Quần thể và mẫu
 tổng thể - tất cả các mục quan tâm cho một quyết
định hoặc cuộc điều tra cụ thể
- tất cả các tài xế đã kết hôn trên 25 tuổi
- tất cả người đăng ký Netflix
 Mẫu - một tập hợp con của tổng thể

- danh sách các cá nhân đã thuê một vở hài kịch từ


Netflix trong năm qua
 Mục đích của việc lấy mẫu là thu thập đủ thông tin

để đưa ra suy luận hợp lý về tổng thể.


Hiểu ký hiệu thống kê
 Chúng tôi thường gắn nhãn các phần tử của tập dữ liệu
bằng cách sử dụng các biến được chỉ số dưới, x 1 , x 2 ,
… , v.v., ở đâu x i đại diện cho ith quan sát.
 Thực tế phổ biến trong thống kê là sử dụng các chữ cái
Hy Lạp , chẳng hạn như m ( mu), s (sigma) và p (pi), để
thể hiện số đo tổng thể và các chữ in nghiêng như x
(được gọi là x -bar ) , s và p để đại diện cho số liệu
thống kê mẫu .
 N đại diện cho số lượng phần tử trong một tổng thể và n
đại diện cho số lượng quan sát trong một mẫu .
 S đại diện cho tổng: S x i = x 1 + x 2 + … x n
Các thước đo vị trí: Trung bình số học
 Tổng thể có nghĩa là:

 Ý nghĩa mẫu:

 Hàm Excel: =AVERAGE( phạm vi dữ liệu )


 Thuộc tính của giá trị trung bình:

 Các ngoại lệ có thể ảnh hưởng đến giá trị của giá trị
trung bình.
Ví dụ 4.1: Tính chi phí trung bình cho mỗi
đơn hàng
dữ liệu đơn đặt hàng
 Sử dụng công thức:

= SUM( B2:B95)/COUNT( B2:B95)

Trung bình = $2,471,760/94


= $26.295,32

hàm AVERAGE trong Excel


= TRUNG BÌNH( B2:B95)
Các thước đo vị trí: Trung vị
 Trung vị chỉ định giá trị ở giữa khi dữ liệu được sắp xếp từ
nhỏ nhất đến lớn nhất.
◦ Một nửa dữ liệu nằm dưới mức trung bình và một nửa dữ liệu
nằm trên nó.
◦ Đối với số lượng quan sát lẻ, trung vị là số giữa của các số được
sắp xếp .
◦ Đối với số quan sát chẵn, trung vị là giá trị trung bình của hai số
ở giữa .
 Chúng ta có thể sử dụng tùy chọn Sắp xếp trong Excel để
sắp xếp thứ tự dữ liệu và sau đó xác định giá trị trung bình.
Hàm Excel =MEDIAN ( phạm vi dữ liệu ) cũng có thể được sử
dụng.
 Trung vị có ý nghĩa đối với dữ liệu tỷ lệ, khoảng và thứ tự.
 Không bị ảnh hưởng bởi các ngoại lệ.
Ví dụ 4.2: Tìm chi phí trung bình cho mỗi đơn
hàng
 Sắp xếp dữ liệu từ nhỏ nhất đến lớn nhất. Vì
chúng ta có 90 quan sát nên giá trị trung bình là
trung bình của quan sát thứ 47 và 48 .

Trung bình =
($15.562,50 + $15.750,00)/2
= $ 15.656,25

=MEDIAN(B2:B94)
Các biện pháp về vị trí: Mode
 Mode là quan sát xảy ra thường xuyên nhất .
 này hữu ích nhất cho các tập dữ liệu chứa số

lượng giá trị duy nhất tương đối nhỏ .


 Bạn có thể dễ dàng xác định mode từ phân bố tần

số bằng cách xác định giá trị hoặc nhóm có tần số


lớn nhất hoặc từ biểu đồ bằng cách xác định
thanh cao nhất .
 Hàm Excel: =MODE.SNGL ( phạm vi dữ liệu ) .
 Đối với nhiều mode : =MODE.MULT( phạm vi dữ

liệu )
Ví dụ 4.3: Tìm mode
 liệu Đơn đặt hàng :
Điều khoản A/P
 mode = 30 tháng

 Chi phí mỗi đơn


hàng
 mode là nhóm từ $0
đến $13.000
Các thước đo vị trí: midrange
 Dải trung là trung bình của các giá trị lớn nhất và
nhỏ nhất trong tập dữ liệu .
 thận trọng khi sử dụng dải trung vì các giá trị cực

cao dễ làm sai lệch kết quả. Điều này là do giá trị
trung bình chỉ sử dụng hai phần dữ liệu, trong khi
giá trị trung bình sử dụng tất cả dữ liệu; do đó, nó
thường là ước tính khó hơn nhiều so với giá trị
trung bình và thường chỉ được sử dụng cho cỡ
mẫu nhỏ.
Ví dụ 4.4: Tính dải trung

 Dữ liệu đơn đặt hàng


 Sử dụng các hàm Excel MIN và MAX hoặc sắp

xếp dữ liệu và tìm thấy chúng một cách dễ dàng.


 Chi phí cho mỗi đơn hàng ở mức trung bình:
= ($68,78 + $127.500)/2
= $63.784,89
Sử dụng thước đo vị trí – Ví dụ 4.5: Báo
giá thời gian sửa chữa máy tính
File Excel Computer Repair Times bao gồm 250 lần
sửa chữa cho khách hàng.
 Thời gian sửa chữa nào là
hợp lý để báo giá cho khách
hàng mới?
 Thời gian sửa chữa trung

bình là 2 tuần; trung bình và


mode là khoảng 15 ngày.
 Kiểm tra biểu đồ.
Ví dụ 4.5 (tiếp theo)

90% được hoàn thành trong vòng 3 tuần


Các biện pháp phân tán
 Sự phân tán đề cập đến mức độ biến đổi của
dữ liệu; nghĩa là độ trải rộng về số ( hoặc độ
nén ) của dữ liệu.
 Các biện pháp chính:

◦ Phạm vi - range
◦ Phạm vi liên tứ phân vị
◦ Phương sai
◦ Độ lệch chuẩn
Các biện pháp phân tán: range
 Phạm vi là đơn giản nhất và là sự khác biệt giữa
giá trị tối đa và giá trị tối thiểu trong tập dữ liệu.
 Trong Excel, tính toán như sau = MAX( phạm vi

dữ liệu ) - MIN( phạm vi dữ liệu ) .


 Phạm vi bị ảnh hưởng bởi các giá trị ngoại lệ và

thường chỉ được sử dụng cho các tập dữ liệu rất


nhỏ.
Ví dụ 4.6: Tính dãy
 Dữ liệu đơn đặt hàng
 Đối với dữ liệu chi phí mỗi đơn hàng:

◦ Tối đa = 127.500 USD


◦ Tối thiểu = $68,78
 Phạm vi = 127.500 USD - 68,78 USD =
127.431,22 USD
Các biện pháp phân tán: Interquartile
Range
 Phạm vi liên tứ phân vị (IQR ) , hay mức chênh
lệch giữa là sự khác biệt giữa tứ phân vị thứ nhất
và thứ ba, Q3 – Q1.
 Điều này chỉ bao gồm 50% dữ liệu ở giữa và do

đó không bị ảnh hưởng bởi các giá trị cực đoan.


Ví dụ 4.7: Tính dải tứ phân vị

 Dữ liệu
 Đối với dữ liệu Chi phí mỗi đơn hàng :
 Tứ phân vị thứ ba = Q 3 = $27.593,75
 thứ nhất = Q 1 = 6.757,81 USD
 Phạm vi liên tứ phân vị = $27.593,75 – $6.757,81
= $20.835,94
Các biện pháp phân tán: Phương sai
 Phương sai là “trung bình” của độ lệch bình
phương so với giá trị trung bình.
 Đối với một
 tổng thể:
◦ Trong Excel: =VAR.P( phạm vi dữ liệu )
 Đối với một mẫu:

◦ Trong Excel: =VAR.S( phạm vi dữ liệu )


 Lưu ý sự khác biệt về mẫu số!
Ví dụ 4.8 Tính phương sai
 đơn đặt hàng Giá mỗi đơn hàng
Các biện pháp phân tán: Độ lệch
chuẩn
 Độ lệch chuẩn là căn bậc hai của phương sai .
◦ Lưu ý rằng thứ nguyên của phương sai là bình phương thứ
nguyên của các quan sát, trong khi thứ nguyên của độ lệch
chuẩn giống như dữ liệu. Điều này làm cho độ lệch chuẩn trở nên
thiết thực hơn khi sử dụng trong các ứng dụng.
 Đối với một tổng thể:

◦ Trong Excel: =STDEV.P( phạm vi dữ liệu )


 Đối với một mẫu:

◦ Trong Excel: =STDEV.S( phạm vi dữ liệu )


Ví dụ 4.9 Tính độ lệch chuẩn

 đơn đặt hàng Giá mỗi đơn hàng

 Sử dụng kết quả của Ví dụ 4.8, hãy lấy căn bậc


hai của phương sai:

 Ngoài ra, hãy sử dụng hàm STDEV.S cho phạm vi


dữ liệu.
Độ lệch chuẩn như một thước đo rủi ro
File excel: Chốt giá cổ phiếu
Intel (INTC):
Trung bình = $18,81
Độ lệch chuẩn = 0,50 USD
Tổng công ty Điện lực (GE):
Trung bình = $16,19
Độ lệch chuẩn = 0,35 USD

INTC có rủi ro cao hơn


đầu tư hơn GE.
Định lý
 Đối với bất kỳ tập dữ liệu nào , tỷ lệ các giá trị
nằm trong k ( k > 1) độ lệch chuẩn của giá trị
trung bình ít nhất là 1 – 1/ k 2
 Ví dụ:
◦ Với k = 2: ít nhất ¾ hoặc 75% dữ liệu nằm trong hai độ
lệch chuẩn của giá trị trung bình
◦ Với k = 3: ít nhất 8/9 hoặc 89% dữ liệu nằm trong ba độ
lệch chuẩn của giá trị trung bình
Quy tắc thực nghiệm
 Đối với nhiều bộ dữ liệu gặp phải trong thực tế:
 Khoảng 68% số quan sát nằm trong một độ lệch chuẩn
của giá trị trung bình
 Khoảng 95% nằm trong khoảng hai độ lệch chuẩn của
giá trị trung bình
 Khoảng 99,7% nằm trong khoảng ba độ lệch chuẩn của
giá trị trung bình
 Những quy tắc này thường được sử dụng để mô
tả sự biến đổi tự nhiên trong quá trình sản xuất và
các hiện tượng kinh doanh khác.
Chỉ số năng lực xử lý
 Chỉ số năng lực quy trình ( Cp ) là thước đo mức
độ một quy trình sản xuất có thể đạt được các
thông số kỹ thuật.
 Sử dụng một mẫu đầu ra, đo lường thứ nguyên

quan tâm và tính tổng biến thiên bằng cách sử


dụng quy tắc thực nghiệm thứ ba.
 So sánh kết quả với thông số kỹ thuật bằng cách

sử dụng:
Ví dụ 4.11 Sử dụng các quy tắc thực nghiệm để
đo lường khả năng của quy trình sản xuất

Quy tắc thực


nghiệm
Giá trị tiêu chuẩn hóa
 Một giá trị được tiêu chuẩn hóa , thường được gọi là
điểm z , cung cấp thước đo tương đối về khoảng cách
giữa một quan sát với giá trị trung bình, độc lập với các
đơn vị đo lường.
 Điểm z cho lần thứ i quan sát trong một tập dữ liệu được
tính như sau :

◦ Hàm Excel: =STANDARDIZE ( x,mean, standard_dev ) .


Thuộc tính của Điểm z
 Tử số biểu thị khoảng cách mà x i là từ giá trị trung bình
mẫu; một giá trị âm chỉ ra rằng x i nằm ở bên trái của giá
trị trung bình và giá trị dương cho biết nó nằm ở bên
phải của giá trị trung bình. Bằng cách chia cho độ lệch
chuẩn , s , chúng ta chia khoảng cách từ giá trị trung
bình để biểu thị nó theo đơn vị độ lệch chuẩn. Vì vậy ,
◦ az - điểm 1,0 có nghĩa là quan sát là một độ lệch chuẩn ở bên
phải giá trị trung bình;
◦ az - điểm 2 1,5 có nghĩa là quan sát có độ lệch chuẩn 1,5 ở bên
trái giá trị trung bình.
Ví dụ 4.12 Tính điểm z
 đơn đặt hàng Giá mỗi đơn hàng

=(B2 - $ B$97 )/$ B$98 hoặc


STANDARDIZE (B2,$B$97,$B$98).
Hệ số biến thiên
 Hệ số biến thiên (CV ) cung cấp thước đo tương đối về
độ phân tán của dữ liệu so với giá trị trung bình:

 Đôi khi được biểu thị dưới dạng phần trăm.


 Cung cấp một thước đo tương đối về rủi ro quay trở lại.
 Tỷ suất sinh lời rủi ro = 1/CV thường dễ diễn giải hơn,
đặc biệt trong phân tích rủi ro tài chính.
 Tỷ lệ Sharpe là một thước đo liên quan đến tài chính.
Ví dụ 4.13 Áp dụng hệ số biến thiên
 Bảng tính giá cổ phiếu đóng cửa
 Intel (INTC) có rủi ro cao hơn một chút so với các

cổ phiếu khác.
 Quỹ chỉ số có ít rủi ro nhất (CV thấp nhất).
Các thước đo hình dạng: Độ nghiêng
 Độ lệch mô tả sự thiếu tính đối xứng của dữ liệu .
◦ Phân phối ở đuôi bên phải được gọi là độ lệch dương ;
những cái có đuôi ở bên trái được cho là bị lệch âm .

Độ lệch dương Đối xứng


Hệ số độ lệch
 Hệ số độ lệch (CS):

 Hàm Excel: =SKEW( phạm vi dữ liệu )


 CS âm đối với dữ liệu lệch trái.
 CS dương đối với dữ liệu lệch phải.
 |CS| > 1 cho thấy mức độ sai lệch cao .
 0,5 ≤ |CS| ≤ 1 gợi ý độ lệch vừa phải .
 | CS| < 0,5 cho thấy tính đối xứng tương đối.
Ví dụ 4.14: Đo độ lệch
 dữ liệu
 Dữ liệu chi phí trên mỗi đơn hàng: CS = 1,66 ( độ

lệch dương cao )


 Dữ liệu thuật ngữ A/P: CS = 0,60 ( độ lệch dương

vừa phải )
Các biện pháp hình dạng: Kurtosis
 Kurtosis đề cập đến độ đỉnh (tức là cao, hẹp) hoặc độ
phẳng (tức là ngắn, đỉnh phẳng) của biểu đồ.
 Hệ số nhọn (CK) đo lường mức độ nhọn của tổng thể

 CK < 3 cho thấy dữ liệu có phần phẳng với mức độ phân tán
rộng.
 CK > 3 cho thấy dữ liệu có phần đạt đỉnh với độ phân tán ít hơn.
 Hàm Excel: =KURT ( phạm vi dữ liệu ) .
Hình dạng và thước đo vị trí
 Việc so sánh các thước đo vị trí đôi khi có thể tiết lộ
thông tin về hình dạng phân bố của các quan sát.
◦ Ví dụ: nếu phân phối hoàn toàn đối xứng và không đồng nhất thì
giá trị trung bình, trung vị và mốt đều giống nhau.
◦ Nếu nó bị lệch âm , thông thường chúng ta sẽ tìm thấy mode
trung bình < trung vị < đó
◦ Độ lệch dương sẽ đề xuất mode đó < trung vị < trung bình
Công cụ thống kê mô tả Excel
Công cụ này cung cấp bản tóm tắt các thước đo thống kê bằng
số cho dữ liệu mẫu.

Dữ liệu >
Phân tích dữ liệu >
Thống kê mô tả
 Nhập phạm vi đầu vào
 Nhãn (tùy chọn)
 Đánh dấu vào ô Thống kê Tóm tắt

 Dữ liệu phải ở một hàng hoặc một cột . Nếu dữ liệu nằm
trong nhiều cột thì công cụ sẽ coi mỗi hàng hoặc cột là một
tập dữ liệu riêng biệt
Ví dụ 4.15: Sử dụng Công cụ thống kê
mô tả
 dữ liệu đơn đặt hàng

Lưu ý: Kết quả


của Analysis
Toolpak không
thay đổi khi dữ
liệu thay đổi .
Thống kê mô tả cho dữ liệu được nhóm
 tổng thể có nghĩa là:

 Ý nghĩa mẫu:

 Phương sai tổng thể:

 Phương sai mẫu:


Ví dụ 4.16: Tính toán số đo thống kê từ
phân bố tần số
 Thời gian sửa chữa máy tính
Dữ liệu được nhóm
 Nếu dữ liệu được nhóm thành k các ô trong phân
bố tần số, chúng ta có thể sử dụng các phiên bản
sửa đổi của công thức để ước tính giá trị trung
bình và phương sai bằng cách thay thế x i với một
giá trị đại diện (chẳng hạn như điểm giữa) cho tất
cả các quan sát trong mỗi ô.
Ví dụ 4.17: Tính toán thống kê mô tả cho phân
bố tần số theo nhóm

Giá trị nhóm đại


diện
Thống kê mô tả cho dữ liệu phân loại: Tỷ
lệ
 Tỷ lệ , ký hiệu là p , là phần dữ liệu có một đặc
tính nhất định .
 Tỷ lệ là số liệu thống kê mô tả chính cho dữ liệu

phân loại, chẳng hạn như khiếm khuyết hoặc sai


sót trong ứng dụng kiểm soát chất lượng hoặc sở
thích của người tiêu dùng trong nghiên cứu thị
trường.
Ví dụ 4.18: Tính tỷ lệ
 Tỷ lệ đơn hàng được đặt bởi Spacetime Technologies
=COUNTIF(A4:A97, “ Không thời gian Công nghệ”)/ 94
= 12/94 = 0,128
Thống kê trong PivotTable
Cài đặt trường giá trị bao gồm một số biện pháp
thống kê:
 Trung bình
 Tối đa và tối thiểu
 Sản phẩm
 Độ lệch chuẩn
 Phương sai
Ví dụ 4.19: Các thước đo thống kê trong
PivotTable
 Dữ liệu rủi ro tín dụng
 Đầu tiên, hãy tạo PivotTable .
 Trong PivotTable Danh sách trường , di chuyển Công
việc đến trường Nhãn hàng và Kiểm tra và tiết kiệm
sang trường Giá trị . Sau đó thay đổi cài đặt trường từ
“Tổng kiểm tra” và “ Tổng tiết kiệm” thành mức trung
bình.
Các biện pháp của Hiệp hội
 Hai biến có mối quan hệ thống kê chặt chẽ với
nhau nếu chúng di chuyển cùng nhau .
 Khi hai biến số có vẻ liên quan với nhau, bạn có

thể nghi ngờ có mối quan hệ nhân quả.


 Tuy nhiên, đôi khi các mối quan hệ thống kê tồn

tại ngay cả khi sự thay đổi ở một biến không phải


do sự thay đổi của biến kia gây ra.
Các biện pháp liên kết: Hiệp phương sai
 hiệp phương sai là thước đo mối liên hệ tuyến tính giữa hai biến X
và Y . Giống như phương sai, các công thức khác nhau được sử
dụng cho tổng thể và mẫu .
 Hiệp phương sai tổng thể:

◦ Hàm Excel: =COVARIANCE.P( array1,array2 )


 Hiệp phương sai mẫu:

◦ Hàm Excel: =COVARIANCE.S ( mảng1, mảng2 )


 Hiệp phương sai giữa X và Y là giá trị trung bình của tích độ lệch
của từng cặp quan sát so với giá trị trung bình tương ứng của
chúng.
Ví dụ 4.20: Tính hiệp phương sai
 Dữ liệu Cao
đẳng và Đại học
Các biện pháp liên kết: Tương quan
 Tương quan là thước đo mối quan hệ tuyến tính giữa hai biến, X
và Y , không phụ thuộc vào đơn vị đo.
 Tương quan được đo bằng hệ số tương quan , còn được gọi là hệ
số tương quan mô men tích Pearson .
 Hệ số tương quan cho tổng thể:

 Hệ số tương quan cho một mẫu:

 Hệ số tương quan được tính theo tỷ lệ từ -1 đến 1.


 Hàm Excel: =CORREL( mảng1, mảng2 )
Ví dụ về tương quan
Ví dụ 4.21 Tính hệ số tương quan
 Dữ liệu
Lưu ý về hàm CORREL
 Khi sử dụng hàm CORREL, việc dữ liệu đại diện
cho mẫu hay quần thể không thành vấn đề. Nói
cách khác,

CORREL ( mảng1, mảng2 ) =


COVARIANCE.P( array1,array2 ) / STDEV.P
( array1 )*STDEV.P( array2 )

CORREL(mảng1,mảng2) =
COVARIANCE.S ( array1, array2 ) / STDEV.S
( array1 )*STDEV.S( array2 )
Công cụ tương quan Excel

Dữ liệu >
Phân tích dữ liệu >
Tương quan

 Excel tính hệ số tương quan


giữa tất cả các cặp biến trong Phạm vi đầu vào .
Dữ liệu Phạm vi đầu vào phải ở các cột liền kề.
Ví dụ 4.22: Sử dụng Công cụ tương quan
 Dữ liệu Cao đẳng và Đại học

◦ Tương quan nghịch vừa phải giữa tỷ lệ chấp nhận và tỷ lệ tốt


nghiệp, cho thấy các trường có tỷ lệ chấp nhận thấp hơn có tỷ lệ
tốt nghiệp cao hơn.
◦ được chấp nhận cũng có mối tương quan nghịch với điểm SAT
trung bình và Top 10% HS, cho thấy rằng những trường có tỷ lệ
được chấp nhận thấp hơn sẽ có hồ sơ học sinh cao hơn.
◦ Mối tương quan với Chi tiêu/Học sinh cho thấy rằng các trường
có hồ sơ học sinh cao hơn sẽ chi nhiều tiền hơn cho mỗi học
sinh.
Xác định các ngoại lệ
 Không có định nghĩa tiêu chuẩn nào về những gì
cấu thành một ngoại lệ .
 Một số quy tắc chung điển hình:
 z- điểm lớn hơn +3 hoặc nhỏ hơn -3
 Các ngoại lệ cực đoan lớn hơn 3*IQR ở bên trái Q 1 hoặc
bên phải Q 3
 Các ngoại lệ nhẹ nằm trong khoảng từ 1,5*IQR đến
3*IQR ở bên trái Q 1 hoặc bên phải Q 3
Ví dụ 4.23: Điều tra các ngoại lệ
 Dữ liệu giá trị thị trường

 Không có điểm z nào vượt quá 3. Tuy nhiên, trong


khi các biến riêng lẻ có thể không biểu hiện các giá
trị ngoại lệ, thì sự kết hợp của chúng có thể .
◦ Quan sát cuối cùng có giá trị thị trường cao ($120.700)
nhưng diện tích ngôi nhà tương đối nhỏ (1.581 feet vuông )
và có thể là một ngoại lệ.
Tư duy thống kê trong các quyết định kinh
doanh
 Tư duy thống kê là một triết lý học tập và hành động để
cải tiến, dựa trên các nguyên tắc:
 mọi công việc diễn ra trong một hệ thống gồm các quá trình được
kết nối với nhau
 sự biến đổi tồn tại trong tất cả các quá trình
 kết quả thực hiện tốt hơn từ sự hiểu biết và giảm thiểu sự khác
biệt
 Công việc được thực hiện ở bất kỳ tổ chức nào thông
qua các quy trình - những cách thực hiện công việc có
hệ thống để đạt được kết quả mong muốn.
 Việc hiểu các quy trình kinh doanh cung cấp bối cảnh để
xác định tác động của sự thay đổi và loại hành động
thích hợp cần thực hiện .
Ví dụ 4.24: Áp dụng tư duy thống kê
 File Excel Nhiễm trùng phẫu thuật
◦ Tháng 12 chỉ đơn giản là sự biến đổi ngẫu nhiên hay một
hiện tượng nào đó có thể giải thích được?
Ví dụ 4.24 Tiếp theo
 Quy tắc thực nghiệm độ lệch chuẩn ba:

 Điều này cho thấy tháng 12 có sự khác biệt về


mặt thống kê so với phần còn lại của dữ liệu.
Sự thay đổi trong mẫu
 khác nhau từ bất kỳ quần thể nào sẽ khác nhau.
◦ Họ sẽ có các phương tiện, độ lệch chuẩn và các biện
pháp thống kê khác
◦ Chúng sẽ có sự khác biệt về hình dạng của biểu đồ.
 Các mẫu cực kỳ nhạy cảm với cỡ mẫu – số lượng
quan sát có trong mẫu .
Ví dụ 4.25: Sự thay đổi trong dữ liệu mẫu

Thống kê tổng thể: μ = 14,91 ngày, σ 2 = 35,5 ngày 2


 Mẫu từ dữ liệu của Computer Repair Times

 Hai mẫu size 50:

 Hai mẫu size 25:

You might also like