Descriptive Statistics (thống kê mô tả) là phương pháp thống kê cơ bản và quen thuộc, đặc biệt với những ai đang học tập hoặc làm việc trong lĩnh vực phân tích dữ liệu và nghiên cứu khoa học định lượng. Trong bài viết này, VietGuru sẽ cùng bạn khám phá chi tiết thống kê mô tả là gì, các loại phổ biến và ví dụ phân tích thực tế để bạn dễ dàng áp dụng vào bài nghiên cứu của mình.
1. Khái niệm Descriptive Statistics (Thống kê mô tả) là gì?
Descriptive Statistics (thống kê mô tả) là phương pháp thống kê được sử dụng để tóm tắt, sắp xếp và trình bày dữ liệu một cách dễ hiểu thông qua các con số hoặc biểu đồ trực quan.
Trong nghiên cứu định lượng, sau khi thu thập dữ liệu, bước đầu tiên của quá trình phân tích là mô tả đặc điểm của các biến số, chẳng hạn như giá trị trung bình, tần suất xuất hiện hay mối quan hệ giữa các biến.
Sau đó, người nghiên cứu sẽ chuyển sang thống kê suy luận (Inferential Statistics) để kiểm định giả thuyết, xác định liệu kết quả từ mẫu dữ liệu có thể khái quát cho toàn bộ tổng thể hay không.

Khái niệm Descriptive Statistics (Thống kê mô tả) là gì?
Có thể bạn quan tâm: Viết thuê nghiên cứu khoa học
2. Ba nhóm chỉ số chính trong Descriptive Statistics
Descriptive Statistics thường được chia thành ba nhóm chính gồm: các chỉ số đo lường xu hướng trung tâm, đo lường mức độ biến động, và phân phối tần suất. Cụ thể như sau:
2.1. Các chỉ số đo lường xu hướng tập trung (Measures of Central Tendency)
Xu hướng tập trung là phương pháp giúp tóm tắt dữ liệu bằng một giá trị duy nhất nhằm phản ánh điểm trung tâm hay xu hướng chung của toàn bộ tập dữ liệu. Nói cách khác, đây là cách để xác định giá trị tiêu biểu nhất của dữ liệu.
Ba chỉ số phổ biến dùng để đo lường xu hướng tập trung gồm giá trị trung bình (Mean), trung vị (Median) và yếu vị (Mode), cụ thể như sau:
a. Giá trị trung bình (Mean)
Giá trị trung bình được tính bằng cách lấy tổng tất cả các giá trị trong tập dữ liệu chia cho tổng số phần tử.
Công thức: Mean = (x1 + x2 + …xn) / n
Lưu ý:
- Dễ bị ảnh hưởng bởi giá trị ngoại lệ (outliers) hoặc phân phối lệch.
- Không áp dụng cho dữ liệu định danh (ví dụ: giới tính, màu sắc, loại sản phẩm).
- Phù hợp nhất cho dữ liệu định lượng đo trên thang đo khoảng hoặc tỷ lệ.
b. Trung vị (Median)
Trung vị là giá trị nằm ở giữa khi sắp xếp các dữ liệu theo thứ tự tăng dần hoặc giảm dần.
- Nếu số phần tử lẻ, trung vị là giá trị ở vị trí giữa.
- Nếu số phần tử chẵn, trung vị là trung bình cộng của hai giá trị giữa.
Trung vị rất hữu ích khi dữ liệu có ngoại lệ lớn, vì nó ít bị ảnh hưởng bởi các giá trị cực đoan hơn so với trung bình cộng.
c. Yếu vị (Mode)
Yếu vị là giá trị xuất hiện nhiều nhất trong tập dữ liệu.
Một tập dữ liệu có thể có một mode, nhiều mode, hoặc không có mode nếu mọi giá trị chỉ xuất hiện một lần.
Ví dụ minh họa:
Giả sử ta muốn đo xu hướng tập trung của mức điểm kiểm tra môn Toán của 6 sinh viên:
A = {7, 8, 8.5, 9, 9, 10}
- Giá trị trung bình: Mean = (7 + 8 + 8.5 + 9 + 9 + 10) / 6 = 8.58
- Trung vị: Vì có 6 phần tử (số chẵn), trung vị là trung bình cộng của giá trị thứ 3 và thứ 4: Median = (8.5 + 9) / 2 = 8.75
- Yếu vị: Giá trị xuất hiện nhiều nhất là 9, nên Mode = 9.
Có thể bạn quan tâm: Nghiên cứu định tính
2.2. Các chỉ số đo lường mức độ biến động (Measures of Dispersion)
Xu hướng biến động là nhóm chỉ số trong thống kê mô tả giúp phản ánh mức độ phân tán của dữ liệu — tức là các giá trị trong tập dữ liệu khác nhau bao nhiêu so với giá trị trung tâm. Nói cách khác, nếu xu hướng tập trung cho biết dữ liệu nằm ở đâu, thì xu hướng biến động cho biết dữ liệu phân tán đến mức nào.
Các chỉ số phổ biến dùng để đo lường xu hướng biến động: khoảng biến thiên (Range), phương sai (Variance), độ lệch chuẩn (Standard Deviation),…
a. Khoảng biến thiên (Range)
Khoảng biến thiên thể hiện độ chênh lệch giữa giá trị lớn nhất và nhỏ nhất trong tập dữ liệu.
Công thức: R = Xmax – Xmin
Ý nghĩa: Khoảng biến thiên càng lớn, dữ liệu càng phân tán.
Ví dụ: Nếu mức lương của 5 nhân viên là {10, 12, 15, 18, 20} (triệu đồng/tháng), thì R = 20 – 10 = 10.
→ Khoảng biến thiên là 10 triệu đồng, cho thấy mức chênh lệch lương khá lớn.
b. Phương sai (Variance)
Phương sai cho biết mức độ chênh lệch trung bình của các giá trị trong dữ liệu so với giá trị trung bình (Mean).
Công thức:

Công thức phương sai
Ý nghĩa:
- Phương sai càng lớn → dữ liệu càng biến động mạnh.
- Nếu các giá trị nằm gần nhau → phương sai nhỏ.
c. Độ lệch chuẩn (Standard Deviation)
Độ lệch chuẩn là căn bậc hai của phương sai, thể hiện trung bình mỗi giá trị lệch bao xa so với trung bình cộng.
Công thức:

Công thức độ lệch chuẩn
Đặc điểm:
- Dễ hiểu và thường được sử dụng nhiều nhất trong các nghiên cứu định lượng.
- Bị ảnh hưởng bởi giá trị ngoại lệ hoặc phân phối lệch.
Có thể bạn quan tâm: Methodology là gì
2.3. Phân phối tần suất và hình dạng phân phối dữ liệu (Frequency Distribution & Shape)
Phân phối tần suất là cách biểu diễn dữ liệu trong thống kê mô tả bằng bảng hoặc biểu đồ, cho thấy tần suất xuất hiện của các giá trị trong những khoảng hoặc nhóm nhất định.
Mỗi nhóm dữ liệu trong bảng hoặc biểu đồ đều thể hiện số lần xuất hiện (tần suất) của giá trị đó, giúp người đọc dễ dàng nhận thấy xu hướng, mật độ và sự phân bố của dữ liệu.
Phân phối tần suất thường được thể hiện qua các dạng biểu đồ thanh (bar chart), biểu đồ tròn (pie chart) hoặc biểu đồ đường (line chart) — giúp việc phân tích dữ liệu trở nên trực quan, dễ hiểu và sinh động hơn.
3. Vai trò của Descriptive Statistics trong nghiên cứu và phân tích dữ liệu
Thông qua Descriptive Statistics, chúng ta có thể tóm tắt và trình bày dữ liệu một cách trực quan, dễ hiểu, giúp việc phân tích trở nên đơn giản và hiệu quả hơn. Cụ thể, Descriptive Statistics mang đến 5 vai trò quan trọng sau:
- Hiểu rõ đặc điểm của dữ liệu: Giúp người nghiên cứu nắm bắt được bản chất và cấu trúc của dữ liệu thông qua việc mô tả các biến số và giá trị.
- Làm rõ ý nghĩa của dữ liệu: Khi dữ liệu được thể hiện bằng con số hoặc biểu đồ, người đọc dễ dàng nhận thấy xu hướng và ý nghĩa thực tiễn của thông tin cần phân tích.
- Trực quan hóa thông tin: Thống kê mô tả giúp biến dữ liệu khô khan thành hình ảnh sinh động, giúp người xem nhanh chóng nhận diện mẫu hình và mối quan hệ trong dữ liệu.
- Đơn giản hóa dữ liệu phức tạp: Biến các tập dữ liệu lớn, rời rạc thành thông tin ngắn gọn và cô đọng, giúp việc đọc hiểu và phân tích nhanh hơn.
- Đánh giá và phân loại dữ liệu: Nhờ các chỉ số thống kê, người phân tích có thể so sánh, phân nhóm và đưa ra nhận định chính xác về đối tượng nghiên cứu.

Vai trò của Descriptive Statistics trong nghiên cứu và phân tích dữ liệu
Có thể bạn quan tâm: Literature review
4. Cách thực hiện Descriptive Statistics bằng các phần mềm phân tích dữ liệu
Descriptive Statistics thường được thực hiện bằng các phần mềm phân tích dữ liệu chuyên dụng như SPSS, EViews và Stata. Đây là những công cụ quan trọng, hỗ trợ các nhà nghiên cứu và nhà phân tích trong việc xử lý, tóm tắt và trình bày dữ liệu một cách nhanh chóng, chính xác và trực quan.
4.1. Phân tích thống kê mô tả trong SPSS
SPSS là một trong những phần mềm phân tích thống kê phổ biến nhất hiện nay, được ưa chuộng nhờ giao diện thân thiện và dễ sử dụng.
Người dùng có thể thao tác nhanh chóng thông qua các menu thả xuống, chỉ cần chọn lệnh và biến số là hệ thống sẽ tự động hiển thị kết quả cùng biểu đồ minh họa trực quan.
Trong thống kê mô tả, SPSS đặc biệt mạnh ở khả năng tính toán và trình bày các đại lượng phương sai một cách chính xác, rõ ràng và chuyên nghiệp, giúp quá trình phân tích dữ liệu trở nên hiệu quả hơn.
4.2. Thực hiện Descriptive Statistics trong EVIEWS
EViews (Econometric Views) là phần mềm chuyên dụng trong lĩnh vực thống kê và kinh tế lượng, được sử dụng rộng rãi để phân tích và dự báo dữ liệu kinh tế.
EViews nổi bật nhờ giao diện thân thiện, quản lý dữ liệu linh hoạt, và tốc độ xử lý nhanh, giúp người dùng dễ dàng thao tác và hiểu kết quả phân tích.
Trong thống kê mô tả, EViews đặc biệt hữu ích khi phân tích mức độ tác động của các yếu tố kinh tế vĩ mô lên biến số nghiên cứu, hỗ trợ hiệu quả cho các đề tài nghiên cứu trong lĩnh vực kinh tế và tài chính.

Thực hiện Descriptive Statistics trong EVIEWS
4.3. Phân tích dữ liệu định lượng bằng STATA
Stata là phần mềm thống kê được ưa chuộng nhờ giao diện dễ học, dễ sử dụng, phù hợp với cả người mới bắt đầu và các nhà nghiên cứu chuyên nghiệp.
Nó cung cấp nhiều chức năng mạnh mẽ, thường được áp dụng trong các lĩnh vực như kinh tế, xã hội học, khoa học chính trị và nhiều ngành nghiên cứu khác.
Tuy nhiên, trong thống kê mô tả, Stata hạn chế hơn về các phân tích phương sai và phân tích nhóm, nên đôi khi cần kết hợp với các phần mềm khác để khai thác toàn diện dữ liệu.
Có thể bạn quan tâm: Dữ liệu sơ cấp và dữ liệu thứ cấp
5. So sánh Descriptive Statistics và Inferential Statistics (thống kê suy luận)
Trong nghiên cứu, thống kê được sử dụng rộng rãi và được chia thành hai loại chính: Descriptive Statistics và Inferential Statistics. Hai loại thống kê này có những đặc điểm và vai trò khác nhau, được thể hiện qua 5 điểm so sánh cơ bản sau:
| Tiêu chí so sánh | Descriptive Statistics | Inferential Statistics |
| Định nghĩa | Là một nhánh của thống kê tập trung vào việc mô tả các đặc điểm chính của dữ liệu định lượng thu thập từ tổng thể (dân số) đang nghiên cứu. | Là một nhánh của thống kê chuyên dùng để rút ra kết luận về tổng thể (dân số) dựa trên phân tích dữ liệu từ mẫu quan sát được. |
| Chức năng | Cho thấy bức tranh tổng quát về đối tượng hoặc hiện tượng đang được nghiên cứu. | Rút ra kết luận tổng quát về toàn bộ dân số, đi vượt ra ngoài dữ liệu quan sát trực tiếp. |
| Phương pháp thực hiện | – Thu thập số liệu – Giải thích dữ liệu – Tóm tắt mẫu – Tính toán dữ liệu – Trình bày và mô tả các đặc trưng khác nhau. | – Ước lượng các đặc điểm của tổng thể – Phân tích mối quan hệ giữa các hiện tượng nghiên cứu – Dự đoán hoặc ra quyết định dựa trên thông tin thu thập từ kết quả quan sát mẫu |
| Ứng dụng | Mô tả một tình huống | Giải thích xác suất xảy ra của một sự kiện hoặc hiện tượng. |
| Mẫu kết quả cuối cùng | Biểu đồ, đồ thị và bảng | Xác suất |
6. Lời kết
Nếu bạn đang tìm kiếm dịch vụ viết thuê nghiên cứu khoa học, VietGuru sẵn sàng hỗ trợ từ việc thu thập dữ liệu, phân tích đến trình bày kết quả thống kê, giúp bài nghiên cứu của bạn trở nên chuyên nghiệp, chính xác và thuyết phục.
Hy vọng bài viết này đã giúp bạn hiểu rõ hơn về Descriptive Statistics, từ khái niệm, các loại thông số đến ứng dụng thực tế, để bạn có thể tóm tắt và trực quan hóa dữ liệu một cách hiệu quả trong nghiên cứu của mình.













