Phân tích thống kê đơn giản sử dụng Excel

Discussion in 'Giải pháp ERP, CRM, EPM and BI' started by tableau, Aug 28, 2014.

  1. tableau

    tableau Well-Known Member

    Excel là một chương trình bảng tính do Microsoft phát triển. Đây là chương trình bảng tính được sử dụng rộng rãi nhất. Trong Excel có bộ công cụ cho phép người dùng phân tích dữ liệu thống kê. Excel có thể dùng để tổ chức sắp xếp dữ liệu, trình bày dữ liệu, lập bảng, vẽ đồ thị và phân tích thống kê (thống kê mô tả, kiểm định giả thuyết và phân tích hồi quy)
    PhanTichThongKeDungExcel01 1.jpg
    *** Để thực hiện các phân tích thống kê phức tạp hơn, chúng ta phải sử dụng các phần mềm thống kê chuyên dụng khác như SPSS, SAS, R.

    Excel hỗ trợ bộ công cụ Data Analysis Toolpact chuyên về phân tích thống kê.

    MS Excel có một bộ công cụ có thể dùng để phân tích dữ liệu được gọi là Analysis Toolpack.
    MS Excel thực hiện các công việc theo workbooks, và mỗi workbooks lại có các worksheet, và worksheet là nơi mà chúng ta sẽ liệt kê và phân tích dữ liệu với Excel.
     
    Last edited by a moderator: Aug 29, 2014
    Quynh Ly likes this.
  2. Loading...


  3. tableau

    tableau Well-Known Member

    Thống kê mô tả

    Bộ công cụ Data Analysis Toolpack có một bộ công cụ con để chúng ta có thể tiến hành thực hiện các phương pháp thống kê mô tả.
    Các bước thực hiện như sau:
    Bước 1: Vào Menu chọn Tool > Data Analysis
    Bước 2: Chọn tiếp Descriptive Statistics
    PhanTichThongKeDungExcel02 1.jpg
    Bước 3: Nhập khoảng dữ liệu trong cửa sổ Descriptive Statistics.
    PhanTichThongKeDungExcel03 1.jpg
    Sau đó nhấn OK để xem kết quả.
    PhanTichThongKeDungExcel04 1.jpg
    Trong đó có các đại lượng thống kê mô tả cơ bản như:
    Mean - Trung bình
    Standard Deviation - Độ lệch chuẩn
    Variance - Phương sai
    Range - Dải biến thiên
    Count - Số quan sát
    Minimum - Giá trị tối thiểu
    Maximum - Giá trị tối đa
    Median - Trung vị
    Standard Error - Sai số chuẩn của trung bình mẫu
     
    Last edited by a moderator: Aug 29, 2014
    Quynh Ly likes this.
  4. tableau

    tableau Well-Known Member

    Phân phối chuẩn

    Giả sử chúng ta muốn tìm xác suất của một biến X nhận giá trị nhỏ hơn một giá trị nhất định nào đó. Chúng ta giả sử là điểm số của các cá nhân trong lớp là phân bổ theo phân phối chuẩn có trị trung bình là 500 và độ lệch chuẩn là 100. Các câu hỏi mà chúng ta cần trả lời là:

    a. Xác suất để một sinh viên được chọn ngẫu nhiên có điểm số thấp hơn 600 là bao nhiêu?
    b. Xác suất để một sinh viên được chọn ngẫu nhiên có điểm số cao hơn 600 là bao nhiêu?
    c. Xác suất để một sinh viên được chọn ngẫu nhiên có điểm số nằm trong khoảng 400-600 là bao nhiêu?

    Gợi ý:
    Khi sử dụng Excel chúng ta có thể tìm được xác suất của một biến X nhận giá trị nhỏ hơn hoặc bằng một giá trị cho trước nào đó. Và khi chúng ta đã biết trị trung bình và độ lệch chuẩn, chúng ta phải suy nghĩ một cách 'thông minh' để tính toán vì tổng xác suất nằm dưới đường cong chuẩn là bằng 1.
     
  5. tableau

    tableau Well-Known Member

    Phân phối chuẩn(tt)
    Giải đáp
    Bước 1: Chọn ô mà ta muốn Excel xuất kết quả, sau đó chọn Insert
    Bước 2: Sau khi bấm vào Insert chúng ta chọn Function
    PhanPhoiChuan01 1.jpg
    Bước 3: Sau khi chúng ta bấm vào Function, cửa sổ Insert Function sẽ xuất hiện. Chúng ta sẽ chọn Statistical, và sau đó chọn Normdist trong số các hàm có sẵn của Excel
    PhanPhoiChuan02 1.jpg
    Bước 4: Sau khi nhấn OK, cửa sổ Normdist sẽ xuất hiện, và chúng ta cung cấp các thông số cần thiết. Chúng ta điền 600 vào X, 500 vào ô Mean, 100 vào ô Standard Deviation, và điền True và ô Cumulative Box, sau đó nhấn OK.
    PhanPhoiChuan03 1.jpg
    Chúng ta sẽ có kết quả sau:
    PhanPhoiChuan04 1.jpg
    Như vậy, xác suất để một học sinh được chọn ngẫu nhiên có số điểm thấp hơn 600 là 0.84134474. Để trả lời được câu b, bạn lấy 1 trừ đi con số này thì kết quả sẽ là 0.158653. Đây là xác suất để một học sinh được chọn ngẫu nhiên có số điểm lớn hơn 600. Thực hiện các bước trên và suy nghĩ một cách hợp lý, bạn có thể tính được xác suất một học sinh được chọn ngẫu nhiên sẽ có số điểm nằm trong khoảng 400-600.
     
  6. tableau

    tableau Well-Known Member

    Tương quan tuyến tính và phân tích hồi quy

    Tại phần này chúng ta tìm hiểu xem liệu giữa 2 biến ngẫu nhiên x và y có tương quan với nhau hay không. Sau đó chúng ta sẽ xây dựng một mô hình để có thể dự đoán một biến này thông qua một biến khác. Có rất nhiều ví dụ mà chúng ta có thể sử dụng, nhưng chúng ta sẽ đề cập tới một ví dụ hay được sử dụng trong kinh doanh. Thông thường biến độc lập (biến giải thích) được ký hiệu bằng chữ X và biến phụ thuộc được ký hiệu bằng chữ Y.
    Một nhà kinh doanh muốn xem xét xem liệu có mối quan hệ giữa số lượng hộp soda bán được và nhiệt độ trong những ngày hè nóng bức dựa trên những thông tin quá khứ. Đồng thời nhà kinh doanh này cũng muốn ước lượng số lượng hộp soda mà anh ta có thể bán trong một ngày hè nóng. Để làm được điều này, nhà kinh doanh ghi chép cẩn thận nhiệt độ và số lượng hộp soda bán được trong những ngày này. Bảng dữ liệu sau đây cho ta biết số liệu từ ngày 1/6 đến 13/6. Người dự báo thời tiết trên truyền hình dự báo là nhiệt độ sẽ lên tới 94 độ F vào ngày 14/6, và nhà kinh doanh muốn đáp ứng tất cả nhu cầu cho khách hàng vào ngày 14/6.
    TuyenTinhVaHoiQuy01.png
    Trước hết, bạn hãy sử dụng Excel để tìm hệ số tương quan tuyến tính giữa lượng hộp soda đã bán và nhiệt độ trong ngày. Sau đó sẽ sử dụng Excel để tìm đường hồi quy.
     
  7. tableau

    tableau Well-Known Member

    Tương quan tuyến tính và phân tích hồi quy (tt)
    a. Phân tích tương quan tuyến tính
    Hệ số tương quan tuyến tính là một đại lượng nằm trong khoảng -1 và +1. Đại lượng này được ký hiệu bằng r. Để tìm r ta thực hiện các bước sau:
    Bước 1: Mở Excel và nhập dữ liệu sau đó tô đậm dữ liệu cần phân tích, tiếp theo đó từ thanh menu ta chọn Tool và chọn Data Analysis
    TuongQuanTuyenTinh01 1.jpg
    Bước 2: Khi cửa sổ Data Analysis xuất hiện, ta chọn Correlation
    TuongQuanTuyenTinh02 1.jpg
    Bước 3: Khi cửa sổ tương quan xuất hiện, điền khoảng dữ liệu vào mục Input Range của cửa sổ này, sau đó nhấn OK. Nếu như ở bước 1 ta đã tô đậm khoảng dữ liệu rồi thì Excel sẽ nhận biết điều này và ta sẽ không phải điền vào khoảng dữ liệu vào mục Input Range nữa. Đồng thời ta chọn Labels in first row để Excel nhận biết và ta cũng chọn khoảng dữ liệu đầu ra Output Range là nơi để Excel xuất kết quả phân tích.
    TuongQuanTuyenTinh03 1.jpg
    Sau đó ta sẽ thu được kết quả như sau:
    TuongQuanTuyenTinh04 1.jpg
    Như ta thấy hệ số tương quan là rất gần +1, như vậy quan hệ tương quan giữa hai biến là rất mạnh. Điều này có nghĩa là khi nhiệt độ tăng lên thì nhu cầu đối với nước uống soda hộp cũng tăng lên.
     
  8. tableau

    tableau Well-Known Member

    Tương quan tuyến tính và phân tích hồi quy (tt)
    a. Phân tích hồi quy
    Để tìm đường hồi quy, bạn cũng thực hiện các bước tương tự như trên.
    Bước 1: Sau khi đã nhập dữ liệu, bạn chọn Tool và chọn Data Analysis
    Bước 2: Khi cửa sổ Data Analysis xuất hiện, bạn chọn Regression
    HoiQuy01 1.jpg
    Bước 3: Khi cửa sổ Regression xuất hiện, bạn điền khoảng dữ liệu vào cho biến phụ thuộc Y và biến độc lập X, đồng thời chọn Labels. Ở đây biến X và Y hoàn toàn do bạn lựa chọn. Người nghiên cứu phải thận trọng trong việc tiến hành phân tích hồi quy. Excel chỉ là một công cụ và nó chỉ thực hiện các lệnh mà bạn yêu cầu nó thực hiện.
    HoiQuy02 1.jpg
    Bước 4: Sau đó tiến hành chọn nơi để Excel xuất kết quả ra. Bạn thực hiện điều này bằng cách cung cấp thông tin cho Excel bằng cách điền vào Output Range, sau đó nhấn OK.
    HoiQuy03 1.jpg
    Quan hệ giữa số hộp soda bán được và nhiệt độ là: Y=0.879*X+9.178. Sử dụng công thức này bạn có thể dự đoán một cách xấp xỉ số lượng hộp soda có thể bán được vào ngày 14/6. Nhiệt độ được dự đoán có thể lên đến 94F, và như vậy số hộp soda có thể bán được là:
    Y = 0.879*94 + 9.178 = khoảng 92 hộp.
    Ở trên bạn mới chỉ xem xét hàm hồi quy tuyến tính đơn giản, trong đó biến phụ thuộc chỉ chịu ảnh hưởng của một biến độc lập.
    Bạn có thể mở rộng mô hình hồi quy này bằng cách đưa thêm các biến khác vào mô hình. Điều này có thể thực hiện trong Excel vô cùng đơn giản. Ở bước 3 vừa nêu trên, khi bạn điền khoảng dữ liệu cho biến X bạn chỉ cần chọn nhiều hơn một cột trong bảng tính Excel.
     
  9. hoangnamag

    hoangnamag New Member

    bạn ơi làm ơn cho mình hỏi (hình đính kèm), mình không biết chạy như thế nào để có kết quả về cột Số điểm trung bình và tại sao chọn số trung bình là 3 như bài phân tích.
    Mình xem nhưng không hiểu nhờ bạn chỉ giúp mình với nhé
    Cảm ơn
     

    Attached Files:

Share This Page