Data Mining là gì?

Discussion in 'Giải pháp ERP, CRM, EPM and BI' started by tableau, Jun 30, 2014.

  1. tableau

    tableau Well-Known Member

    Data Mining là gì?
    Data Mining là khai thác dữ liệu. Data Mining là quá trình tìm kiếm các mẫu từ tập dữ liệu lớn (Data Set) và phân tích dữ liệu từ những quan điểm khác nhau. Nó cho phép người dùng trong doanh nghiệp dùng để phân tích dữ liệu từ nhiều góc độ khác nhau và tóm tắt các mối quan hệ xác định (relationship).
    Data Mining rất hữu ích trong việc tăng doanh thu và cắt giảm chi phí.
    data-mining.png
    Ví dụ:
    Trong một siêu thị, người mua bàn chải đánh răng vào ngày chủ nhật cũng mua kem đánh răng. Thông tin này có thể được sử dụng trong việc tăng doanh thu bằng cách đặt 2 sản phẩm này cạnh nhau. Việc đó sẽ thúc đẩy việc tăng số lượng bán ra của 2 loại sản phẩm đó nhiều hơn vào những ngày chủ nhật.
     
    My Linh and Hiền like this.
  2. Loading...

    Similar Threads Forum Date
    Data Mining vs Analytics Giải pháp ERP, CRM, EPM and BI Jan 4, 2015
    Tại sao cần khai phá dữ liệu (Data mining) Giải pháp ERP, CRM, EPM and BI Dec 30, 2014
    InTouch Data makes sense of hotel transaction data Du lịch - Khách sạn Dec 2, 2017
    Tableau, GE Aviation partner on data analytics for airline industry Tableau Nov 12, 2017
    Change Data Capture(CDC) trong SSIS connect Data Warehouse Tableau Oct 13, 2017

  3. tableau

    tableau Well-Known Member

    Data Mining Process (Quy trình khai thác dữ liệu)
    Data Mining phân tích các mối quan hệ và các mẫu trong các dữ liệu được lưu trữ dựa trên các truy vấn của người dùng. Khai thác dữ liệu liên quan đến những nhiệm vụ như sau:
    • Association (Kết hợp):
      • Tìm mối quan hệ giữa các biến.
      • Ví dụ như trong một cửa hàng bán lẻ, có thể xác định sản phẩm được mua cùng với nhau thường xuyên và thông tin này có thể được sử dụng để tiếp thị các sản phẩm này.
    • Clustering (Phân cụm):
      • Xác định mối quan hệ hợp lý trong các sản phẩm và nhóm chúng lại với nhau.
      • Ví dụ như trong một cửa hàng bán lẻ, kem đánh răng và bàn chải đánh răng có thể được nhóm lại.
    • Classifying (Phân loại):
      • Liên quan đến việc áp dụng một mô hình được biết đến với các dữ liệu mới.
     
    My Linh and Hiền like this.
  4. tableau

    tableau Well-Known Member

    Khái niệm về khai phá dữ liệu (Data Mining) hay khám phá tri thức (Knowledge Discovery) có rất nhiều cách diễn đạt khác nhau nhưng về bản chất đó là quá trình tự động trích xuất thông tin có giá trị (Thông tin dự đoán - Predictive Information) ẩn chứa trong khối lượng dữ liệu khổng lồ trong thực tế.
    DataMining.png
    Data mining nhấn mạnh 2 khía cạnh chính đó là khả năng trích xuất thông tin có ích Tự động (Automated) và thông tin mang tính dự đoán (Predictive).
    Data mining liên quan chặt chẽ đến các lĩnh vực sau:
    • Statistics (Thống kê):
    Kiểm định mô hình và đánh giá tri thức phát hiện ra
    • Machine Learning (Máy học):
    Nghiên cứu xây dựng các giải thuật trên nền tảng của trí tuệ nhân tạo giúp cho máy tính có thể suy luận, dự đoán kết quả tương lai thông qua quá trình huấn luyện từ dữ liệu lịch sử.
    • Database (Cở sở dữ liệu):
    Công nghệ quản trị dữ liệu, nhất là kho dữ liệu - data warehouse
    • Visualization (Trực quan hóa):
    Giúp dữ liệu dễ hiểu, dễ sử dụng như chart, map
     
    Last edited by a moderator: Aug 15, 2014
  5. tableau

    tableau Well-Known Member

    Nhiệm vụ của Data Mining
    Có thể phân thành 2 loại chính đó là Dự đoán (Predictive) và Mô tả (Descriptive)
    • Predictive:
      • Classification - phân lớp
      • Regression - hồi quy
      • Deviation Detection - phát hiện độ lệch
    • Descriptive:
      • Clustering - phân cụm
      • Association Rule Discovery - phát hiện luật kết hợp
    *** Một số thuật toán phổ biến được dùng trong Data Mining
    • Descision tree: Cây quyết định (Classification Task)
    • Nearest Neighbor: Láng giềng gần nhất (Classification Task)
    • Neural Network: Mạng Neural (Classification and Clustering Task)
    • Rule Induction: Luật quy nạp (Classification Task)
    • K-Means: Thuật toán K-Means (Clustering Task)
     
    Hoàng Tuyền and Hiền like this.
  6. tableau

    tableau Well-Known Member

    So sánh giữa OLAP và Data Mining
    OLAPvsDataMining.png
     
    Last edited by a moderator: Aug 22, 2014
    Quynh Ly and Hiền like this.
  7. tableau

    tableau Well-Known Member

    Ứng dụng của Data Mining trong các lĩnh vực như sau:
    • Kinh doanh - thương mại:
      • Xác định thói quen mua hàng của khách hàng
      • Dự đoán chu kỳ kinh doanh sản phẩm
      • Liên hệ giữa khách hàng và các yếu tố khác
      • Xác định loại khách hàng tiềm năng, đối tượng có khả năng trở thành khách hàng
      • Dự đoán hiệu quả của một đợt quảng cáo, tiếp thị
    DataMining02.jpg

    • Thương mại điện tử:
      • Phân tích hành động duyệt Web để phát triển sở thích của khách hàng --> Cải thiện hoạt động Website...
     
    Last edited by a moderator: Aug 15, 2014
    My Linh and Hiền like this.
  8. tableau

    tableau Well-Known Member

    Ứng dụng của Data Mining trong các lĩnh vực như sau(tt):
    • Ngân hàng:
      • Dự đoán các dấu hiệu của một giao dịch trái luật
      • Xác định các khách hàng sẽ cộng tác lâu dài
      • Dự đoán rủi ro của các khoản cho vay
      • Xác định các nhân tố dẫn đến vỡ nợ vay
      • Liên hệ giữa các chỉ số tài chính với hoạt động ngân hàng
    DataMining03.jpg
    • Viễn thông:
      • Nhận biết các dấu hiệu của sự gian lận dịch vụ
      • Xu thế phát triển khách hàng, đối tượng, khu vực cần phát triển
     
    Quynh Ly and Hiền like this.
  9. tableau

    tableau Well-Known Member

    Ứng dụng của Data Mining trong các lĩnh vực như sau(tt):
    • Bảo hiểm:
      • Loại khách hàng có rủi ro cao? Gian lận?
      • Liệu khách hàng có thực hiện hết hợp đồng bảo hiểm?
      • Đối tượng, vùng nào có khả năng tham gia bảo hiểm?
    DataMining04.jpg
    • Y tế:
      • Chuẩn đoán bệnh qua các triệu chứng
      • Liên hệ giữa các loại bệnh
      • Dự đoán hiệu quả của một cuộc phẫu thuật, điều trị
     
    My Linh and Hiền like this.
  10. Hiền

    Hiền Active Member

    Còn bí kíp gì nữa không chị, em có học cái này trong môn hệ thống thông tin kế toán mà không hiểu nó là cái gì, có lẽ chưa tập trung lắm!
    Nhưng đọc xong bài này, mới thấy tầm quan trọng của data mining
     
  11. tableau

    tableau Well-Known Member

    Hi, cám ơn e đã quan tâm. Từ từ mình sẽ đi vô từng phương pháp một nhé! ;)
     
  12. tableau

    tableau Well-Known Member

    Các kỹ thuật Data Mining(tt)
    • Descriptive Data Mining
      • Gom nhóm, phân cụm, nhận dạng
      • Cây quyết định
      • Khai phá luật kết hợp
      • Phân tích sự phát triển và độ lệch
      • Thống kê
    • Predictive Data Mining
      • Phân lớp, máy học, hệ chuyên gia
      • Thống kê hồi quy
      • Mạng nơ-ron
      • Giải thuật di truyền
     
  13. tableau

    tableau Well-Known Member

    Các công cụ Data Mining
    • SQL Analyzer
    • Intelligence Miner (IBM)
    • SPSS
    SPSS.gif
     
    Hienlt and Hiền like this.
  14. bsdinsight

    bsdinsight Well-Known Member

    Hiền likes this.
  15. tableau

    tableau Well-Known Member

  16. tableau

    tableau Well-Known Member

    OLAP
    1. Tỉ lệ bệnh tật trung bình giữa người hút thuốc và người không hút thuốc?
    2. Hóa đơn điện thoại trung bình của khách hàng hiện tại so với khách hàng cũ đã rời bỏ công ty?
    3. Số tiền mua trung bình hằng ngày giữa thẻ tín dụng bị đánh cắp hoạt động và thẻ hợp pháp?
    Data Mining
    1. Những dự đoán tốt nhất cho bệnh tật?
    2. X sẽ rời khỏi công ty? Những yếu tố ảnh hưởng?
    3. Mô hình mua nào lên quan đến gian lận thẻ tín dụng?
     
    Last edited by a moderator: Sep 26, 2014
  17. lehonghai

    lehonghai New Member

    em mới đọc qua, cảm ơn chị đã chia sẽ những thông tin cơ bản nhất, tổng quát nhất về data mining. vì em sắp làm việc này, cũng có học qua ở đại học nhưng chưa đi cụ thể vào nhiều. nên chưa biết rõ là Data Minning. lần nữa cảm ơn về sự chia sẽ của chị
     

Share This Page