Hôm trước lướt Facebook, mình tình cờ thấy một trang fanpage chia sẻ về trang web có tên là Interactive ML (địa chỉ: https://www.interactive-ml.com/ ). Tiện tay bấm vào nghía qua thử một lúc thì thấy nó hay quá, nên phải lưu lại và chia sẻ ngay với mọi người. Dù chưa có thời gian cày cuốc hết toàn bộ nội dung trên này, nhưng ấn tượng đầu tiên của mình là trang web này cực kỳ hợp cho những ai muốn hiểu bản chất thuật toán mà không bị ngợp bởi đống công thức toán hay code khô khan. Thay vì bắt mình đọc những bức tường chữ đầy lý thuyết, Interactive ML giải thích mọi thứ bằng biểu đồ tương tác trực quan . Điểm cộng lớn nhất là bạn có thể tự tay click chuột, kéo thả các điểm dữ liệu, tăng giảm tham số rồi nhìn thấy mô hình thay đổi ngay lập tức trước mắt. Dạo qua menu thì mình thấy trang web cover khá đầy đủ chủ đề, từ cơ bản đến nâng cao: Mấy thuật toán quen thuộc như Hồi quy (Linear, Ridge, Lasso) hay Phân lớp (KNN, Decision Tree, SVM...). Các chỉ số đo lường dễ gây lú...
Trong thống kê và học máy truyền thống (như hồi quy tuyến tính), chúng ta thường tập trung trả lời câu hỏi: "Sự kiện có xảy ra không?" hoặc "Giá trị dự báo là bao nhiêu?" . Tuy nhiên, trong thực tế có những bài toán cốt lõi lại là: "Khi nào sự kiện sẽ xảy ra?" . Đó chính là lý do Survival Analysis (Phân tích sống còn) ra đời. 1. Survival Analysis là gì? Survival Analysis là một nhánh của thống kê chuyên dùng để nghiên cứu và dự đoán khoảng thời gian cho đến khi một sự kiện cụ thể (Event) xảy ra . Khoảng thời gian này được gọi là Survival Time hoặc Time-to-event . Ban đầu, kỹ thuật này được phát triển trong y học để theo dõi thời gian sống sót của bệnh nhân. Ngày nay, khái niệm "sự kiện" đã được mở rộng ra mọi lĩnh vực: Y sinh: Thời gian từ khi điều trị đến khi bệnh nhân tái phát hoặc khỏi bệnh. Kỹ thuật (Reliability Engineering): Thời gian từ khi máy móc hoạt động đến khi một linh kiện (như ổ cứng, động cơ) bị hỏng. Quản...