Lời mở đầu Trong Machine Learning, thuật toán hiếm khi là vấn đề. Dữ liệu và cách biểu diễn dữ liệu mới là yếu tố quyết định. Bài viết này phân tích một mô hình Binary Classification đơn giản trong ML.NET để chỉ ra: Vì sao Accuracy có thể gây hiểu nhầm Vì sao Recall 100% có thể là dấu hiệu nguy hiểm Vì sao Feature Engineering mới là đòn bẩy thực sự Các bài viết khác Machine Learning: Học Machine Learning từ góc nhìn Developer - Part 1 Machine Learning: Từ Đường Thẳng, Vector đến Classification - Part 2 1. Bài toán Ta có dữ liệu: Duration – thời gian khách ở lại website IsPurchased – có mua hàng hay không public class CustomerData { [LoadColumn(0)] public float Duration { get; set; } [LoadColumn(1)] public bool IsPurchased { get; set; } } Mục tiêu: Dự đoán IsPurchased . 2. Setup Pipeline đơn giản var mlContext = new MLContext(); var data = mlContext.Data.LoadFromTextFile<CustomerData>( fileName, hasHeader: true, s...
Suy nghĩ, yêu thương và làm việc hết mình