1. Kaggle là gì? Kaggle là một nền tảng trực tuyến tập trung vào Data Science và Machine Learning, nơi người học có thể thực hành với các bài toán dữ liệu thực tế thông qua các cuộc thi, dataset và notebook chia sẻ từ cộng đồng. 2. Các thành phần chính của Kaggle 2.1 Competitions Các cuộc thi trên Kaggle cung cấp bài toán thực tế, dữ liệu huấn luyện, dữ liệu kiểm tra và thước đo đánh giá rõ ràng. Một ví dụ tiêu biểu là cuộc thi dự đoán giá nhà (House Prices). 2.2 Datasets Kaggle cung cấp hàng nghìn bộ dữ liệu miễn phí thuộc nhiều lĩnh vực, phục vụ cho việc học tập, nghiên cứu và thực hành Machine Learning. 2.3 Notebooks & Community Notebook cho phép chạy code trực tiếp trên trình duyệt và học hỏi từ các lời giải, phân tích của cộng đồng. 3. Có thể dùng ML.NET để giải Kaggle không? Kaggle không giới hạn ngôn ngữ hay framework. Người học hoàn toàn có thể sử dụng ML.NET với C# để huấn lu...
Trong các bài toán học máy với dữ liệu chuỗi thời gian, đặc trưng thời gian như hour , day , month có tính chất vòng lặp. Tuy nhiên nếu biểu diễn chúng như các số tuyến tính thông thường, model sẽ hiểu sai về độ gần nhau của các thời điểm. Để máy học hiểu được tính chất vòng lặp này, chúng ta sử dụng toán học ánh xạ thời gian lên một vòng tròn đơn vị (Unit Circle) bằng các hàm lượng giác sin và cos . Nguồn tham khảo chính cho kỹ thuật này được lấy từ bài viết: Cyclical Encoding: An Alternative to One-Hot Encoding for Time Series Features (Haden Pelletier, May 3, 2024). Biểu diễn thời gian bằng Sin & Cos Mỗi thời điểm trong một chu kỳ được tách thành hai feature mới: Sin Component Cos Component Công thức tổng quát: $$ x_{sin} = \sin\left(\frac{2 \pi \times t}{T}\right) $$ $$ x_{cos} = \cos\left(\frac{2 \pi \times t}{T}\right) $$ Trong đó: $t$ : giá trị thời gian hiện tại (ví dụ: giờ trong ngày). $T$ : độ...