Chuyển đến nội dung chính

Bài đăng

Đang hiển thị bài đăng từ Tháng 1, 2026

Cosine Similarity – Toán học đứng sau cách LLM hiểu ý nghĩa

Khi bạn trò chuyện với một mô hình ngôn ngữ lớn (LLM), cảm giác như nó thật sự “hiểu” ý nghĩa câu chữ. Nhưng bên dưới lớp vỏ ngôn ngữ tự nhiên đó là toán học, vector và hình học. Một trong những khái niệm quan trọng nhất giúp LLM so sánh ý nghĩa chính là cosine similarity . Nếu bạn từng thắc mắc vì sao AI biết hai câu “gần nghĩa” nhau, thì cosine similarity chính là chìa khóa. Cosine Similarity là gì? Đối với máy tính, văn bản không phải là chữ mà là vector số . Cosine similarity đo mức độ giống nhau giữa hai vector bằng cách đo góc giữa chúng , thay vì đo độ dài. Hãy tưởng tượng hai mũi tên xuất phát từ cùng một điểm: Cùng hướng → góc 0° → cosine similarity = 1 Vuông góc → góc 90° → cosine similarity = 0 Ngược hướng → góc 180° → cosine similarity = -1 Trong NLP, hai câu có ý nghĩa tương tự sẽ tạo ra các vector cùng hướng trong không gian . Công thức toán học Cosine similarity giữa hai vector A và B được định nghĩa như sau: $$ \text{cosine\_similarity...

Machine Learning: Từ Đường Thẳng, Vector đến Classification - Part 2

Mở đầu Trong hình học phổ thông, chúng ta quen thuộc với các khái niệm như đường thẳng, song song và vuông góc trên mặt giấy. Khi bước sang thế giới Machine Learning (ML) , đặc biệt là bài toán Classification (Phân loại) , những khái niệm này không biến mất. Chúng được nâng cấp và mở rộng vào không gian nhiều chiều, dưới dạng các vector . Bài viết này nhằm kết nối tư duy hình học thuần túy với cách mà các thư viện Machine Learning thực sự xử lý dữ liệu. Mọi bài toán phân loại trong Machine Learning đều có thể được mô tả như một bài toán hình học trong không gian vector nhiều chiều. Cách nhìn bài toán phân loại dưới góc độ hình học trong bài viết này chỉ áp dụng cho các mô hình phân loại tuyến tính . Với các mô hình phi tuyến, dữ liệu thường được biến đổi sang một không gian khác trước khi áp dụng phân tách tuyến tính. 1. Vector và siêu phẳng trong bài toán phân loại Vector là đối tượng cơ bản dùng để biểu diễn dữ liệu trong Machine Learning. Mỗi mẫu dữ liệu, sau khi...