Thuật ngữ:
Tập hỗ trợ: support vector
Hàm mất mát: loss function
Không gian cao chiều: high dimensional space
Đường biên: boundary
Lề: margin
Phân loại đường biên cứng SVM: hard margin SVM
Phân loại đường biên mềm SVM: soft margin SVM
Quá khớp: overfitting
Bài toán gốc: primal problem
Đối ngẫu: duality
Bài toán đối ngẫu: duality problem
Đối ngẫu mạnh: strong duality
Hàm quyết định: decision function
Hàm kernel: kernel function
Phân tuyến: linear seperable
Điểm hỗ trợ: support points
véc tơ hỗ trợ: support vector
Hàm đối ngẫu Lagrange: Lagrange Dual Function
Hàm biến đổi phi tuyến: non-linear transformation function
Tạo lập đặc trưng đa thức: Polynormial Features
7. Giới thiệu về SVM¶
SVM là viết tắt của cụm từ support vector machine. Đây là một thuật toán khá hiệu quả trong lớp các bài toán phân loại nhị phân và dự báo của học có giám sát. Thuật toán này có ưu điểm là hoạt động tốt đối với những mẫu dữ liệu có kích thước lớn và thường mang lại kết quả vượt trội so với lớp các thuật toán khác trong học có giám sát.
Ưu điểm của SVM đó là:
Đây là thuật toán hoạt động hiệu quả với không gian cao chiều (high dimensional spaces).
Thuật toán tiêu tốn ít bộ nhớ vì chỉ sử dụng các điểm trong tập hỗ trợ để dự báo trong hàm quyết định.
Chúng ta có thể tạo ra nhiều hàm quyết định từ những hàm kernel khác nhau. Thậm chí sử dụng đúng kernel có thể giúp cải thiện thuật toán lên đáng kể.
Chính vì tính hiệu quả mà SVM thường được áp dụng nhiều trong các tác vụ phân loại và dự báo, cũng như được nhiều công ty ứng dụng và triển khai trên môi trường production. Chúng ta có thể liệt kê một số ứng dụng của thuật toán SVM đó là:
Mô hình chuẩn đoán bệnh. Dựa vào biến mục tiêu là những chỉ số xét nghiệm lâm sàng, thuật toán đưa ra dự báo về một số bệnh như tiểu đường, suy thận, máu nhiễm mỡ,…
Trước khi thuật toán CNN và Deep Learning bùng nổ thì SVM là lớp mô hình cực kì phổ biến trong phân loại ảnh.
Mô hình phân loại tin tức. Xác định chủ đề của một đoạn văn bản, phân loại cảm xúc văn bản, phân loại thư rác.
Mô hình phát hiện gian lận.
Trong bài viết này chúng ta sẽ cùng tìm hiểu về nội dung của mô hình SVM.