介紹 · TensorFlow 機器學習秘籍中文第二版

# 介紹 SVM 是二分類的方法。基本思想是在兩個類之間找到二維的線性分離線（或更多維度的超平面）。我們首先假設二進制類目標是-1 或 1，而不是先前的 0 或 1 目標。由于可能有許多行分隔兩個類，我們定義最佳線性分隔符，以最大化兩個類之間的距離： ![](https://img.kancloud.cn/4e/6e/4e6ee7e9818ebcc5b94904069f6ec4e4_865x456.png) 圖 1 給定兩個可分類`o`和`x`，我們希望找到兩者之間的線性分離器的等式。左側繪圖顯示有許多行將兩個類分開。右側繪圖顯示了唯一的最大邊際線。邊距寬度由`2 / ||A||`給出。通過最小化`A`的 L2 范數找到該線。我們可以編寫如下超平面： ![](https://img.kancloud.cn/7b/03/7b03887c635c59dc1e2317520b6a6736_890x180.png) 這里，`A`是我們部分斜率的向量，`x`是輸入向量。最大邊距的寬度可以顯示為 2 除以`A`的 L2 范數。這個事實有許多證明，但是對于幾何思想，求解從 2D 點到直線的垂直距離可以提供前進的動力。對于線性可分的二進制類數據，為了最大化余量，我們最小化`A`，![](https://img.kancloud.cn/c0/ad/c0ad97def00793c82db737f2cd74bbe8_25x17.png)的 L2 范數。我們還必須將此最小值置于以下約束條件下： ![](https://img.kancloud.cn/1f/20/1f201f3ca9daa101e1ec1801cf55501c_1590x210.png) 前面的約束確保我們來自相應類的所有點都在分離線的同一側。由于并非所有數據集都是線性可分的，因此我們可以為跨越邊界線的點引入損失函數。對于`n`數據點，我們引入了所謂的軟邊際損失函數，如下所示： ![](https://img.kancloud.cn/37/d7/37d7077aaa09831478345e41abd32320_3400x540.png) 請注意，如果該點位于邊距的正確一側，則產品`y[i](Ax[i] - b)`始終大于 1。這使得損失函數的左手項等于 0，并且對損失函數的唯一影響是余量的大小。前面的損失函數將尋找線性可分的線，但允許穿過邊緣線的點。根據`α`的值，這可以是硬度或軟度量。`α`的較大值導致更加強調邊距的擴大，而`α`的較小值導致模型更像是一個硬邊緣，同時允許數據點跨越邊距，如果需要的話。在本章中，我們將建立一個軟邊界 SVM，并展示如何將其擴展到非線性情況和多個類。