分類(Classification)是機(jī)器學(xué)習(xí)中的一種有監(jiān)督學(xué)習(xí)任務(wù),其目標(biāo)是根據(jù)輸入數(shù)據(jù)的特征將數(shù)據(jù)點(diǎn)分配到預(yù)定義的類別中。

二分類、多類分類、多標(biāo)簽分類和多輸出分類是機(jī)器學(xué)習(xí)中的四種重要分類問(wèn)題。其中二分類區(qū)分兩個(gè)類別,多類分類選擇多個(gè)類別中的一個(gè),多標(biāo)簽分類允許一個(gè)樣本擁有多個(gè)標(biāo)簽,而多輸出分類則為每個(gè)類別提供獨(dú)立的輸出值或概率。

一、二分類

二分類(Binary Classification)是什么?二分類是機(jī)器學(xué)習(xí)中最基本的分類問(wèn)題之一,它將數(shù)據(jù)集中的樣本劃分為兩個(gè)互斥的類別。二分類任務(wù)的目標(biāo)是預(yù)測(cè)一個(gè)樣本屬于兩個(gè)類別中的哪一個(gè)。

二分類應(yīng)用場(chǎng)景有哪些?

垃圾郵件檢測(cè)(郵件是垃圾郵件還是非垃圾郵件)、疾病診斷(患者是否患?。?、信用評(píng)分(個(gè)人信用是否達(dá)標(biāo))等。

二分類常見算法有哪些?邏輯回歸、支持向量機(jī)(SVM)等。

邏輯回歸用閾值判斷實(shí)現(xiàn)二分類,適合線性和非線性數(shù)據(jù);支持向量機(jī)找最優(yōu)超平面分類,對(duì)線性不可分?jǐn)?shù)據(jù)用核函數(shù)處理,泛化能力強(qiáng)。

  1. 邏輯回歸(Logistic Regression):將線性模型的輸出映射到0和1之間,通過(guò)閾值判斷來(lái)進(jìn)行二分類。
  2. 支持向量機(jī)(Support Vector Machine, SVM):在特征空間中找到一個(gè)最優(yōu)的超平面來(lái)實(shí)現(xiàn)分類。對(duì)于線性不可分的數(shù)據(jù),可以通過(guò)核函數(shù)將其映射到高維空間,從而變得線性可分。

二、多類分類

多類分類(Multi-class Classification)是什么?多類分類問(wèn)題是指數(shù)據(jù)集中的樣本可以被劃分為多個(gè)類別,并且每個(gè)樣本只能屬于一個(gè)類別。多類分類任務(wù)的目標(biāo)是預(yù)測(cè)一個(gè)樣本屬于多個(gè)類別中的某一個(gè)。

多類分類應(yīng)用場(chǎng)景有哪些?手寫數(shù)字識(shí)別(0-9的數(shù)字)、物體識(shí)別(貓、狗、兔等)、文本分類(新聞、體育、科技等)等。

多類分類常見算法有哪些?Softmax回歸、k-近鄰(k-NN)等。

Softmax回歸通過(guò)映射線性模型輸出到概率分布實(shí)現(xiàn)多類分類,而k-近鄰(k-NN)則基于距離度量與已知樣本的相似性來(lái)進(jìn)行多類分類。

  1. Softmax回歸:將線性模型的輸出映射到多個(gè)類別上的概率分布,通過(guò)比較不同類別的概率來(lái)進(jìn)行多分類。具體來(lái)說(shuō),Softmax函數(shù)會(huì)將線性模型的輸出(也稱為logits)轉(zhuǎn)換為概率分布,每個(gè)類別的概率值都在0和1之間,且所有類別的概率值之和為1。
  2. k-近鄰(k-Nearest Neighbors, k-NN):基于實(shí)例的學(xué)習(xí)方法,通過(guò)比較待分類樣本與已知類別樣本之間的距離來(lái)進(jìn)行分類。在多類分類問(wèn)題中,k-NN算法會(huì)選擇距離待分類樣本最近的k個(gè)已知樣本,并根據(jù)這些樣本的類別進(jìn)行投票,選擇出現(xiàn)次數(shù)最多的類別作為待分類樣本的類別。

三、多標(biāo)簽分類

多標(biāo)簽分類(Multi-label Classification)是什么?多標(biāo)簽分類問(wèn)題是指一個(gè)樣本可以同時(shí)被賦予多個(gè)標(biāo)簽,這些標(biāo)簽之間不是互斥的。多標(biāo)簽分類任務(wù)的目標(biāo)是預(yù)測(cè)一個(gè)樣本同時(shí)屬于哪些標(biāo)簽集合中的標(biāo)簽。

多標(biāo)簽分類應(yīng)用場(chǎng)景有哪些?文本主題標(biāo)注(一篇文章可能同時(shí)涉及政治、經(jīng)濟(jì)、文化等多個(gè)主題)、圖像標(biāo)注(一張圖片可能包含多個(gè)對(duì)象或場(chǎng)景)等。

多標(biāo)簽分類常見方法是什么?將多標(biāo)簽分類問(wèn)題轉(zhuǎn)化為多個(gè)二分類問(wèn)題來(lái)解決,或者利用上一個(gè)輸出的標(biāo)簽作為下一個(gè)標(biāo)簽分類器的輸入。

四、多輸出分類

多輸出分類(Multi-output Classification)是什么?多輸出分類問(wèn)題是指每個(gè)樣本可以屬于多個(gè)類別,并且每個(gè)類別可能有不同的輸出值或概率。多輸出分類任務(wù)的目標(biāo)是預(yù)測(cè)一個(gè)樣本在每個(gè)類別上的輸出值或概率。

多輸出分類應(yīng)用場(chǎng)景有哪些?醫(yī)學(xué)診斷(一個(gè)患者可能同時(shí)患有多種疾病,每種疾病需要獨(dú)立的預(yù)測(cè)結(jié)果)、圖像分割(每個(gè)像素點(diǎn)可能屬于多個(gè)類別)等。

多輸出分類常見方法是什么?多輸出神經(jīng)網(wǎng)絡(luò)、多輸出支持向量機(jī)等。這些方法通常需要對(duì)每個(gè)類別構(gòu)建獨(dú)立的輸出層,并使用適當(dāng)?shù)膿p失函數(shù)進(jìn)行訓(xùn)練。

本文章轉(zhuǎn)載微信公眾號(hào)@架構(gòu)師帶你玩轉(zhuǎn)AI

上一篇:

一文徹底搞懂機(jī)器學(xué)習(xí) - Softmax回歸(Softmax Regression)

下一篇:

一文徹底搞懂機(jī)器學(xué)習(xí) - 基礎(chǔ)知識(shí)
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)