SQL SERVER數(shù)據(jù)挖掘之理解列的用法
繼上次我們介紹了:SQL SERVER 數(shù)據(jù)挖掘之理解內(nèi)容類型,這次我們介紹SQL SERVER數(shù)據(jù)挖掘之理解列的用法。
這是一個(gè)小的細(xì)節(jié)問(wèn)題,我們?cè)诙x挖掘模型的時(shí)候,會(huì)指定不同的列的用法,基本上有如下幾種:
- Ignore(忽略)
- Input(輸入)
- Predict(預(yù)測(cè))
- PredictOnly(僅預(yù)測(cè))

前面兩個(gè)很容易理解,“忽略”就是說(shuō)這個(gè)列不在當(dāng)前算法中使用,例如某些列在某些算法里面不受支持。而“輸入”則是最常見(jiàn)的一種用法,就是說(shuō)這個(gè)列作為算法作為預(yù)測(cè)分析的輸入數(shù)據(jù)。
關(guān)鍵在于如何理解“預(yù)測(cè)”與“僅預(yù)測(cè)”。
預(yù)測(cè):這種列的意思是,該列既作為輸入列(輸入的數(shù)據(jù)),也作為輸出列(預(yù)測(cè)的結(jié)果)。
僅預(yù)測(cè):該列只作為輸出列,不能作為輸入列。也就是說(shuō)它不會(huì)作為對(duì)其他因素做分析或者預(yù)測(cè)的因素。
這里面有兩個(gè)主要層面的意思:
如果是選擇“預(yù)測(cè)”這種用法,那么這種列可以作為“輸入”的性質(zhì),對(duì)其他列(尤其是其他預(yù)測(cè)列)產(chǎn)生影響。而“僅預(yù)測(cè)”這種則是說(shuō)自己只是僅僅作為預(yù)測(cè)的目的存在,它本身不能作為預(yù)測(cè)其他列的前提。
所以,如果有多個(gè)預(yù)測(cè)列(這在有的時(shí)候也是可能的),那么對(duì)于某些列,設(shè)置為“預(yù)測(cè)”而不是“僅預(yù)測(cè)”應(yīng)該是很有必要的;而對(duì)于在模型中只有***的預(yù)測(cè)目標(biāo)列時(shí),可以設(shè)置為“僅預(yù)測(cè)”來(lái)提高模型的準(zhǔn)確性和效率。
在對(duì)新數(shù)據(jù)做預(yù)測(cè)的時(shí)候,我們也可以看到這樣的意思:

在這種情況下,Bike Buyer這個(gè)列,也可以作為輸入進(jìn)行映射。

關(guān)于SQL SERVER數(shù)據(jù)挖掘之列的用法就介紹到這里,下一篇我們介紹:SQL SERVER數(shù)據(jù)挖掘之理解聚類算法和順序聚類算法。
【編輯推薦】


















