精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機(jī)器學(xué)習(xí)中的數(shù)學(xué)(5)-強(qiáng)大的矩陣奇異值分解及其應(yīng)用

數(shù)據(jù)庫(kù)
本文主要關(guān)注奇異值的一些特性,另外還會(huì)稍稍提及奇異值的計(jì)算,不過(guò)本文不準(zhǔn)備在如何計(jì)算奇異值上展開(kāi)太多。另外,本文里面有部分不算太深的線(xiàn)性代數(shù)的知識(shí),如果完全忘記了線(xiàn)性代數(shù),看本文可能會(huì)有些困難。

 上一次寫(xiě)了關(guān)于PCA與LDA的文章,PCA的實(shí)現(xiàn)一般有兩種,一種是用特征值分解去實(shí)現(xiàn)的,一種是用奇異值分解去實(shí)現(xiàn)的。在上篇文章中便是基于特征值分解的一種解釋。特征值和奇異值在大部分人的印象中,往往是停留在純粹的數(shù)學(xué)計(jì)算中。而且線(xiàn)性代數(shù)或者矩陣論里面,也很少講任何跟特征值與奇異值有關(guān)的應(yīng)用背景。奇異值分解是一個(gè)有著很明顯的物理意義的一種方法,它可以將一個(gè)比較復(fù)雜的矩陣用更小更簡(jiǎn)單的幾個(gè)子矩陣的相乘來(lái)表示,這些小矩陣描述的是矩陣的重要的特性。就像是描述一個(gè)人一樣,給別人描述說(shuō)這個(gè)人長(zhǎng)得濃眉大眼,方臉,絡(luò)腮胡,而且?guī)€(gè)黑框的眼鏡,這樣寥寥的幾個(gè)特征,就讓別人腦海里面就有一個(gè)較為清楚的認(rèn)識(shí),實(shí)際上,人臉上的特征是有著無(wú)數(shù)種的,之所以能這么描述,是因?yàn)槿颂焐陀兄浅:玫某槿≈匾卣鞯哪芰Γ寵C(jī)器學(xué)會(huì)抽取重要的特征,SVD是一個(gè)重要的方法。

    在機(jī)器學(xué)習(xí)領(lǐng)域,有相當(dāng)多的應(yīng)用與奇異值都可以扯上關(guān)系,比如做feature reduction的PCA,做數(shù)據(jù)壓縮(以圖像壓縮為代表)的算法,還有做搜索引擎語(yǔ)義層次檢索的LSI(Latent Semantic Indexing)

    另外在這里抱怨一下,之前在百度里面搜索過(guò)SVD,出來(lái)的結(jié)果都是俄羅斯的一種狙擊槍?zhuān)ˋK47同時(shí)代的),是因?yàn)榇┰交鹁€(xiàn)這個(gè)游戲里面有一把狙擊槍叫做SVD,而在Google上面搜索的時(shí)候,出來(lái)的都是奇異值分解(英文資料為主)。想玩玩戰(zhàn)爭(zhēng)游戲,玩玩COD不是非常好嗎,玩山寨的CS有神馬意思啊。國(guó)內(nèi)的網(wǎng)頁(yè)中的話(huà)語(yǔ)權(quán)也被這些沒(méi)有太多營(yíng)養(yǎng)的帖子所占據(jù)。真心希望國(guó)內(nèi)的氣氛能夠更濃一點(diǎn),搞游戲的人真正是喜歡制作游戲,搞Data Mining的人是真正喜歡挖數(shù)據(jù)的,都不是僅僅為了混口飯吃,這樣談超越別人才有意義,中文文章中,能踏踏實(shí)實(shí)談?wù)劶夹g(shù)的太少了,改變這個(gè)狀況,從我自己做起吧。

    前面說(shuō)了這么多,本文主要關(guān)注奇異值的一些特性,另外還會(huì)稍稍提及奇異值的計(jì)算,不過(guò)本文不準(zhǔn)備在如何計(jì)算奇異值上展開(kāi)太多。另外,本文里面有部分不算太深的線(xiàn)性代數(shù)的知識(shí),如果完全忘記了線(xiàn)性代數(shù),看本文可能會(huì)有些困難。

一、奇異值與特征值基礎(chǔ)知識(shí):

    特征值分解和奇異值分解在機(jī)器學(xué)習(xí)領(lǐng)域都是屬于滿(mǎn)地可見(jiàn)的方法。兩者有著很緊密的關(guān)系,我在接下來(lái)會(huì)談到,特征值分解和奇異值分解的目的都是一樣,就是提取出一個(gè)矩陣最重要的特征。先談?wù)勌卣髦捣纸獍桑?/p>

   1)特征值:

    如果說(shuō)一個(gè)向量v是方陣A的特征向量,將一定可以表示成下面的形式:

image

    這時(shí)候λ就被稱(chēng)為特征向量v對(duì)應(yīng)的特征值,一個(gè)矩陣的一組特征向量是一組正交向量。特征值分解是將一個(gè)矩陣分解成下面的形式:

image

    其中Q是這個(gè)矩陣A的特征向量組成的矩陣,Σ是一個(gè)對(duì)角陣,每一個(gè)對(duì)角線(xiàn)上的元素就是一個(gè)特征值。我這里引用了一些參考文獻(xiàn)中的內(nèi)容來(lái)說(shuō)明一下。首先,要明確的是,一個(gè)矩陣其實(shí)就是一個(gè)線(xiàn)性變換,因?yàn)橐粋€(gè)矩陣乘以一個(gè)向量后得到的向量,其實(shí)就相當(dāng)于將這個(gè)向量進(jìn)行了線(xiàn)性變換。比如說(shuō)下面的一個(gè)矩陣:

   image    它其實(shí)對(duì)應(yīng)的線(xiàn)性變換是下面的形式:

image    因?yàn)檫@個(gè)矩陣M乘以一個(gè)向量(x,y)的結(jié)果是:

image    上面的矩陣是對(duì)稱(chēng)的,所以這個(gè)變換是一個(gè)對(duì)x,y軸的方向一個(gè)拉伸變換(每一個(gè)對(duì)角線(xiàn)上的元素將會(huì)對(duì)一個(gè)維度進(jìn)行拉伸變換,當(dāng)值>1時(shí),是拉長(zhǎng),當(dāng)值<1時(shí)時(shí)縮短),當(dāng)矩陣不是對(duì)稱(chēng)的時(shí)候,假如說(shuō)矩陣是下面的樣子:

 

 

 

 

image

    它所描述的變換是下面的樣子:

image

    這其實(shí)是在平面上對(duì)一個(gè)軸進(jìn)行的拉伸變換(如藍(lán)色的箭頭所示),在圖中,藍(lán)色的箭頭是一個(gè)最主要的變化方向(變化方向可能有不止一個(gè)),如果我們想要描述好一個(gè)變換,那我們就描述好這個(gè)變換主要的變化方向就好了。反過(guò)頭來(lái)看看之前特征值分解的式子,分解得到的Σ矩陣是一個(gè)對(duì)角陣,里面的特征值是由大到小排列的,這些特征值所對(duì)應(yīng)的特征向量就是描述這個(gè)矩陣變化方向(從主要的變化到次要的變化排列)

    當(dāng)矩陣是高維的情況下,那么這個(gè)矩陣就是高維空間下的一個(gè)線(xiàn)性變換,這個(gè)線(xiàn)性變化可能沒(méi)法通過(guò)圖片來(lái)表示,但是可以想象,這個(gè)變換也同樣有很多的變換方向,我們通過(guò)特征值分解得到的前N個(gè)特征向量,那么就對(duì)應(yīng)了這個(gè)矩陣最主要的N個(gè)變化方向。我們利用這前N個(gè)變化方向,就可以近似這個(gè)矩陣(變換)。也就是之前說(shuō)的:提取這個(gè)矩陣最重要的特征。總結(jié)一下,特征值分解可以得到特征值與特征向量,特征值表示的是這個(gè)特征到底有多重要,而特征向量表示這個(gè)特征是什么,可以將每一個(gè)特征向量理解為一個(gè)線(xiàn)性的子空間,我們可以利用這些線(xiàn)性的子空間干很多的事情。不過(guò),特征值分解也有很多的局限,比如說(shuō)變換的矩陣必須是方陣。

   (說(shuō)了這么多特征值變換,不知道有沒(méi)有說(shuō)清楚,請(qǐng)各位多提提意見(jiàn)。)

 

   2)奇異值:

    下面談?wù)勂娈愔捣纸狻L卣髦捣纸馐且粋€(gè)提取矩陣特征很不錯(cuò)的方法,但是它只是對(duì)方陣而言的,在現(xiàn)實(shí)的世界中,我們看到的大部分矩陣都不是方陣,比如說(shuō)有N個(gè)學(xué)生,每個(gè)學(xué)生有M科成績(jī),這樣形成的一個(gè)N * M的矩陣就不可能是方陣,我們?cè)鯓硬拍苊枋鲞@樣普通的矩陣呢的重要特征呢?奇異值分解可以用來(lái)干這個(gè)事情,奇異值分解是一個(gè)能適用于任意的矩陣的一種分解的方法

image    假設(shè)A是一個(gè)N * M的矩陣,那么得到的U是一個(gè)N * N的方陣(里面的向量是正交的,U里面的向量稱(chēng)為左奇異向量),Σ是一個(gè)N * M的矩陣(除了對(duì)角線(xiàn)的元素都是0,對(duì)角線(xiàn)上的元素稱(chēng)為奇異值),V’(V的轉(zhuǎn)置)是一個(gè)N * N的矩陣,里面的向量也是正交的,V里面的向量稱(chēng)為右奇異向量),從圖片來(lái)反映幾個(gè)相乘的矩陣的大小可得下面的圖片

image

    那么奇異值和特征值是怎么對(duì)應(yīng)起來(lái)的呢?首先,我們將一個(gè)矩陣A的轉(zhuǎn)置 * A,將會(huì)得到一個(gè)方陣,我們用這個(gè)方陣求特征值可以得到:image    這里得到的v,就是我們上面的右奇異向量。此外我們還可以得到:

image    這里的σ就是上面說(shuō)的奇異值,u就是上面說(shuō)的左奇異向量。奇異值σ跟特征值類(lèi)似,在矩陣Σ中也是從大到小排列,而且σ的減少特別的快,在很多情況下,前10%甚至1%的奇異值的和就占了全部的奇異值之和的99%以上了。也就是說(shuō),我們也可以用前r大的奇異值來(lái)近似描述矩陣,這里定義一下部分奇異值分解

image

    r是一個(gè)遠(yuǎn)小于m、n的數(shù),這樣矩陣的乘法看起來(lái)像是下面的樣子:

 

 

 

 

image

    右邊的三個(gè)矩陣相乘的結(jié)果將會(huì)是一個(gè)接近于A(yíng)的矩陣,在這兒,r越接近于n,則相乘的結(jié)果越接近于A(yíng)。而這三個(gè)矩陣的面積之和(在存儲(chǔ)觀(guān)點(diǎn)來(lái)說(shuō),矩陣面積越小,存儲(chǔ)量就越小)要遠(yuǎn)遠(yuǎn)小于原始的矩陣A,我們?nèi)绻胍獕嚎s空間來(lái)表示原矩陣A,我們存下這里的三個(gè)矩陣:U、Σ、V就好了。

 

二、奇異值的計(jì)算:

    奇異值的計(jì)算是一個(gè)難題,是一個(gè)O(N^3)的算法。在單機(jī)的情況下當(dāng)然是沒(méi)問(wèn)題的,matlab在一秒鐘內(nèi)就可以算出1000 * 1000的矩陣的所有奇異值,但是當(dāng)矩陣的規(guī)模增長(zhǎng)的時(shí)候,計(jì)算的復(fù)雜度呈3次方增長(zhǎng),就需要并行計(jì)算參與了。Google的吳軍老師在數(shù)學(xué)之美系列談到SVD的時(shí)候,說(shuō)起Google實(shí)現(xiàn)了SVD的并行化算法,說(shuō)這是對(duì)人類(lèi)的一個(gè)貢獻(xiàn),但是也沒(méi)有給出具體的計(jì)算規(guī)模,也沒(méi)有給出太多有價(jià)值的信息。

    其實(shí)SVD還是可以用并行的方式去實(shí)現(xiàn)的,在解大規(guī)模的矩陣的時(shí)候,一般使用迭代的方法,當(dāng)矩陣的規(guī)模很大(比如說(shuō)上億)的時(shí)候,迭代的次數(shù)也可能會(huì)上億次,如果使用Map-Reduce框架去解,則每次Map-Reduce完成的時(shí)候,都會(huì)涉及到寫(xiě)文件、讀文件的操作。個(gè)人猜測(cè)Google云計(jì)算體系中除了Map-Reduce以外應(yīng)該還有類(lèi)似于MPI的計(jì)算模型,也就是節(jié)點(diǎn)之間是保持通信,數(shù)據(jù)是常駐在內(nèi)存中的,這種計(jì)算模型比Map-Reduce在解決迭代次數(shù)非常多的時(shí)候,要快了很多倍。

    Lanczos迭代就是一種解對(duì)稱(chēng)方陣部分特征值的方法(之前談到了,解A’* A得到的對(duì)稱(chēng)方陣的特征值就是解A的右奇異向量),是將一個(gè)對(duì)稱(chēng)的方程化為一個(gè)三對(duì)角矩陣再進(jìn)行求解。按網(wǎng)上的一些文獻(xiàn)來(lái)看,Google應(yīng)該是用這種方法去做的奇異值分解的。請(qǐng)見(jiàn)Wikipedia上面的一些引用的論文,如果理解了那些論文,也“幾乎”可以做出一個(gè)SVD了。

    由于奇異值的計(jì)算是一個(gè)很枯燥,純數(shù)學(xué)的過(guò)程,而且前人的研究成果(論文中)幾乎已經(jīng)把整個(gè)程序的流程圖給出來(lái)了。更多的關(guān)于奇異值計(jì)算的部分,將在后面的參考文獻(xiàn)中給出,這里不再深入,我還是focus在奇異值的應(yīng)用中去。

 

三、奇異值與主成分分析(PCA):

     主成分分析在上一節(jié)里面也講了一些,這里主要談?wù)勅绾斡肧VD去解PCA的問(wèn)題。PCA的問(wèn)題其實(shí)是一個(gè)基的變換,使得變換后的數(shù)據(jù)有著最大的方差。方差的大小描述的是一個(gè)變量的信息量,我們?cè)谥v一個(gè)東西的穩(wěn)定性的時(shí)候,往往說(shuō)要減小方差,如果一個(gè)模型的方差很大,那就說(shuō)明模型不穩(wěn)定了。但是對(duì)于我們用于機(jī)器學(xué)習(xí)的數(shù)據(jù)(主要是訓(xùn)練數(shù)據(jù)),方差大才有意義,不然輸入的數(shù)據(jù)都是同一個(gè)點(diǎn),那方差就為0了,這樣輸入的多個(gè)數(shù)據(jù)就等同于一個(gè)數(shù)據(jù)了。以下面這張圖為例子:

image     這個(gè)假設(shè)是一個(gè)攝像機(jī)采集一個(gè)物體運(yùn)動(dòng)得到的圖片,上面的點(diǎn)表示物體運(yùn)動(dòng)的位置,假如我們想要用一條直線(xiàn)去擬合這些點(diǎn),那我們會(huì)選擇什么方向的線(xiàn)呢?當(dāng)然是圖上標(biāo)有signal的那條線(xiàn)。如果我們把這些點(diǎn)單純的投影到x軸或者y軸上,最后在x軸與y軸上得到的方差是相似的(因?yàn)檫@些點(diǎn)的趨勢(shì)是在45度左右的方向,所以投影到x軸或者y軸上都是類(lèi)似的),如果我們使用原來(lái)的xy坐標(biāo)系去看這些點(diǎn),容易看不出來(lái)這些點(diǎn)真正的方向是什么。但是如果我們進(jìn)行坐標(biāo)系的變化,橫軸變成了signal的方向,縱軸變成了noise的方向,則就很容易發(fā)現(xiàn)什么方向的方差大,什么方向的方差小了。

    一般來(lái)說(shuō),方差大的方向是信號(hào)的方向,方差小的方向是噪聲的方向,我們?cè)跀?shù)據(jù)挖掘中或者數(shù)字信號(hào)處理中,往往要提高信號(hào)與噪聲的比例,也就是信噪比。對(duì)上圖來(lái)說(shuō),如果我們只保留signal方向的數(shù)據(jù),也可以對(duì)原數(shù)據(jù)進(jìn)行不錯(cuò)的近似了。

    PCA的全部工作簡(jiǎn)單點(diǎn)說(shuō),就是對(duì)原始的空間中順序地找一組相互正交的坐標(biāo)軸,第一個(gè)軸是使得方差最大的,第二個(gè)軸是在與第一個(gè)軸正交的平面中使得方差最大的,第三個(gè)軸是在與第1、2個(gè)軸正交的平面中方差最大的,這樣假設(shè)在N維空間中,我們可以找到N個(gè)這樣的坐標(biāo)軸,我們?nèi)∏皉個(gè)去近似這個(gè)空間,這樣就從一個(gè)N維的空間壓縮到r維的空間了,但是我們選擇的r個(gè)坐標(biāo)軸能夠使得空間的壓縮使得數(shù)據(jù)的損失最小。

    還是假設(shè)我們矩陣每一行表示一個(gè)樣本,每一列表示一個(gè)feature,用矩陣的語(yǔ)言來(lái)表示,將一個(gè)m * n的矩陣A的進(jìn)行坐標(biāo)軸的變化,P就是一個(gè)變換的矩陣從一個(gè)N維的空間變換到另一個(gè)N維的空間,在空間中就會(huì)進(jìn)行一些類(lèi)似于旋轉(zhuǎn)、拉伸的變化。

image

    而將一個(gè)m * n的矩陣A變換成一個(gè)m * r的矩陣,這樣就會(huì)使得本來(lái)有n個(gè)feature的,變成了有r個(gè)feature了(r < n),這r個(gè)其實(shí)就是對(duì)n個(gè)feature的一種提煉,我們就把這個(gè)稱(chēng)為feature的壓縮。用數(shù)學(xué)語(yǔ)言表示就是:

image    但是這個(gè)怎么和SVD扯上關(guān)系呢?之前談到,SVD得出的奇異向量也是從奇異值由大到小排列的,按PCA的觀(guān)點(diǎn)來(lái)看,就是方差最大的坐標(biāo)軸就是第一個(gè)奇異向量,方差次大的坐標(biāo)軸就是第二個(gè)奇異向量…我們回憶一下之前得到的SVD式子:

image     在矩陣的兩邊同時(shí)乘上一個(gè)矩陣V,由于V是一個(gè)正交的矩陣,所以V轉(zhuǎn)置乘以V得到單位陣I,所以可以化成后面的式子

image     將后面的式子與A * P那個(gè)m * n的矩陣變換為m * r的矩陣的式子對(duì)照看看,在這里,其實(shí)V就是P,也就是一個(gè)變化的向量。這里是將一個(gè)m * n 的矩陣壓縮到一個(gè)m * r的矩陣,也就是對(duì)列進(jìn)行壓縮,如果我們想對(duì)行進(jìn)行壓縮(在PCA的觀(guān)點(diǎn)下,對(duì)行進(jìn)行壓縮可以理解為,將一些相似的sample合并在一起,或者將一些沒(méi)有太大價(jià)值的sample去掉)怎么辦呢?同樣我們寫(xiě)出一個(gè)通用的行壓縮例子:

image    這樣就從一個(gè)m行的矩陣壓縮到一個(gè)r行的矩陣了,對(duì)SVD來(lái)說(shuō)也是一樣的,我們對(duì)SVD分解的式子兩邊乘以U的轉(zhuǎn)置U'

image    這樣我們就得到了對(duì)行進(jìn)行壓縮的式子。可以看出,其實(shí)PCA幾乎可以說(shuō)是對(duì)SVD的一個(gè)包裝,如果我們實(shí)現(xiàn)了SVD,那也就實(shí)現(xiàn)了PCA了,而且更好的地方是,有了SVD,我們就可以得到兩個(gè)方向的PCA,如果我們對(duì)A’A進(jìn)行特征值的分解,只能得到一個(gè)方向的PCA。

 

四、奇異值與潛在語(yǔ)義索引LSI:

     潛在語(yǔ)義索引(Latent Semantic Indexing)與PCA不太一樣,至少不是實(shí)現(xiàn)了SVD就可以直接用的,不過(guò)LSI也是一個(gè)嚴(yán)重依賴(lài)于SVD的算法,之前吳軍老師在矩陣計(jì)算與文本處理中的分類(lèi)問(wèn)題中談到:

    “三個(gè)矩陣有非常清楚的物理含義。第一個(gè)矩陣X中的每一行表示意思相關(guān)的一類(lèi)詞,其中的每個(gè)非零元素表示這類(lèi)詞中每個(gè)詞的重要性(或者說(shuō)相關(guān)性),數(shù)值越大越相關(guān)。最后一個(gè)矩陣Y中的每一列表示同一主題一類(lèi)文章,其中每個(gè)元素表示這類(lèi)文章中每篇文章的相關(guān)性。中間的矩陣則表示類(lèi)詞和文章雷之間的相關(guān)性。因此,我們只要對(duì)關(guān)聯(lián)矩陣A進(jìn)行一次奇異值分解,w 我們就可以同時(shí)完成了近義詞分類(lèi)和文章的分類(lèi)。(同時(shí)得到每類(lèi)文章和每類(lèi)詞的相關(guān)性)。”

     上面這段話(huà)可能不太容易理解,不過(guò)這就是LSI的精髓內(nèi)容,我下面舉一個(gè)例子來(lái)說(shuō)明一下,下面的例子來(lái)自L(fǎng)SA tutorial,具體的網(wǎng)址我將在最后的引用中給出:

image      這就是一個(gè)矩陣,不過(guò)不太一樣的是,這里的一行表示一個(gè)詞在哪些title中出現(xiàn)了(一行就是之前說(shuō)的一維feature),一列表示一個(gè)title中有哪些詞,(這個(gè)矩陣其實(shí)是我們之前說(shuō)的那種一行是一個(gè)sample的形式的一種轉(zhuǎn)置,這個(gè)會(huì)使得我們的左右奇異向量的意義產(chǎn)生變化,但是不會(huì)影響我們計(jì)算的過(guò)程)。比如說(shuō)T1這個(gè)title中就有g(shù)uide、investing、market、stock四個(gè)詞,各出現(xiàn)了一次,我們將這個(gè)矩陣進(jìn)行SVD,得到下面的矩陣:

image      左奇異向量表示詞的一些特性,右奇異向量表示文檔的一些特性,中間的奇異值矩陣表示左奇異向量的一行與右奇異向量的一列的重要程序,數(shù)字越大越重要。

      繼續(xù)看這個(gè)矩陣還可以發(fā)現(xiàn)一些有意思的東西,首先,左奇異向量的第一列表示每一個(gè)詞的出現(xiàn)頻繁程度,雖然不是線(xiàn)性的,但是可以認(rèn)為是一個(gè)大概的描述,比如book是0.15對(duì)應(yīng)文檔中出現(xiàn)的2次,investing是0.74對(duì)應(yīng)了文檔中出現(xiàn)了9次,rich是0.36對(duì)應(yīng)文檔中出現(xiàn)了3次;

      其次,右奇異向量中一的第一行表示每一篇文檔中的出現(xiàn)詞的個(gè)數(shù)的近似,比如說(shuō),T6是0.49,出現(xiàn)了5個(gè)詞,T2是0.22,出現(xiàn)了2個(gè)詞。

      然后我們反過(guò)頭來(lái)看,我們可以將左奇異向量和右奇異向量都取后2維(之前是3維的矩陣),投影到一個(gè)平面上,可以得到:

image     在圖上,每一個(gè)紅色的點(diǎn),都表示一個(gè)詞,每一個(gè)藍(lán)色的點(diǎn),都表示一篇文檔,這樣我們可以對(duì)這些詞和文檔進(jìn)行聚類(lèi),比如說(shuō)stock 和 market可以放在一類(lèi),因?yàn)樗麄兝鲜浅霈F(xiàn)在一起,real和estate可以放在一類(lèi),dads,guide這種詞就看起來(lái)有點(diǎn)孤立了,我們就不對(duì)他們進(jìn)行合并了。按這樣聚類(lèi)出現(xiàn)的效果,可以提取文檔集合中的近義詞,這樣當(dāng)用戶(hù)檢索文檔的時(shí)候,是用語(yǔ)義級(jí)別(近義詞集合)去檢索了,而不是之前的詞的級(jí)別。這樣一減少我們的檢索、存儲(chǔ)量,因?yàn)檫@樣壓縮的文檔集合和PCA是異曲同工的,二可以提高我們的用戶(hù)體驗(yàn),用戶(hù)輸入一個(gè)詞,我們可以在這個(gè)詞的近義詞的集合中去找,這是傳統(tǒng)的索引無(wú)法做到的。

     不知道按這樣描述,再看看吳軍老師的文章,是不是對(duì)SVD更清楚了?:-D

參考資料:

1)A Tutorial on Principal Component Analysis, Jonathon Shlens 
     這是我關(guān)于用SVD去做PCA的主要參考資料 
2)http://www.ams.org/samplings/feature-column/fcarc-svd 
     關(guān)于svd的一篇概念好文,我開(kāi)頭的幾個(gè)圖就是從這兒截取的 
3)http://www.puffinwarellc.com/index.php/news-and-articles/articles/30-singular-value-decomposition-tutorial.html 
     另一篇關(guān)于svd的入門(mén)好文 
4)http://www.puffinwarellc.com/index.php/news-and-articles/articles/33-latent-semantic-analysis-tutorial.html 
     svd與LSI的好文,我后面LSI中例子就是來(lái)自此 
5)http://www.miislita.com/information-retrieval-tutorial/svd-lsi-tutorial-1-understanding.html 
     另一篇svd與LSI的文章,也還是不錯(cuò),深一點(diǎn),也比較長(zhǎng) 
6)Singular Value Decomposition and Principal Component Analysis, Rasmus Elsborg Madsen, Lars Kai Hansen and Ole Winther, 2004 
     跟1)里面的文章比較類(lèi)似

原文鏈接:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/1939687.html

責(zé)任編輯:彭凡 來(lái)源: 博客園
相關(guān)推薦

2014-07-04 10:05:57

機(jī)器學(xué)習(xí)

2017-04-11 12:05:07

機(jī)器學(xué)習(xí)python矩陣運(yùn)算

2020-10-13 14:38:50

機(jī)器學(xué)習(xí)數(shù)據(jù)

2017-09-11 09:20:14

機(jī)器學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)聚類(lèi)

2020-05-13 15:10:04

矩陣乘法深度學(xué)習(xí)人工智能-

2014-07-01 09:30:54

機(jī)器學(xué)習(xí)

2018-08-05 06:48:34

2024-10-23 09:05:07

PixijsMatrixTransform

2024-06-05 11:36:28

2014-06-19 14:14:35

機(jī)器學(xué)習(xí)

2014-07-09 09:29:34

機(jī)器學(xué)習(xí)

2019-11-15 13:52:06

機(jī)器學(xué)習(xí)Shapley計(jì)算

2024-08-23 09:06:35

機(jī)器學(xué)習(xí)混淆矩陣預(yù)測(cè)

2022-03-02 09:11:09

機(jī)器學(xué)習(xí)網(wǎng)絡(luò)

2019-06-06 08:52:00

2021-11-30 22:51:36

機(jī)器學(xué)習(xí)大數(shù)據(jù)技術(shù)

2014-06-30 10:58:02

機(jī)器學(xué)習(xí)

2017-02-08 09:25:16

Spark分解推薦

2020-06-27 08:41:31

機(jī)器學(xué)習(xí)數(shù)學(xué)算法

2020-06-30 09:06:05

機(jī)器學(xué)習(xí)數(shù)學(xué)深度學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

婷婷国产在线| 日韩欧美中文字幕一区二区| 亚洲欧洲二区| 一区二区成人在线| 精品一区二区三区日本| 中文在线最新版天堂| 欧美96在线丨欧| 亚洲网址你懂得| 亚洲精品无码久久久久久久| 小草在线视频免费播放| 最新欧美精品一区二区三区| 国产欧美精品一区二区三区| 一级特黄aaa大片在线观看| 亚洲黄网站黄| 色播久久人人爽人人爽人人片视av| 无码人妻久久一区二区三区蜜桃 | 欧美亚洲国产另类| jizzjizzjizz国产| 欧美成人午夜77777| 9191精品国产综合久久久久久 | 免费在线观看黄色小视频| 精品自拍偷拍| 91精品国产综合久久久久| 国产日产欧美视频| 国内小视频在线看| 亚洲欧洲精品一区二区三区| 欧美日韩高清免费| 亚洲精品国产精品国| 久久精品国产99国产精品| 97精品伊人久久久大香线蕉| 波多野结衣爱爱视频| 激情五月综合| 亚洲精品一区在线观看香蕉| 久久久男人的天堂| 国产一区二区三区| 欧美日韩在线播放| 国产成人无码av在线播放dvd| 国内小视频在线看| 一区二区免费在线播放| 不卡中文字幕在线| 婷婷免费在线视频| 中文字幕精品一区二区精品绿巨人 | 欧美老妇交乱视频| xxxx日本少妇| 亚洲美女视频| 精品国产自在精品国产浪潮| 国产三级在线观看完整版| 亚洲伊人春色| 国产丝袜精品视频| 中文字幕影片免费在线观看| 久久1电影院| 精品国产麻豆免费人成网站| 台湾佬美性中文| 欧洲精品99毛片免费高清观看| 欧美伦理视频网站| 五月婷婷丁香色| 精品69视频一区二区三区| 欧美吞精做爰啪啪高潮| 日本人视频jizz页码69| 成人精品国产| 欧美日韩第一区日日骚| 亚洲精品手机在线观看| 激情亚洲小说| 日韩午夜精品电影| 国产一精品一aⅴ一免费| 99国产精品久久一区二区三区| 精品久久久久一区| 美女黄色一级视频| 亚洲区小说区| 在线观看国产精品91| 永久免费观看片现看| 91精品亚洲| 欧美国产第二页| 五月婷婷激情网| 日韩精品亚洲一区二区三区免费| 国产精品露脸av在线| 国产精品一区二区人人爽 | 亚洲午夜久久久久久久久| 黑色丝袜福利片av久久| 日韩精品极品视频| 公肉吊粗大爽色翁浪妇视频| 99精品视频在线| 欧美裸体男粗大视频在线观看| 久久久久97国产| 亚洲综合二区| 国产在线观看精品| 高清毛片aaaaaaaaa片| 91影院在线观看| 亚洲高清在线观看一区| 神马午夜伦理不卡| 色天天综合久久久久综合片| 久久久久久久久久久久久久久国产| 日韩亚洲精品在线观看| 日韩精品小视频| 91久久久久久久久久久久久久 | 精品一卡二卡三卡| 91精品福利观看| 日韩福利视频在线观看| 免费黄色激情视频| 亚洲精品视频啊美女在线直播| 国产z一区二区三区| 国产极品久久久| 久久久亚洲午夜电影| 91视频成人免费| 网友自拍亚洲| 亚洲国产精品va在线| 国产精品综合激情| 国产精品久久久亚洲一区| 国产日韩中文字幕| 午夜影院在线视频| 亚洲免费在线看| 亚洲成人av免费看| 精品久久ai电影| 久久精品亚洲精品| 黄色av网站免费观看| 成人亚洲精品久久久久软件| 亚洲午夜精品福利| 成人免费影院| 亚洲国产欧美一区| a在线视频播放观看免费观看| 久久综合狠狠| 韩国成人动漫在线观看| 午夜伦理大片视频在线观看| 欧美三级中文字幕| 国产jk精品白丝av在线观看| 精品不卡视频| 超碰97人人在线| 四虎久久免费| 91电影在线观看| 内射中出日韩无国产剧情| 国产精品豆花视频| 亚洲一区免费网站| 美女国产在线| 欧美日韩国产美女| www.黄色在线| 爽好久久久欧美精品| 精品欧美日韩| av在线播放资源| 精品裸体舞一区二区三区| 免费看一级大片| 久久精品久久精品| 亚洲午夜精品一区二区| 国产69精品久久| 一区二区三欧美| 69av视频在线观看| 国产网站一区二区三区| 欧美xxxxx在线视频| 亚洲老女人视频免费| 91国产视频在线| 桃花色综合影院| 欧美日韩国产限制| 极品粉嫩小仙女高潮喷水久久| 亚洲激情综合| 久久精品中文字幕一区二区三区| 碰碰在线视频| 亚洲美女精品成人在线视频| 国产嫩bbwbbw高潮| 2023国产一二三区日本精品2022| 99999精品视频| 国产成人久久| 国产精品劲爆视频| 免费高清在线观看| 日韩视频免费观看高清完整版 | 欧美午夜在线一二页| 日本一级免费视频| 久久精品99国产精品| 裸体裸乳免费看| 欧洲大片精品免费永久看nba| 欧美激情三级免费| 深夜视频在线免费| 在线观看www91| 成人三级视频在线观看| 国产高清精品久久久久| 青青草视频在线免费播放| 天天躁日日躁成人字幕aⅴ| 日本成人黄色片| 最新av网站在线观看| 91精品午夜视频| 四虎永久在线精品| 国产色综合久久| 亚洲综合在线一区二区| 99国产精品| 亚洲精品一区国产精品| 亚洲欧美日本国产| 欧美一区二区色| 日本暖暖在线视频| 精品国产乱码久久久久久夜甘婷婷 | 右手影院亚洲欧美| 美女在线视频一区| 欧妇女乱妇女乱视频| 免费一区二区三区视频导航| 成人情趣片在线观看免费| 色老头在线观看| 夜夜嗨av色综合久久久综合网| 国产伦子伦对白视频| 精品成人乱色一区二区| 日本成人免费在线观看 | 欧美大波大乳巨大乳| 国产精品自拍网站| 亚洲国产精品毛片av不卡在线| 亚洲老妇激情| 欧洲精品国产| 91久久精品无嫩草影院| 日本精品久久久久影院| 草莓福利社区在线| 亚洲香蕉成视频在线观看| 午夜久久久久久久久久| 欧美特级限制片免费在线观看| 日本少妇高清视频| 日本一二三不卡| 午夜男人的天堂| 韩国毛片一区二区三区| 免费裸体美女网站| 激情欧美一区| 中文字幕av久久| 精品国产一区二区三区小蝌蚪| 99国内精品久久久久久久软件| 黄色成人在线视频| 国产91|九色| 丁香花在线高清完整版视频| 日韩少妇与小伙激情| 欧美69xxxxx| 亚洲精品99久久久久| 国产福利资源在线| 欧美日韩免费不卡视频一区二区三区| 天堂中文在线网| 亚洲一卡二卡三卡四卡| 中文字幕av久久爽av| 国产精品视频线看| 无码人妻丰满熟妇啪啪欧美| 99久久婷婷国产综合精品电影| 手机看片国产精品| 精品一区二区国语对白| 亚洲污视频在线观看| 久久久久久一区二区| 青青草国产精品视频| 影音先锋亚洲一区| 女人帮男人橹视频播放| 欧美日韩亚洲国产精品| 激情图片qvod| 欧美在线亚洲| 日本一二三区视频在线| 欧美aⅴ99久久黑人专区| 可以免费看的黄色网址| 久久人体视频| 中文字幕中文字幕99| 91视频一区| aaa免费在线观看| 天天做天天爱天天综合网2021| 亚洲精品一区二| 首页国产精品| 国产又黄又爽免费视频| 亚洲欧洲美洲一区二区三区| 久久最新免费视频| 欧美91精品| 草草视频在线免费观看| 亚洲一区二区免费看| 狠狠爱免费视频| 日韩精品乱码免费| 熟妇人妻无乱码中文字幕真矢织江| 三级欧美韩日大片在线看| 天堂社区在线视频| 免费在线观看成人| 久久出品必属精品| 国产.精品.日韩.另类.中文.在线.播放| 一二三区视频在线观看| 91美女片黄在线观看91美女| 妺妺窝人体色WWW精品| 国产精品毛片高清在线完整版| 婷婷伊人五月天| 亚洲一区二区三区四区在线免费观看| 日韩男人的天堂| 欧美优质美女网站| 国产孕妇孕交大片孕| 精品福利一区二区三区| 久草视频在线看| 久久精视频免费在线久久完整在线看| 人妖欧美1区| 国产91精品久久久久| 国产精品麻豆成人av电影艾秋| 91丨九色丨国产| 欧洲vs亚洲vs国产| 亚洲巨乳在线观看| 国产精品jizz在线观看美国| 欧美性大战久久久久xxx| 美女视频黄免费的久久| 久久黄色一级视频| 久久久久久久性| 欧美人妻一区二区| 色菇凉天天综合网| 国产男男gay体育生网站| 日韩av网站大全| 里番在线观看网站| 91国语精品自产拍在线观看性色 | 日本色综合中文字幕| 人妻换人妻仑乱| 国产午夜精品久久久久久免费视| 婷婷久久综合网| 色综合 综合色| 国内毛片毛片毛片毛片| 亚洲品质视频自拍网| 免费在线中文字幕| 国产美女久久久| 噜噜噜天天躁狠狠躁夜夜精品| 一区二区三区精品国产| 99在线|亚洲一区二区| 在线播放免费视频| 久久久噜噜噜久噜久久综合| 精品无码m3u8在线观看| 欧美日韩不卡在线| 青青操视频在线| 欧美激情综合色| www.久久99| 日韩欧美一区二区三区久久婷婷| 亚洲激情婷婷| 精产国品一区二区三区| 国产精品黄色在线观看| 日日夜夜狠狠操| 亚洲国产精品电影在线观看| 宅男网站在线免费观看| 国产日韩欧美视频| 久久最新网址| 青青草原av在线播放| av成人动漫在线观看| 国产亚洲自拍av| 欧美一区二区视频观看视频| 91露出在线| 国产精品久久久久久久天堂| 亚洲国产国产| 日韩欧美视频网站| 成人丝袜视频网| 欧美日韩免费做爰视频| 欧美四级电影网| 成人高清免费观看mv| 国产91九色视频| 国产成人精品999在线观看| 日本黄色三级大片| 久久久久久亚洲综合影院红桃| 亚洲黄色免费观看| 亚洲精品720p| 中文在线免费二区三区| 久久精品综合一区| 亚洲一区二区三区高清| 538国产视频| 偷拍一区二区三区| 手机在线不卡av| 欧美诱惑福利视频| 国精一区二区| 五月婷婷深爱五月| 国产精品欧美久久久久一区二区| 中文字幕av片| 久久精品视频99| 在线日韩成人| 成熟丰满熟妇高潮xxxxx视频| wwwwxxxxx欧美| 成人免费视频国产免费| 最新国产精品拍自在线播放 | 视频一区视频二区在线观看| xxx在线播放| 欧美亚洲高清一区二区三区不卡| 北岛玲日韩精品一区二区三区| 国产日韩综合一区二区性色av| 亚洲精品久久久| 欧美xxxxx少妇| 色哟哟欧美精品| 日本中文字幕在线看| 97欧洲一区二区精品免费| 欧美日韩在线大尺度| 亚洲成人日韩在线| 欧美主播一区二区三区美女| 久cao在线| 国产精品日韩一区二区免费视频| 日韩一区二区免费看| 天天躁日日躁aaaxxⅹ| 欧美日韩高清影院| gogo高清在线播放免费| 免费在线国产精品| 精品一区二区三区在线观看国产| 好吊色视频在线观看| 日韩av有码在线| 欧美成人家庭影院| 免费特级黄色片| 国产亚洲欧洲997久久综合| 国产一区二区三区视频免费观看| 久久久视频精品| 成人在线视频免费观看| 亚洲性图第一页| 91黄视频在线观看| 91国内在线| 欧洲一区二区在线观看| 国产一区二区在线视频| 久久久久久久久久久影院| 久久久999精品| 亚洲另类春色校园小说| 激情图片中文字幕| 欧美体内谢she精2性欧美| 成a人片在线观看| 欧美大香线蕉线伊人久久国产精品| 久久99精品久久久久| 久久精品一二区|