for 循環(huán)為何可恨？

作者：佚名 2012-05-07 09:16:17

Java的閉包(Closure)特征最近成為了一個(gè)熱門話題。一些精英正在起草一份議案，要在Java將來的版本中加入閉包特征。然而，提議中的閉包語法以及語言上的這種擴(kuò)充受到了眾多Java程序員的猛烈抨擊。

不久前，出版過數(shù)十本編程書籍的大作家Elliotte Rusty Harold發(fā)表了對(duì)Java中閉包的價(jià)值的質(zhì)疑。尤其是他問道“ for 循環(huán)為何可恨？”：

我不知道，有些人這么著急的要把 for 循環(huán)消滅掉，他們反對(duì)的究竟是什么？這已經(jīng)不是第一次或第二次計(jì)算機(jī)學(xué)界的理論家們起來反對(duì) for 循環(huán)(或類似的東西)了。

如果只說Elliotte質(zhì)疑不起眼的閉包的價(jià)值，這是不公平的。他主要抱怨是，在讀了另一位著名人物、獲得過Jolt 大獎(jiǎng)并創(chuàng)造過最高銷售記錄的《Better, Faster, Lighter Java》的作者Bruce Tate的最近的關(guān)于此主題的專題后，他看不出閉包在Java中有什么價(jià)值。(Bruce用Ruby做的例證)：

表 1. 最簡單的閉包

3.times {puts "Inside the times method."}  
 
結(jié)果：  
Inside the times method.  
Inside the times method.  
Inside the times method.

times是3這個(gè)對(duì)象上的一個(gè)方法。它把閉包中的代碼執(zhí)行了3次。{puts "Inside the times method."}是閉包。它是一個(gè)匿名函數(shù)，把它傳入times方法，打印出靜態(tài)句子。相比起傳統(tǒng)的for循環(huán)語句，這樣的代碼顯得更緊湊，更簡單，如表2中所示：

表 2: 非閉包的循環(huán)

for i in 1..3 
puts "Inside the times method." 
end

由于這種毫無生氣的對(duì)閉包的介紹，我也很難看出它的真正價(jià)值。這首個(gè)比較，充其量也就能體現(xiàn)出一種微妙的差別。Bruce在developerWorks上的文章里的其它的例子也大多是價(jià)值不大的，要么含糊不清，要么缺乏啟發(fā)意義。

對(duì)于這種Ruby風(fēng)格的閉包給Elliotte帶來的困惑，我不打算進(jìn)一步評(píng)論；對(duì)這種問題過于挑剔毫無意義。我也不想討論目前的關(guān)于Java中的閉包的語法的提議的爭論，包括Java中是否應(yīng)該有閉包這樣的大問題。在這樣的爭論中我沒有立場(chǎng)，說實(shí)話，我是不在乎這些問題如何或何時(shí)被解決。

雖然如此，Elliotte卻提出了一個(gè)重要的問題：for 循環(huán)為什么可恨？

下面是一個(gè)常見的例子：

double sum = 0;  
for (int i = 0; i < array.length; i++) {  
sum += array[i];  
}

這有什么問題？我編了很多年的程序，我對(duì)這種語法一眼掃過去很舒服；很顯然，它是把一個(gè)數(shù)組里的值加到一起。但當(dāng)去真正的閱讀這段代碼時(shí)，這四行代碼里大概散布著30多個(gè)標(biāo)記符號(hào)需要我去分析處理。不錯(cuò)，有些字符可以通過語法簡寫方式來縮減。但為了這樣一個(gè)簡單的加法，你需要寫出一堆東西，還要保證寫的正確。

憑什么這樣說？下面是Elliotte的文章里另外一個(gè)例子，原文拷貝：

String s = "";  
for (int i = 0; i < args.length; i++) {  
s += array[i];  
}

看見了里面的錯(cuò)誤嗎？如果這代碼編譯通過，并通過的代碼審查，你可能需要數(shù)周才會(huì)發(fā)現(xiàn)這樣的bug，再數(shù)周才能制作出補(bǔ)丁。這些只是簡單的for循環(huán)。想象一下，當(dāng)for循環(huán)體變得越來越大，甚至有嵌套時(shí)，事情會(huì)變得多么的復(fù)雜。(如果你仍舊不擔(dān)心這樣的bug，認(rèn)為這只是拼寫錯(cuò)誤，那么你就想想有多少次在for循環(huán)里你是這樣的。)

如果你能夠把一個(gè)簡單的for循環(huán)寫成一行，帶有更少的重復(fù)和更少的字符，這樣不僅更容易閱讀，也更容易書寫。因?yàn)檫@樣更簡潔，引入bug的機(jī)會(huì)就更少，當(dāng)bug出現(xiàn)時(shí)，也更容易被發(fā)現(xiàn)。

那閉包對(duì)此有何幫助？下面是第一個(gè)例子，用Haskell語言寫成的：

total = sum array

哈哈，我是在說謊。sum函數(shù)并沒有使用閉包。它是按照fold的方式定義的，而fold是接受閉包的：

total = foldl (+) 0 array

下面是第二個(gè)例子，很常見，而且使用了閉包：

s = concat array  
s = foldr (++) [] array

我承認(rèn)，使用這些叫做foldl 和 foldr 樣子古怪的函數(shù)來解釋閉包的作用，這對(duì)那些更熟悉for循環(huán)的程序員來說沒有多大意義。但是，這幾個(gè)函數(shù)卻能突出for循環(huán)的關(guān)鍵弊端：它把三種獨(dú)立不同的操作合并到一起了——過濾，歸納和轉(zhuǎn)換。

上面的這兩種for循環(huán)，它們的目標(biāo)是接收一個(gè)數(shù)值列表，把它們歸納成一個(gè)值。函數(shù)式編程的程序員稱這些操作為“folds(合并)”。一個(gè)fold運(yùn)算的過程是，首先要有一個(gè)操作(一個(gè)閉包)和一個(gè)種子值，還有使用list里的第一個(gè)元素。這個(gè)操作被施加到種子值和list里的第一個(gè)元素上，產(chǎn)生出一個(gè)新的種子值。fold運(yùn)算然后把這個(gè)操作運(yùn)用到新種子值和list里的下一個(gè)元素上，一直這樣，直到最后一個(gè)值，最后一次操作的結(jié)果成為fold運(yùn)算的結(jié)果。

下面是一個(gè)演示：

s = foldl (+) 0 [1, 2, 3]  
= foldl (+) (0 + 1) [2, 3]  
= foldl (+) 1 [2, 3]  
= foldl (+) (1 + 2) [3]  
= foldl (+) 3 [3]  
= foldl (+) (3 + 3) []  
= foldl (+) 6 []  
= 6

Haskell語言里提供了很多fold函數(shù)；foldl函數(shù)從list的第一位開始運(yùn)算，依次反復(fù)到最后一個(gè)，而foldr函數(shù)，它從list的最后一個(gè)函數(shù)開始運(yùn)算，從后往前。還有很多其它相似的函數(shù)，但這兩個(gè)是最基本的。

當(dāng)然，folds是一些非常基本的運(yùn)算，如果拋棄for循環(huán)而以各種形式的foldl 和 foldr 咒符來替換，你會(huì)很困惑。事實(shí)上，更高級(jí)的操作，例如sum, prod 和 concat都是以各種folds定義的。當(dāng)你的代碼以這種高級(jí)的歸納操作運(yùn)算來編寫時(shí)，代碼會(huì)變得更簡潔，更易讀，更易寫，更易懂。

當(dāng)然，并不是所有的for循環(huán)都是歸納操作。看看下面這個(gè)：

for (int i = 0; i < array.length; i++) {  
array[i] *= 2;  
}

這是一個(gè)轉(zhuǎn)換操作，函數(shù)式編程的程序員稱之為map操作：

new_array = map (*2) array

map函數(shù)的工作方式是，它會(huì)檢查list里的每個(gè)元素，將一個(gè)函數(shù)應(yīng)用到每個(gè)元素上，形成一個(gè)新的list，里面是新的元素。（有些語言里的這種操作是原位替換）。這是一個(gè)很容易理解的操作。sort函數(shù)的功能相似，它接受一個(gè)list，返回(或修改)一個(gè)list。

第三種類型的for循環(huán)是過濾。下面是個(gè)例子。

int tmp[] = new int[nums.length];  
int j = 0;  
for (int i = 0; i < nums.length; i++) {  
if ((nums[i] % 2) == 1) {  
tmp[j] = nums[i];  
j++;  
}  
}

這是一個(gè)非常簡單的操作，但使用了for循環(huán)和兩個(gè)獨(dú)立的計(jì)數(shù)器后，毫無必要的復(fù)雜表現(xiàn)把事實(shí)真相完全掩蓋了。如果過濾是一種基本的操作，它應(yīng)該像一個(gè)fold或一個(gè)map那樣，而事實(shí)上，它是的：

odds = filter (\i => (i `mod` 2) == 1) nums  
odds = filter isOdd nums -- 更常用的形式

從核心上講，這就是為什么for循環(huán)有問題：它把(至少)三種獨(dú)立的操作合并到了一起，但重點(diǎn)卻關(guān)注了一個(gè)次要細(xì)節(jié)問題：遍歷一系列的值。而事實(shí)上，fold，map 和 filter是處理一個(gè)數(shù)據(jù)list的三種不同的操作，它們應(yīng)該被分別處理。采用把閉包傳入循環(huán)內(nèi)的方式，我們能更容易的把what 從 how 中分離出來。每次遍歷一個(gè)list時(shí)我都會(huì)使用一個(gè)匿名函數(shù)，或復(fù)用通用的函數(shù)(例如 isOdd, (+) 或 sqrt)。

雖然閉包并不是一個(gè)很深?yuàn)W的概念，但當(dāng)它深深的烙進(jìn)了一種語言和它的標(biāo)準(zhǔn)庫中時(shí)，我們不需要使用這些低級(jí)的操作搞的代碼混亂不堪。相反，我們可以創(chuàng)建更高級(jí)的運(yùn)算，做我們想要的事，比如sum and prod。

更重要的，以這些概念思考問題會(huì)使我們更容易思考更復(fù)雜的操作，比如變換一個(gè)tree，過濾一個(gè)vector，或把一個(gè)list合并成一個(gè)hash。

在最后，Elliotte還提到了一些關(guān)于在多核處理器上并行執(zhí)行的問題，說像3.times {...}這樣的代碼會(huì)比 for 循環(huán)效率“差”。不幸的是，我想他沒說到點(diǎn)上。不錯(cuò)，有一些運(yùn)算需要序列化，有一些可以并行。但是如果你只基于一個(gè)for循環(huán)，很難判斷出哪些歸為哪類，這是一個(gè)復(fù)雜的編譯器優(yōu)化問題。如果你把一個(gè)可能進(jìn)行并行運(yùn)算的操作(例如map 和 filter)分解成連續(xù)的運(yùn)算(例如foldl 和 foldr)，編譯器更容易從中做出判斷。不僅如此，如果你比編譯器更了解你的數(shù)據(jù)，你可以顯式的要求一個(gè)map操作被順序執(zhí)行或并行執(zhí)行。

英文原文鏈接：

本文轉(zhuǎn)自：http://www.aqee.net/whats-wrong-with-the-for-loop/

【編輯推薦】