for 循環(huán)為何可恨?
Java的閉包(Closure)特征最近成為了一個(gè)熱門話題。一些精英正在起草一份議案,要在Java將來的版本中加入閉包特征。然而,提議中的閉包語法以及語言上的這種擴(kuò)充受到了眾多Java程序員的猛烈抨擊。
不久前,出版過數(shù)十本編程書籍的大作家Elliotte Rusty Harold發(fā)表了對(duì)Java中閉包的價(jià)值的質(zhì)疑。尤其是他問道“ for 循環(huán)為何可恨?”:
| 我不知道,有些人這么著急的要把 for 循環(huán)消滅掉,他們反對(duì)的究竟是什么?這已經(jīng)不是第一次或第二次計(jì)算機(jī)學(xué)界的理論家們起來反對(duì) for 循環(huán)(或類似的東西)了。 |
如果只說Elliotte質(zhì)疑不起眼的閉包的價(jià)值,這是不公平的。他主要抱怨是,在讀了另一位著名人物、獲得過Jolt 大獎(jiǎng)并創(chuàng)造過最高銷售記錄的《Better, Faster, Lighter Java》的作者Bruce Tate的最近的關(guān)于此主題的專題后,他看不出閉包在Java中有什么價(jià)值。(Bruce用Ruby做的例證):
表 1. 最簡單的閉包
- 3.times {puts "Inside the times method."}
- 結(jié)果:
- Inside the times method.
- Inside the times method.
- Inside the times method.
times是3這個(gè)對(duì)象上的一個(gè)方法。它把閉包中的代碼執(zhí)行了3次。{puts "Inside the times method."}是閉包。它是一個(gè)匿名函數(shù),把它傳入times方法,打印出靜態(tài)句子。相比起傳統(tǒng)的for循環(huán)語句,這樣的代碼顯得更緊湊,更簡單,如表2中所示:
表 2: 非閉包的循環(huán)
- for i in 1..3
- puts "Inside the times method."
- end
由于這種毫無生氣的對(duì)閉包的介紹,我也很難看出它的真正價(jià)值。這首個(gè)比較,充其量也就能體現(xiàn)出一種微妙的差別。Bruce在developerWorks上的文章里的其它的例子也大多是價(jià)值不大的,要么含糊不清,要么缺乏啟發(fā)意義。
對(duì)于這種Ruby風(fēng)格的閉包給Elliotte帶來的困惑,我不打算進(jìn)一步評(píng)論;對(duì)這種問題過于挑剔毫無意義。我也不想討論目前的關(guān)于Java中的閉包的語法的提議的爭論,包括Java中是否應(yīng)該有閉包這樣的大問題。在這樣的爭論中我沒有立場(chǎng),說實(shí)話,我是不在乎這些問題如何或何時(shí)被解決。
雖然如此,Elliotte卻提出了一個(gè)重要的問題:for 循環(huán)為什么可恨?
下面是一個(gè)常見的例子:
- double sum = 0;
- for (int i = 0; i < array.length; i++) {
- sum += array[i];
- }
這有什么問題?我編了很多年的程序,我對(duì)這種語法一眼掃過去很舒服;很顯然,它是把一個(gè)數(shù)組里的值加到一起。但當(dāng)去真正的閱讀這段代碼時(shí),這四行代碼里大概散布著30多個(gè)標(biāo)記符號(hào)需要我去分析處理。不錯(cuò),有些字符可以通過語法簡寫方式來縮減。但為了這樣一個(gè)簡單的加法,你需要寫出一堆東西,還要保證寫的正確。
憑什么這樣說?下面是Elliotte的文章里另外一個(gè)例子,原文拷貝:
- String s = "";
- for (int i = 0; i < args.length; i++) {
- s += array[i];
- }
看見了里面的錯(cuò)誤嗎?如果這代碼編譯通過,并通過的代碼審查,你可能需要數(shù)周才會(huì)發(fā)現(xiàn)這樣的bug,再數(shù)周才能制作出補(bǔ)丁。這些只是簡單的for循環(huán)。想象一下,當(dāng)for循環(huán)體變得越來越大,甚至有嵌套時(shí),事情會(huì)變得多么的復(fù)雜。(如果你仍舊不擔(dān)心這樣的bug,認(rèn)為這只是拼寫錯(cuò)誤,那么你就想想有多少次在for循環(huán)里你是這樣的。)
如果你能夠把一個(gè)簡單的for循環(huán)寫成一行,帶有更少的重復(fù)和更少的字符,這樣不僅更容易閱讀,也更容易書寫。因?yàn)檫@樣更簡潔,引入bug的機(jī)會(huì)就更少,當(dāng)bug出現(xiàn)時(shí),也更容易被發(fā)現(xiàn)。
那閉包對(duì)此有何幫助?下面是第一個(gè)例子,用Haskell語言寫成的:
- total = sum array
哈哈,我是在說謊。sum函數(shù)并沒有使用閉包。它是按照fold的方式定義的,而fold是接受閉包的:
- total = foldl (+) 0 array
下面是第二個(gè)例子,很常見,而且使用了閉包:
- s = concat array
- s = foldr (++) [] array
我承認(rèn),使用這些叫做foldl 和 foldr 樣子古怪的函數(shù)來解釋閉包的作用,這對(duì)那些更熟悉for循環(huán)的程序員來說沒有多大意義。但是,這幾個(gè)函數(shù)卻能突出for循環(huán)的關(guān)鍵弊端:它把三種獨(dú)立不同的操作合并到一起了——過濾,歸納和轉(zhuǎn)換。
上面的這兩種for循環(huán),它們的目標(biāo)是接收一個(gè)數(shù)值列表,把它們歸納成一個(gè)值。函數(shù)式編程的程序員稱這些操作為“folds(合并)”。一個(gè)fold運(yùn)算的過程是,首先要有一個(gè)操作(一個(gè)閉包)和一個(gè)種子值,還有使用list里的第一個(gè)元素。這個(gè)操作被施加到種子值和list里的第一個(gè)元素上,產(chǎn)生出一個(gè)新的種子值。fold運(yùn)算然后把這個(gè)操作運(yùn)用到新種子值和list里的下一個(gè)元素上,一直這樣,直到最后一個(gè)值,最后一次操作的結(jié)果成為fold運(yùn)算的結(jié)果。
下面是一個(gè)演示:
- s = foldl (+) 0 [1, 2, 3]
- = foldl (+) (0 + 1) [2, 3]
- = foldl (+) 1 [2, 3]
- = foldl (+) (1 + 2) [3]
- = foldl (+) 3 [3]
- = foldl (+) (3 + 3) []
- = foldl (+) 6 []
- = 6
Haskell語言里提供了很多fold函數(shù);foldl函數(shù)從list的第一位開始運(yùn)算,依次反復(fù)到最后一個(gè),而foldr函數(shù),它從list的最后一個(gè)函數(shù)開始運(yùn)算,從后往前。還有很多其它相似的函數(shù),但這兩個(gè)是最基本的。
當(dāng)然,folds是一些非常基本的運(yùn)算,如果拋棄for循環(huán)而以各種形式的foldl 和 foldr 咒符來替換,你會(huì)很困惑。事實(shí)上,更高級(jí)的操作,例如sum, prod 和 concat都是以各種folds定義的。當(dāng)你的代碼以這種高級(jí)的歸納操作運(yùn)算來編寫時(shí),代碼會(huì)變得更簡潔,更易讀,更易寫,更易懂。
當(dāng)然,并不是所有的for循環(huán)都是歸納操作。看看下面這個(gè):
- for (int i = 0; i < array.length; i++) {
- array[i] *= 2;
- }
這是一個(gè)轉(zhuǎn)換操作,函數(shù)式編程的程序員稱之為map操作:
- new_array = map (*2) array
map函數(shù)的工作方式是,它會(huì)檢查list里的每個(gè)元素,將一個(gè)函數(shù)應(yīng)用到每個(gè)元素上,形成一個(gè)新的list,里面是新的元素。(有些語言里的這種操作是原位替換)。這是一個(gè)很容易理解的操作。sort函數(shù)的功能相似,它接受一個(gè)list,返回(或修改)一個(gè)list。
第三種類型的for循環(huán)是過濾。下面是個(gè)例子。
- int tmp[] = new int[nums.length];
- int j = 0;
- for (int i = 0; i < nums.length; i++) {
- if ((nums[i] % 2) == 1) {
- tmp[j] = nums[i];
- j++;
- }
- }
這是一個(gè)非常簡單的操作,但使用了for循環(huán)和兩個(gè)獨(dú)立的計(jì)數(shù)器后,毫無必要的復(fù)雜表現(xiàn)把事實(shí)真相完全掩蓋了。如果過濾是一種基本的操作,它應(yīng)該像一個(gè)fold或一個(gè)map那樣,而事實(shí)上,它是的:
- odds = filter (\i => (i `mod` 2) == 1) nums
- odds = filter isOdd nums -- 更常用的形式
從核心上講,這就是為什么for循環(huán)有問題:它把(至少)三種獨(dú)立的操作合并到了一起,但重點(diǎn)卻關(guān)注了一個(gè)次要細(xì)節(jié)問題:遍歷一系列的值。而事實(shí)上,fold,map 和 filter是處理一個(gè)數(shù)據(jù)list的三種不同的操作,它們應(yīng)該被分別處理。采用把閉包傳入循環(huán)內(nèi)的方式,我們能更容易的把what 從 how 中分離出來。每次遍歷一個(gè)list時(shí)我都會(huì)使用一個(gè)匿名函數(shù),或復(fù)用通用的函數(shù)(例如 isOdd, (+) 或 sqrt)。
雖然閉包并不是一個(gè)很深?yuàn)W的概念,但當(dāng)它深深的烙進(jìn)了一種語言和它的標(biāo)準(zhǔn)庫中時(shí),我們不需要使用這些低級(jí)的操作搞的代碼混亂不堪。相反,我們可以創(chuàng)建更高級(jí)的運(yùn)算,做我們想要的事,比如sum and prod。
更重要的,以這些概念思考問題會(huì)使我們更容易思考更復(fù)雜的操作,比如變換一個(gè)tree,過濾一個(gè)vector,或把一個(gè)list合并成一個(gè)hash。
在最后,Elliotte還提到了一些關(guān)于在多核處理器上并行執(zhí)行的問題,說像3.times {...}這樣的代碼會(huì)比 for 循環(huán)效率“差”。不幸的是,我想他沒說到點(diǎn)上。不錯(cuò),有一些運(yùn)算需要序列化,有一些可以并行。但是如果你只基于一個(gè)for循環(huán),很難判斷出哪些歸為哪類,這是一個(gè)復(fù)雜的編譯器優(yōu)化問題。如果你把一個(gè)可能進(jìn)行并行運(yùn)算的操作(例如map 和 filter)分解成連續(xù)的運(yùn)算(例如foldl 和 foldr),編譯器更容易從中做出判斷。不僅如此,如果你比編譯器更了解你的數(shù)據(jù),你可以顯式的要求一個(gè)map操作被順序執(zhí)行或并行執(zhí)行。
本文轉(zhuǎn)自:http://www.aqee.net/whats-wrong-with-the-for-loop/
【編輯推薦】


























