如何用Linux幫助你拼寫?
無論你是糾結(jié)一個(gè)難以理解的單詞,還是在將報(bào)告發(fā)給老板之前再檢查一遍,Linux 都可以幫助你解決拼寫問題。
Linux 為數(shù)據(jù)分析和自動化提供了各種工具,它也幫助我們解決了一個(gè)一直都在糾結(jié)的問題 —— 拼寫!無論在寫每周報(bào)告時(shí)努力拼出一個(gè)單詞,還是在提交商業(yè)計(jì)劃書之前想要借助計(jì)算機(jī)的“眼睛”來找出你的拼寫錯(cuò)誤。現(xiàn)在我們來看一下它是如何幫助你的。
look
look 是其中一款工具。如果你知道一個(gè)單詞的開頭,你就可以用這個(gè)命令來獲取以這些字母開頭的單詞列表。除非提供了替代詞源,否則 look 將使用 /usr/share/dict/words 中的內(nèi)容來為你標(biāo)識單詞。這個(gè)文件有數(shù)十萬個(gè)單詞,可以滿足我們?nèi)粘J褂玫拇蠖鄶?shù)英語單詞的需要,但是它可能不包含我們計(jì)算機(jī)領(lǐng)域中的一些人傾向于使用的更加生僻的單詞,如 zettabyte。
look 命令的語法非常簡單。輸入 look word ,它將遍歷單詞文件中的所有單詞并找到匹配項(xiàng)。
$ look amelioameliorableameliorablenessameliorantameliorateamelioratedamelioratesamelioratingameliorationameliorationsameliorativameliorativeameliorativelyamelioratoramelioratory
如果你遇到系統(tǒng)中單詞列表中未包含的單詞,將無法獲得任何輸出。
$ look zetta$
如果你沒有看到你所希望出現(xiàn)的單詞,也不要絕望。你可以在你的單詞文件中添加單詞,甚至引用一個(gè)完全不同的單詞列表,在網(wǎng)上找一個(gè)或者干脆自己創(chuàng)建一個(gè)。你甚至不必將添加的單詞放在按字母順序排列的正確位置;只需將其添加到文件的末尾即可。但是,你必須以 root 用戶身份執(zhí)行此操作。例如(要注意 >>!):
# echo “zettabyte” >> /usr/share/dict/words
當(dāng)使用不同的單詞列表時(shí),例如這個(gè)例子中的 “jargon” ,你只需要添加文件的名稱。如果不采用默認(rèn)文件時(shí),請使用完整路徑。
$ look nybble /usr/share/dict/jargonnybblenybbles
look 命令大小寫不敏感,因此你不必關(guān)心要查找的單詞是否應(yīng)該大寫。
$ look zetZETAZetazetazetacismZetanazetasZeteszeteticZetharZethusZetlandZetta
當(dāng)然,不是所有的單詞列表都是一樣的。一些 Linux 發(fā)行版在單詞文件中提供了多得多的內(nèi)容。你的文件中可能有十萬或者更多倍的單詞。
在我的一個(gè) Linux 系統(tǒng)中:
$ wc -l /usr/share/dict/words102402 /usr/share/dict/words
在另一個(gè)系統(tǒng)中:
$ wc -l /usr/share/dict/words479828 /usr/share/dict/words
請記住,look 命令只適用于通過單詞開頭查找,但如果你不想從單詞的開頭查找,還可以使用其他選項(xiàng)。
grep
我們深愛的 grep 命令像其他工具一樣可以從一個(gè)單詞文件中選出單詞。如果你正在找以某些字母開頭或結(jié)尾的單詞,使用 grep 命令是自然而然的事情。它可以通過單詞的開頭、結(jié)尾或中間部分來匹配單詞。系統(tǒng)中的單詞文件可以像使用 look 命令時(shí)在 grep 命令中輕松使用。不過***的缺點(diǎn)是你需要指定文件,這一點(diǎn)與 look 不盡相同。
在單詞的開頭前加上 ^:
$ grep ^terra /usr/share/dict/wordsterraceterrace'sterracedterracesterracingterrainterrain'sterrainsterrapinterrapin'sterrapinsterrariaterrariumterrarium'sterrariums
在單詞的結(jié)尾后加上 $:
$ grep bytes$ /usr/share/dict/wordsbytesgigabyteskilobytesmegabytesterabytes
使用 grep 時(shí),你需要考慮大小寫,不過 grep 命令也提供了一些選項(xiàng)。
$ grep ^[Zz]et /usr/share/dict/wordsZetazetazetacismZetanazetasZeteszeteticZetharZethusZetlandZettazettabyte
為單詞文件添加軟連接能使這種搜索方式更加便捷:
$ ln -s /usr/share/dict/words words$ grep ^[Zz]et wordsZetazetazetacismZetanazetasZeteszeteticZetharZethusZetlandZettazettabytye
aspell
aspell 命令提供了一種不同的方式。它提供了一種方法來檢查你提供給它的任何文件或文本的拼寫。你可以通過管道將文本傳遞給它,然后它會告訴你哪些單詞看起來有拼寫錯(cuò)誤。如果所有單詞都拼寫正確,則不會有任何輸出。
$ echo Did I mispell that? | aspell listmispell$ echo I can hardly wait to try out aspell | aspell listaspell$ echo Did I misspell anything? | aspell list$
list 參數(shù)告訴 aspell 為標(biāo)準(zhǔn)輸入單詞提供拼寫錯(cuò)誤的單詞列表。
你還可以使用 aspell 來定位和更正文本文件中的單詞。如果它發(fā)現(xiàn)一個(gè)拼寫錯(cuò)誤的單詞,它將為你提供一個(gè)相似(但拼寫正確的)單詞列表來替換這個(gè)單詞,你也可以將該單詞加入個(gè)人詞庫(~/.aspell.en.pws)并忽略拼寫錯(cuò)誤,或者完全中止進(jìn)程(使文件保持處理前的狀態(tài))。
$ aspell -c mytext
一旦 aspell 發(fā)現(xiàn)一個(gè)單詞出現(xiàn)了拼寫錯(cuò)誤,它將會為不正確的 “mispell” 提供一個(gè)選項(xiàng)列表:
1) mi spell 6) misplay2) mi-spell 7) spell3) misspell 8) misapply4) Ispell 9) Aspell5) misspells 0) dispeli) Ignore I) Ignore allr) Replace R) Replace alla) Add l) Add Lowerb) Abort x) Exit
請注意,備選單詞和拼寫是數(shù)字編號的,而其他選項(xiàng)是由字母選項(xiàng)表示的。你可以選擇備選拼寫中的一項(xiàng)或者自己輸入替換項(xiàng)。“Abort” 選項(xiàng)將使文件保持不變,即使你已經(jīng)為某些單詞選擇了替換。你選擇添加的單詞將被插入到本地單詞文件中(例如 ~/.aspell.en.pws)。
其他單詞列表
厭倦了英語? aspell 命令可以在其他語言中使用,只要你添加了相關(guān)語言的單詞列表。例如,在 Debian 系統(tǒng)中添加法語的詞庫,你可以這樣做:
$ sudo apt install aspell-fr
這個(gè)新的詞庫文件會被安裝為 /usr/share/dict/French。為了使用它,你只需要簡單地告訴 aspell 你想要使用替換的單詞列表:
$ aspell --lang=fr -c mytext
這種情況下,當(dāng) aspell 讀到單詞 “one” 時(shí),你可能會看到下面的情況:
1) once 6) orné2) onde 7) ne3) ondé 8) né4) onze 9) on5) orne 0) cônei) Ignore I) Ignore allr) Replace R) Replace alla) Add l) Add Lowerb) Abort x) Exit
你也可以從 GNU 官網(wǎng)獲取其他語言的詞庫。
總結(jié)
即使你是全國拼字比賽的冠軍,你可能偶爾也會需要一點(diǎn)拼寫方面的幫助,哪怕只是為了找出你手滑打錯(cuò)的單詞。aspell 工具,加上 look 和 grep 命令已經(jīng)準(zhǔn)備來助你一臂之力了。


























