ChatGPT 帶來的 LUI 比 AIGC 大得多
如果認為 ChatGPT 所代表的潮流是 AIGC 的一部分,將是對這個浪潮的巨大誤解。
ChatGPT 作為一款產品,展示了一個大語言模型(LLM)可能的應用場景,其中 AI 生成文本(AI Generated Text)的能力,尤其令人印象深刻。因為這一擠強心針,大家把對這個能力的熱情,泛化到了 AI 生成圖像,視頻,音樂等各種內容,并且籠統的起了個大詞兒的名字,叫做 AIGC。這里面不僅僅包含了 ChatGPT 這樣的產品,也包括了 MidJourney 這樣優秀的圖像生成,以及 Stable Diffusion系列工具。至于視頻,音樂等反而沒有這么流行,但也都被包了進來。
按照一般邏輯,如果 AIGC 的范疇比 ChatGPT 更大,那么 AIGC 是不是ChatGPT 所代表的那些大家說不清道不明的能力的超集呢?
我的答案是否定的。
ChatGPT 這一種 LLM,不是打開了 AIGC 的大門,而是打開了自然語言用戶界面(LUI, Language User Interface)的大門。LUI 是一個比 AIGC 大不知道幾個數量級的世界。和 LUI 的大海相比,AIGC 就是一個小池塘。
人類和機器的接口,是相對穩定的,幾十年才變一次的東西。而每次變化帶來的改變都是深遠的。就拿近代我們和電器的接口為例來看一下:
最早是 BUI(Button User Interface)。不用查了,這個詞是我杜撰的,就是用按鈕,旋鈕,開關等做接口。但這個接口表達能力太弱了,根本無法表達循環,分支等。
然后就進入了 TUI(Text User Interface),就是命令行輸入命令,計算機執行。Unix,DOS就是這一代。
在后面是 GUI (Graphic User Interface)。這一誕生于施樂公司,應用于蘋果的 Macintosh,發揚于微軟的 Windows 的方式,一下子統治了從 80 年代到現在的從電腦到手機到平板的所有用戶界面。
而其中瀏覽器作為 GIUI (Graphic Internet User Interface),更是給互聯網插上了翅膀,直接就引爆了一個時代。
而大語言模型出來了,人們終于可以不用 GUI 了,而直接是用自然語言和機器交互了。那么以前大家為什么喜歡用 GUI ,而不直接用語言呢?因為技術達不到呀。前一段語音識別的準確率才剛剛過關,至于理解語意,甚至可以完美的回答,還遠遠達不到這個能力。
現在 ChatGPT 以及百花爭鳴的大模型出現了,這將在我們和計算機已經很方便的圖形界面的基礎上,進一步降低使用門檻。在已經很簡單的事情上再進一步簡單一點可以幫助的人群,遠遠大于一個復雜的東西降低很大的門檻(波音737的操作難度降低三個數量級大多數人還是不會開)。這一條改變,會和人類社會的每一件事情,每一次人機交互有關,會改變所有的行業,所有的人的生活。
對比 AIGC,雖然也有很多令人興奮的進展,但是在這個技術發展史中,這是一個局部的進展。應用的也僅僅在內容生產這個領域,是一個局部的領域。它的發展,還需要更長時間的摸索。大語言模型的路徑是否可以應用圖像,視頻,聲音等領域還未知,下一個重大的突破在哪里還不明朗。所以,我認為 AIGC 概念大于實質,和 LLM 以及 LUI 不可同日而語。


























