长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

陸奇最新演講審定版:大模型帶來的新范式和新機會

澎湃新聞記者 邵文 方曉
2023-05-13 08:24
來源:澎湃新聞
? 未來2% >
字號

奇績創壇創始人兼CEO陸奇。

“在大模型技術高速發展的時代,一個重要的趨勢是:我們每一個人,除非你有獨特的見解、獨特的認知、獨特的問題解決能力,否則你能做的,大模型都可以做到。”奇績創壇創始人兼CEO陸奇認為,“人的腦力勞動將以形成非常獨到的見解和發展獨特的認知能力為主。這個時代的典型職業將是創業者、科學家和藝術家。”

5月7日,在奇績創壇舉辦的以《新范式 新時代 新機會》為主題的分享活動中,陸奇詳細分析了OpenAI的組織結構革新,本次范式變化的本質,及其帶來的新時代特征,最后系統性分析了我們該如何把握好這個時代帶來的機會。

陸奇和ChatGPT的開發機構OpenAI淵源深厚,他所創立的奇績創壇前身就是YC中國(美國著名創業孵化器Y Combinator的中國分支),而他當時加入Y Combinator就是受到時任YC掌門人的山姆·奧特曼(Sam Altman,OpenAI CEO)的力邀。陸奇先后任職于IBM、雅虎、微軟、百度,曾任微軟全球執行副總裁、百度集團總裁兼首席運營官。

經奇績創壇授權,澎湃科技(www.usamodel.cn)整理了陸奇在這個分享活動中的演講實錄,為方便閱讀,在不影響表達主旨的情況下做了刪減。

第一部分:新范式

當前,我們正面臨一場非常大的技術變革,這是一場范式的變革,它展現出了一個全新的范式。

每次范式變革都帶來更多的機遇和挑戰,因為它既要改變人們做事的方式,也要改變人們的思考方式。這一次,范式的變革影響更廣、更深、更全面。

從數字化產業發展維度看新范式

從產業發展的維度來分析,這一次范式的變更帶來了哪些影響?“三位一體”是我們分析這次范式變革所用的穩定的內在結構體系,它包括:1. 信息子系統(subsystem of information),體系必須從環境中獲得信息。2. 模型子系統(subsystem of model),用模型對信息進行表達。它必須充分有效地表達信息,這種表達方式讓它可以做推理、做分析、做規劃。3. 行動子系統(subsystem of action) ,根據推理和規劃與環境互動,來達到這個復雜體系的目的。

第一個拐點:信息變得無處不在

在信息子系統這條線上有大量的公司,包括IBM、微軟,1995年至1996年間出現了一個大的拐點。這個拐點之后,信息系統呈爆發式增長,誕生了許多偉大的企業,如谷歌、蘋果、亞馬遜等,世界因此而改變。為什么會有這個拐點?它背后的機制是什么?

信息系統的拐點,是信息的生產和獲取成本從邊際成本轉向固定成本。每次使用時的邊際成本越來越低,但是一次性投入越來越高,這是一個結構性的變化。

我在卡內基梅隆大學剛剛畢業時(1995、1996年左右),那個時候買一張地圖需要3美元,信息獲取成本曾經相當高。在今天,我要找一張地圖,網上搜索谷歌地圖不到300毫秒,谷歌花費的成本不到1美分,我可以免費獲得。而谷歌一年大約花了10億美元的固定成本才做到此。地圖是需要成本的,這個成本沒有消失,只不過有一系列的技術降低了獲取和分發地圖信息的成本,從每次都要付很多,變成(google地圖)一次性付很多。

谷歌使得地圖可以無處不在,其他大量的信息也無處不在,商業模式簡單,偉大的公司卻就此誕生了,以谷歌和蘋果為代表的移動互聯網時代和以亞馬遜為代表的云時代,都是一系列可以高度濃縮信息并分發信息的核心技術驅動的。

所以拐點出現的核心原因,是信息的獲取成本從邊際移向固定成本,使得信息變得無處不在。世界因此而變得扁平。

現在的拐點:模型將無處不在

現在我們看到2022年和2023年在模型子系統上,由OpenAI和微軟引領,以及其他創業公司共同參與創造的拐點。這個拐點的背后是“模型”的成本發生了類似的結構性變化,即模型成本從邊際成本發展為固定成本。這背后的原因是我們有一項新的基礎技術出現了,它叫大模型。

為什么模型的結構性成本這么重要?

因為模型就是知識。我們做任何一件事情都需要知識,知識的力量是無窮的,相比于信息時代,模型的產能更強大,發展的速度一定會比過去更快。

另一方面,模型與每個人都有關。從我們的社會互動和社會產業價值角度來講,我們每個人都由以下三組模型組合而成:1. 認知模型,我們能聽、能看、能說、能思考。2. 任務模型,我們每個人都能爬樓梯、剝番茄,做各種各樣的動作來完成任務。3. 領域模型,有些人是律師,有些人是醫生,有些人是科學家等等,我們人的社會價值都是這些模型體現出來的。

另外,人類社會中每一件事情都由模型來表達和驅動。例如,要運營一家公司需要一組模型,包括戰略、營銷、研發等等;城市管理,需要一組模型;國家治理,也需要一組模型;每個社會層面需要解決的問題,都是由相應的領域模型、任務模型和人組合完成的。

在大模型技術高速發展的時代,一個重要的趨勢是:我們每一個人,除非你有獨特的見解、獨特的認知、獨特的問題解決能力,否則你能做的,大模型都可以做到。

這一次的拐點,它攀升的速度一定會比1995年、1996年還要快。模型將無處不在,知識將無處不在。今天我們打開手機、打開任何一個設備,信息過來了;以后打開任何一個設備,是模型過來了。醫生診斷是模型,律師服務是模型,設計師是模型,藝術家是模型,方方面面它都無處不在。

同時,一系列偉大的公司會因此誕生,他們將付出固定成本,他們將發明新的商業模式,最后我們整個產業+變革,產生新的世界。

這個拐點的發展只是時間問題,而且這個發展的時間會非常非常快,比我們的想象還快。

下一個拐點:行動將無處不在

基于三位一體的結構,我們可以自然地回答下一個拐點是什么,毫無疑問,下個拐點是行動系統。

今天的大模型時代是個生成模型,它能有效地控制操作各種設備;下一個拐點將是機器人、自動駕駛和空間計算的組合為基礎。今天采取行動的成本很高,但借助大模型的互動,未來采取行動與環境互動以滿足人的需求的成本將會越來越低,行動將無處不在。

要引領下一個拐點,特斯拉目前處在非常優勢的地位,因為它在機器人技術、自動駕駛技術、人工智能技術方面的整體布局相當完整。其他公司會不會參與下一波,搶占下一個拐點?我們拭目以待。

未來的可能:數字化技術和人類社會一起共同進化

通過數字化三位一體的結構性分析判斷,我們可以看清今天的新范式,它的終局是數字化技術將達到三位一體,與人類社會共同進化,這一共同進化從長期看,將帶來真正的智能系統。

真正意義上的智能系統,必須具備四個核心環節:第一,它能夠涌現(應當具備自我組織和自我優化的能力,能夠在特定環境中自發地形成和調整結構,而非由某個中心控制器編程或設計)。第二,它有代理能力,能夠自主決策(它可以代表用戶或實體獨立地進行決策和執行任務,而不僅僅是簡單地響應外部指令)。第三,它功能可見,有 affordence(Affordence 是一種設計原則,強調讓用戶直觀地理解如何與產品或系統進行交互)。第四,它是具象的(既有形象、直觀的表現形式,便于用戶理解、感知和操作)

從技術驅動人類發展的維度看新范式

接著,我們看這次范式變更的第二個維度:它在人類以技術驅動社會發展的進程中扮演的多維度的重要角色。

科學范式進入第四(第五)范式

上圖左下角(科學的范式)表達的是人類無盡地追求知識、能力和財富的過程。這一過程有三大要素:

第一是科學。科學是解釋和預測現象。科學發展從第一范式經驗主義,到第二范式系統性地做實踐,再到第三范式大理論做模擬,第四范式數據驅動,第五范式數據加技術驅動。人類社會進步最根本的生產力是科學的進步,這次的技術變革直接驅動了新一代的科學發展范式。科學高速進入第四的數據驅動、第五的計算驅動即大模型驅動階段,這是這個新范式對人類發展結構里的第一個根本影響。

第二是技術。技術的本質是人基于科學開發的能力去改變自然現象,用信息轉化能源去滿足人的需求。

第三是經濟。人類的經濟發展體系是技術驅動的。技術驅動的社會經濟發展到目前為止,只有三種大的模式,這三種模式都是信息和能源的組合決定的:農業社會主要靠光合作用;工業社會靠化石能源加上機械設備、電氣設備,電子設備;數字化,用信息越來越有效地轉化能源。

數字化范式變更:加速數字化的能源轉化

圖中右下角指的是當代技術驅動人類發展的體系。我們現在所處的是第三代,是數字化時代這條藍色的曲線。

這張圖表達了兩層含義:一方面,數字化時代根本意義上是用數字化、可編程的能力更有效地轉化能源;

另一方面,數字化是人的延伸,數字化是人自我的認知和能力的延伸。

在這個時代,數字化是核心驅動力。這次數字化范式的變更,將直接驅動模型和行動體系,加速數字化轉化能源的能力。進而,我們可以更有效地去改造世界,滿足人的需求。

人類改造世界范式變更:探索進入更遠更深更廣闊

要改造世界,滿足人的需求,有幾個組成部分:1. 我們需要能源,要轉化能源,要新的可持續的能源,用技術來驅動;2. 轉化能源只有兩條通路:一種是用生命體系來轉化,另一種是用物理體系轉化;相應的,我們在高速發展新生命科學和新材料科學;3. 能源轉化必須要有物理空間,我們在高速發展新空間技術去去創造價值。

整合在一起,我們可以看到的人類在認識世界,改造世界,為我所用的路程,將直接和間接地被今天的新范式進一步驅動。

經濟發展范式變更:更多的企業成為科技公司

今天的經濟核心生產力,基本還是以設備、勞工、資本、大眾商品、原材料、能源等。未來技術將越來越多地成為直接生產力,越來越多的企業將成為科技企業。

什么是科技企業?舉一個例子,為什么特斯拉是大家公認的一家科技公司?科技公司與非科技公司的根本區別在于什么?

因為特斯拉用信息、用軟件、用人工智能,能源轉化效率越來越高,它每設計一個新的車子、每研發一個新的設置、每制造一個新的設備,效益都在越來越高。而老一代汽車企業它的核心生產力,還是以前的流水線、工人、設備等。本質上,它讓“信息更有效地轉化能源”,讓技術驅動創新成為直接的生產力。

新范式的社會影響

很多人說這一次的變革堪比工業革命,本質上是有道理的。我們不妨回顧下人類歷史的發展:

我們從農業社會開始,發明了技術:耕種、家畜等。這些技術給人帶來了一個重要價值,人可以定居,有家,有固定的發展環境。

工業革命對人的影響是巨大的,一方面解放了土地,另一方面釋放出了人的大量體力勞動。

信息時代讓人可以無處不在地獲得信息,進一步減少人類的腦力和體力勞動。經濟發展也從產品經濟變成服務經濟,這個時代的典型職業是碼農、設計師、分析師等。

這一次大模型時代的變革,也將形成新的社會關系。工業時代給了我們很多能力,封裝成鋼材、汽車、火車、設備,我們要用體力做的東西基本上都被替代了。而這次,我們有一系列的模型,它們也可以封裝成各種形式,各種各樣的設備,我們腦力要做的事情都可以讓它們來輔助,替代和提高。人的腦力勞動將以形成非常獨到的見解和發展獨特的認知能力為主。這個時代的典型職業將是創業者、科學家和藝術家。

我在YC研究院和OpenAI做了一個項目UBI(通用基本收入:Universal Basic Income) ,它研究的問題就是:當人們不需要為了謀生工作的時候,人們的驅動力和行為將會發生怎樣的變化。

我們可以想象的是,全新的價值體系將被建立。由于數字化的能力以及Web3.0的存在,在未來的時代里,信息觸手可及、人們自由移動、經濟基礎改變,由此產生一個問題:人類會不會回到新一代的游牧時代?

新范式的締造者

范式帶來的挑戰和機會,就是適應新的思考方法和新的實踐體系。我們如何去更好地把控這個機會?

這一次新范式的到來,不是水到渠成的,它是一個突變。

要了解OpenAI的歷史,必須要了解Sam。我跟Sam是在2005年在哈佛大學舉辦的YC成立儀式上認識的,他是YC體系思路的繼承者和傳播者。2014年他接管了YC,成為YC的掌門人。

2016年他聯合創建OpenAI,他和他的團隊核心人員代表了新一代特殊的組合能力,代表著可以推動這個范式進一步往前發展的思考體系和執行體系。

OpenAI的思考體系

他們的思考體系,有幾個重要的特征:第一,堅信未來,堅信通用智能一定會到來,任何人都擋不住Sam,他建立打造OpenAI的一切都不會讓任何人干預控制;OpenAI用最快速度實現AGI(通用人工智能)。第二,在技術上,他們相信兩個重要的點:一是模型只要足夠深,用無監督學習,用數據加上算力,用一個高效的訓練體系,就能無止境地探索通用智能;二是強化學習或者增強學習,這跟進化在本質上相關,是模型能為人所用的核心。

他們堅信這兩點。早期做了大量強化學習方面的探索,等到他們強化學習已經有一定基礎之后,就立馬把所有精力和資源聚焦在無監督學習上。

OpenAI的執行體系

新的能力:在團隊能力上,他們堅信新一代的組織既要做前沿科研,又要做基礎工程研發,還要開發平臺和產品及商業化。OpenAI 所代表的是全新的組織、全新的能力,他們所做的一切是要既能做科研、又能寫代碼、又能做產品,這些能力是分不開的。

新的組織:有一個重要關鍵要素是它需要融到大量的資本,長期要回歸社會,而且在實體結構上實現任何投資者都不能影響你追求的目標。

OpenAI不是一家公司,也不是合伙制,它是一種嶄新的新型組織。從長期來看,OpenAI的盈利結束之后,它所產生的一切都是社會公有的,它的頂層階段是一個Nonprofit(非盈利)。這是經過深思熟慮之后,非常有勇氣堅持著一步步追求他們走的路徑,才能造成迄今7年后的突破。

Open AI的技術發展路徑

GPT-1是重要的第一步,預訓練大模型,核心是通過自然語言處理和解決問題。自然語言處理通常包含多個任務,傳統做法是每個任務去訓練一個模型。OpenAI不這樣做,他們預訓練一個大的模型,但是預訓練的結果要和單獨做模型一樣好,甚至更好。GPT-1就做這個,做一次預訓練,就能達到在多個自然語言任務上使用的目標,GPT-1的效果比單獨針對具體任務訓練的模型還要好。

GPT-2是遷移,在預訓練之后做微調,可以把預訓練中學到的東西,通過微調遷移到新的下游任務模型中。GPT-3是非常核心的一步,實現很強的泛化能力。在少樣本和0樣本情況下,GPT-3展現出強大的泛化能力,尤其是通過場景下學習(In-context-learning)和給定提示解決問題,無需微調。

Dalle-E,啟動圖像模態。

Codex,為編程語言微調,引入模型重要的邏輯能力和長期用AI來開發AI的路徑。

GPT-3.5實現了根本性突破,引入了指令微調。人可以去寫指令,開啟了能讓模型全方位對齊的開發能力;它先用了代碼的指令Codex,而真正在產品上突破的是對話指令,就是讓它去學會人是怎么對話的,進而誕生了ChatGPT。這是人類歷史上從來沒有發生過的成就:短短兩個月內達到一億活躍用戶,用的人還越來越多,有很多愿意付費,這在歷史上前所未有。

GPT-4實現了完整的工程研發體系。

GPT-4之后,如ChatGPT、plugin(插件)等將全面建立產業生態。

從OpenAI的發展中我們可以看到:一個團隊如果是在運用新的范式下的核心思考和實現體系,他們創新的能力將有多大?因此,在這個時代,深度解讀OpenAI的成長歷史,了解他們的思考實踐體系,對我們來說是有很大的意義的。

新范式的動力引擎

GPT模型體系,驅動新范式的動力引擎

在這個范式的背后,有組核心技術,一個動力引擎在驅動著這個范式的進展,它在本質上就是GPT模型體系。

GPT是個模型系統,這個大模型像一個黑洞一樣,把所有的模型都吸進這個引擎里面去了。

第一,它能夠高效壓縮表達所有的人類關于世界的知識,尤其是文字或者其他模態,比如圖片、視頻。

第二,它能持續提高泛化能力(涌現,子概念空間等)。它能涌現。涌現是什么?在相同的模型架構下,通過增加參數、Token或者延長訓練時間,模型解決任務的能力會不斷演進。例如,常識推理能力、算術能力以及針對特定任務的解決能力都會逐漸顯現。在GPT模型不斷提升規模的過程中,涌現現象持續發生,關于涌現的科研論文目前也非常活躍。

模型的泛化能力至關重要:少樣本泛化和零樣本泛化(如從一個例子中推斷其他情況,甚至在沒有看過的情況下也能明白其中原理)。僅僅在概念層面進行泛化是不夠的。GPT的泛化能力主要體現在潛在概念(latent concept)和子概念(subconcept)這個層面,并且其泛化能力在不斷增強。

第三,它的推理能力不斷地增強和被探索出來。人類基本上擁有六、七種主要的推理能力,包括演繹、知識歸納、常識等。在GPT大模型中,這些推理能力會不斷地通過諸如思維鏈(Chain of Thought)這樣的提示展現出來。

第四,它更有效更可延伸地對齊(自然語言,價值等)。GPT模型已經幫助我們將世界上的大量信息(知識)進行了壓縮,而我們使用它的過程就是實現對齊。GPT模型在對齊任務方面取得了顯著的成果。其突破性表現和增強學習方法在對齊方面表現突出,如自然語言理解和價值觀的對齊。

潛空間對齊:首先,對齊任務需要與人類潛空間保持一致。通過圖表、編程語言或自然語言使用大模型,都是實現對齊的手段。潛空間對齊本質上涉及到大量的權重調整。

價值觀對齊:此外,為了善用大模型,還需要在價值觀方面達到對齊,確保使用它不會對社會造成負面影響。目前,GPT尚未達到主流社會可接受的價值觀水平,因此OpenAI需要進行大量的價值觀對齊工作。

第五,它能足夠并持續地充分利用更多有效算力。尤其是Transformer,實際上它的模型架構并不是最理想的。雖然能利用算力,但效率并不是特別高。模型過于密集,對算力和通信帶寬的要求很高。盡管如此,至少今天主流的算力還是可以被充分利用起來,從而帶來更大規模的模型和更多的涌現。

第六,它能用好充足的token/模態和有效的token化。目前我們的模型基本上能夠充分且有效地利用人類知識所能觸及的主要模態,如語言、圖像、視頻等。這些模態都可以很好地被轉化為token,而經過token化后,它們可以高效地融入到大型模型中。

第七,它能有效地參數擴展:小型化,本地化。模型在不斷地高效擴展,包括參數增加、(模型)層次加深以及在進行推理時實現更好的平衡。模型可以實現小型化和本地化,通過各種架構優化,在數字設備端(如物聯網設備)上進行使用。

第八,它能有效地擴展任務領域和專業知識。模型具備系統性的擴展能力,可以與符號求解器、工具接口和專業知識相結合。這些集成在一起,使得模型具備足夠的驅動力。

將這些能力相互疊加,我們看到了一個具備堅實基礎、高操作性和強大擴展性的模型體系。它是這個時代背后的強大推動力,引領模型從邊際成本走向固定成本。

引擎發展當下的四個要點

第一,核心維度過了拐點,全方位攀升。它幾乎封裝了全世界所有的知識;它內嵌了足夠的學習能力和推理能力。本質上所代表的是一個今天的斯坦福高材生,幾乎什么學科都懂,什么考試都可以考到前5% 。而且它學習速度非常快,不會累,可以永遠不斷地思考,有大量的算力可以用。它還是自然語言界面,每個人都能用,每個人都能夠得到價值。它的能力越來越強,能解決的任務越來越多。并且,它的成本在變得越來越低。

第二,自然語言(NL)是突破的關鍵。通向通用智能,OpenAI 走了一條反共識的道路。在OpenAI之外,特別是四—五年前,幾乎所有人都認為通用智能的發展路徑與動物智能相一致。動物智能向通用智能演變的過程先從視覺開始,通過視覺識別目標、學會推理,然后逐步形成符號,再發展為語言(先有口語,后有書面語言),最終形成像人類一樣的完整知識體系。然而,OpenAI采用了相反的做法,它不是從視覺開始,而是從語言出發,去構建通用模型能力。

在我看來,語言是一個特殊的潛在認知空間,是人類與物理世界之間最寬泛、最重要的橋梁。從根本上講,它更多是一種泛化和思考工具,而溝通只是副產品。沒有語言,我們無法實現零樣本泛化,而這種泛化能力正是最關鍵的。

在自然語言處理領域,我參與搜索引擎相關工作已有20多年,我認為歷史上一直存在一個誤區。傳統自然語言處理方法缺乏可行性,因為系統需要首先分析句子的各個成分,分析它是一個動詞、名詞或形容詞等,但問題關鍵在于,這個詞代表什么,是一部電影還是一個游樂場,這是需要以知識的理解和獲取為基礎的。因此,如果沒有全球范圍內的知識,從根本上無法處理語言。OpenAI采用了一種新方法。它利用GPT封裝了世界上絕大多數知識,以此為基礎,先構建一個知識引擎,再通過對話進行調試,從而實現自然語言處理。這與過去十幾年采用的方法截然相反。有了知識,它不僅能處理語言,還可以利用知識約束語言解釋的空間。這種變化在某種意義上是從知識開始理解語言,而非在理解語言后獲取知識。

自然語言處理現已突破了門檻,開辟了一種全新的人與數字世界的交互方式,為我們帶來了一種有效且適用于任何場景的交互工具。

第三,可見和可持續的技術發展。右上角是關于這個引擎如何持續地將范式向前推進。首先,在模型方面,需要解決模型的魯棒性、模型稀疏化,擴展注意力寬度,甚至形成注意力循環等。同時,需要更強的推理能力、更多的涌現、更強的潛在概念和子概念泛化,融合和統一符號運算與重疊向量堆疊體系,以及因果關系推理等。

其次,需進一步對齊,包括價值觀對齊和拓展更多潛在空間。同時,還需要研究更多模態,特別是跨模態的圖像和視頻。跨模態推理(從視覺模態學習推理,將其擴展到語言模態),語言模態中學到的泛化能力,無論是零樣本、多樣本還是少樣本,都可以擴展到圖像模態。

最后,覆蓋更多領域和應用,提高模型的擴展性和適應性,加強工程實踐。基礎算力、通信系統、設施工具等方面的研究也在快速推進。綜合起來,這個引擎的能力將越來越強大。

第四,發展飛輪雛形啟動。這個動力引擎的增長飛輪已經形成雛形。資本已經開始大量投入,商業模式盈利也已經具備初步的可行性,政府和產業界已經投入大量的算力,新的平臺、新的應用、新的商業模式開始大量出現,越來越多初創公司和大廠參與的生態開始形成。每個人的生產力都在提高,它的安全問題、社會認可度也都在被積極地解決。

新范式的演化路徑:進化體系新物種

大模型為人類技術發展開辟了新篇章,是技術世界中的全新物種。

技術的本質和內在規律:進化

著名作者、復雜學體系大師W.Brian Arthur寫過一本書叫《技術的本質》。書中主要的觀點,是技術發展具有進化性,它的進化與達爾文進化理論非常類似,同樣涉及結構、功能組合和選擇,會朝著更符合人類需求更多的方向發展。

從某種程度上來說,進化并不意味著越來越強,而是變得越來越適應。而技術的進化是向人類需求多的方向做選擇的。

大模型的進化方向:更好地滿足人類的發展需求

大模型的發展方向,呈現出類似達爾文進化論的進化特點,即滿足人類不斷變化的需求。

大模型有很多基礎模型,有不同的基礎模態,比如蛋白、核酸、空間等不同模態;在大模型的基礎之上,會演化出更多的模型,領域模型、工作模型、個人模型,它們都將會具有更強的記憶、推理等能力。

關注大模型時代,有兩種模型系統,是我思考比較多的:第一種是機器學習的模型(目前以系統1為主),今天大模型世界做推理的基礎,基本上以系統1為主。相當于人類思考方式中的快思考、直覺反應。可以解決生活中方方面面的問題。它是過程性的、可計算的,具有場景化的特點,當場景發生變化時,模型也會相應地調整,具有很強的可擴展性和易用性。優點是,它能夠在特定的場景中進行對齊和泛化,但可能在其他領域并不適用;

第二種是人類建立的模型(基本以系統2為主),人建立的模型,是基于人類專業知識建立的模型,相當于思考方式中的慢思考、邏輯推理,包括了像愛因斯坦理論和牛頓理論這樣的科學理論、符號、結構、知識圖譜和數學公式等。這類模型的優點是,在專業領域具有很強的泛化能力,因為它們是基于專業知識和理論構建的。然而,它與我們生活的方方面面聯系很少,無法直接解釋一些日常現象,例如樹葉的形狀、貓咪的顏色等。

我們真正的需求,是這兩種模型之間的組合。當遇到一些關鍵問題,需要通過系統化方法進行邏輯分析、推理和嚴謹論證;同時,我們也有大量需求,并不需要進行深入分析,只需要直觀快速反應。當大模型和人類建立的模型結合起來,就能更好地解決人們的需求和問題。我們看到的發展趨勢是,系統1和系統2已經有越來越多的整合,朝著更好的滿足人類需求的方向演進。

大模型的進化類比:進化樹和寒武紀

右上角這張圖,展示了可開源的大模型的進化樹。借助這個初步的進化樹,可以追溯到模型的源頭、觀察模型的能力,以及預測模型的未來發展。可以看到,進化已經發生,一代代的模型在演變。

模型的生態,在某種程度上與我們的生物體系非常相似,如果關注學術論文和GitHub,就會發現這個新物種剛剛誕生,幾乎每天都有新的演化出來的模型,大量新的子物種在不斷涌現。就像生物界的“寒武紀”時代:大量物種開始出現,開啟新的紀元。

第二部分:新時代

產業發展的擴散結構與體系

為了更深入地理解這次變革,我們將從以下三個層面,來解析產業發展的擴散結構與體系,并討論這些變化如何在地理、社會、經濟等層面上進行分布擴散。

擴散源頭:從傳統的獨立組織形態,轉變為融產學研為一體的高效生態

要實現從源頭、在前沿的擴散,需要同時具備以下三個條件:第一,具備自主前沿原創性科研的能力,通過科研解決核心算法的完全原創性的問題;第二,進行大量系統研發和工程開發,能迅速將科研成果以高質量代碼的形式實現;第三,具備開發技術平臺、研發產品、推進商業化的能力,以形成產業生態系統,進一步驅動上述第一個條件中所描述的科研。這三點,正是OpenAI為代表的新型組織所實現的。組織形態上,OpenAI同時涵蓋了以上3個領域,集產學研于一體。

還有一點不同的是,在過去的擴散過程中,政府一般都是后來才參與進來的,但這一次,政府很早就進來參與了。因為這個范式變更的特殊性,需要政府更早更有效的參與。

擴散范圍:北美中國為主,深入個人

從全球范圍來看,這次擴散以北美為主,中國緊隨其后。以前的技術創新擴散,都是在北美擴散到了一定成熟度之后,再復制到其他地域,這一次,中國在快速追趕的同時,也將經歷早期適合中國國情的擴散過程。與此同時,這次技術創新的影響范圍會深入到個人層面。

AI工具幫助單個創業者或小型團隊提高產能、創造價值。一些產品不再需要雇人,AI可以進行替代。像設計者、碼農、科學家、企業家、創業者,有許多都在用Copilot等工具提升個人產能。

而這次創新,帶來的是提升人類認知能力的工具。它會進一步拉開人與人之間的距離:那些聰明、勤奮、努力,并且學會用這個工具的人,將快速超過原來同一水平、但不使用這類工具的人。

擴散過程:不是創新技術的發展,而是技術驅動社會經濟的轉變

在前文中,我們提到有些變革可能并未涉及范式的改變,而只是與新技術的出現有關。描述新技術生命周期時,人們常用的經典理論是The Hype Cycle(技術成熟度曲線)。然而,在這次變革中,我們認為它是一次徹底的范式改變,影響著整個社會和經濟的長期發展,這種情況下,Carlota Perez(《技術革命與金融資本》作者)的Techno-Economic Paradigms(技術經濟范式)理論更為適用。

根據她的理論,若有一項技術,如冶金、高速公路、汽車等,能夠影響每個人和整個社會,它的發展將以80年為周期,分為四個階段:爆發階段、狂熱階段、協同階段和成熟階段。大模型時代目前還處于早期階段,經過高速增長之后,泡沫破裂將是必然現象。然而,在泡沫破裂之后,新的黎明將降臨。屆時,新一代更強大的企業將從破碎的泡沫中崛起,占據產業制高點,開創一個嶄新的時代。

OpenAI生態快速形成

這一次產業發展的格局跑在最前面的,起關鍵作用的是新一代的數字化產業,它的生態是由OpenAI來驅動的,呈現了兩個特點:生態結構迅速形成,且高速發展;生態結構類似過去的數字化平臺,包括前臺和后臺。

后臺是GPT-N 系列,目前為GPT-4,未來將有GPT-5、GPT-6等。它內部有大模型引擎,封裝了豐富的知識推理規劃能力,具有較強的開發和擴展性。OpenAI提供Foundry和PlayGround等,包含API(應用程序編程接口)和簡潔的收費模式。同時,許多第三方基于OpenAI后端開發服務和應用。

前臺是ChatGPT。ChatGPT提供完整的用戶體驗,適用于所有人,解決各類問題。這是人類歷史上首個真正實用的自然語言處理工具,具有足夠的靈活性和內置知識。

它的前臺具有生態擴展性,即“ChatGPT 插件 ”,OpenAI已經開發了多個插件,如Code、interpret等,具備成為未來“殺手級”應用的潛力。大量第三方將使用插件開發前端應用。

在OpenAI平臺之上,已經出現早期產業活躍發展,形成了一些初步的熱門領域。

開發堆棧雛形高速發展

歷史上的生態發展一直是“得開發者得天下”。開發者工具、界面、開發者生態,永遠是“兵家必爭之地”。毫無疑問,OpenAI、微軟都意識到了開發堆棧的重要性。幾乎每天都有大量新技術新服務,幾乎每周都要重要的開發框架和工具出現。

我們把這一頁分成兩大板塊:左邊是模型開發;右邊是應用開發。

模型開發分為幾個大模塊:關于大模型本身的開發,目前開發體系已初步成型,但通常以大模型團隊的自主研發為主;關于垂直和領域模型的開發;輕量的模型,體量小、算力要求低,適用于端側設備,如手機、智能音箱和未來的lOT設備上;開源模型開發,這對降低創新門檻,產業能健康發展有很重要意義。

應用開發也分幾個大的板塊:關于快速形成的“開發的工具和工具鏈”;關于開發對象,具體是開發的運行時和其他資源。

經濟發展格局

全面強勁的經濟發展驅動力

在此次經濟發展格局中,早期的上升速度將非常迅猛,發展動力也將格外強大,這與以往的情況截然不同。

那么,為什么它的攀升速度如此之快,發展力度如此之強呢?關鍵在于,這一次變革所觸及的生產力正是“知識”。作為生產要素中至關重要的部分,知識的潛能是無限的。

在大模型時代,知識這一生產力得到了系統性的改變:首先,新范式普遍降低了各類知識的成本。其次,新范式提升了知識的應用能力,尤其是在知識密集型行業,如醫療領域、科研領域等。醫生、護士等專業崗位都受到專業模型的幫助,不僅成本可以降低,相關產業的生產力還會極大地提升。再者,新范式縮短了產生知識的迭代周期。將這三個要素綜合考慮,新范式驅動的經濟發展將呈現前所未有的速度和力度。

對職業的結構性影響

它將影響人類的每一個職業,因為人類的每一個職業,本質上都是模型的組合。

可以預測的是,每一個職業的人,都會開始用“副駕駛員(Copilot)”,當副駕駛員能力越來越強,它會變成“正駕駛員(Autopilot)”,再接著,我們都將會有一個 “駕駛團隊 (Copilot team)”。無論我們到哪兒,都有各類“駕駛員”跟著我們走。

人們之間的合作,變成人與人之間、人們的“駕駛員”之間的協作。新的職業會出現,人們的工作崗位也會隨之發生變化。

更強大更活躍的數字化產業

在這次變革中,處于前沿的將是下一代數字化產業。數字化作為人類活動的延伸,新的商業價值創造必然從數字化產業開始。

我們將擁有全新的核心技術堆棧、新的平臺、新的基礎設施、新的算力體系、新的通訊體系以及新的產品開發體系。以大模型為核心,整個數字化產業將全面升級和刷新,迅速邁入下一個發展階段。新的領軍者和落伍者將很快浮現出來。

各個行業系統性的變遷

新的數字化產業,會讓每個行業都根據這個行業的特性做出結構性的調整和轉型。

假如你是一個公司的CEO,可以對比人工和模型的成本,用大模型技術做系統性的重構和調優,把成本降低,把產能提高。

值得注意的是,現在GPT是基礎設施,隨著它從邊際成本轉移到固定成本,可以從成本的變化,看看這個產業怎么變。

同時,有的行業供需在發生變化,比如軟件的需求,受到碼農供給的影響,如果關注大模型時代對碼農的產出提高多少倍,就可以借助它預測這個行業的結構性變革將從哪個方向發展,以及以什么樣的速度來發展。

對市場和社會的長期影響

它深刻地影響了人類社會最基本的生產力:人。

教育領域將經歷根本性的變革;人力資源的發展和配置也將改變并加速;作為人類首要驅動力的科研領域也將受到本質性的影響,因為它將引發科研的新范式;社會組織和信息傳播同樣會受到影響;政府與社會監管方式也將隨之改變。

政府的更多參與

政府的參與更早、更活躍、維度更多。從OpenAI的發展上,能看到政府極早地從多個維度參與了其中,如監管、安全、數據隱私、社會穩定等。究其原因,是因為這次變革,從根本性上影響了生產力和生產關系。在早期,尤其需要社會產業和政府做更多的互動,扶持和引導基礎設施進入全球性的發展。

新產業發展不斷加速(海外)

圖中展示了近5個月內我們關注到的新代碼、新技術、新論文、新產品和新投資,我們做了簡單的計算和統計,并將曲線繪制出來。

首先是論文數量,對于這次新產業的發展,關注論文是必要條件。同時,我們還需關注產品、資本投入和應用案例等方面。

新產業發展不斷加速(中國)

關于中國,我們現在的活躍度越來越高,我們在追趕,但是整體數量跟國外比還是有相當大的差距。

上圖標了紅色框的是一個重要的點,“奮起直追的團隊”,有商湯、王慧文、李開復、阿里、百度等等,匯總在一起,能反映出中國產業發展快速攀升、不斷加速的狀態。

中國發展機會

在大模型時代,有一個特殊的現象:真正能做大模型的,全球范圍內,只有兩個國家和地區具備這個產業核心的能力,北美和中國。

要實現這個目標,需要足夠大的人才、資本、技術和市場規模及密度,中國和美國是全球唯二的有機會的地方,長期機會非常大,但是今天,我們必須是奮起直追。

全球唯二,奮起直追

中國大模型追趕有三大環節:第一是打造基礎模型,是攀升至GPT-3.5。這里每個團隊需要自建一個模型開發體系,包括算力、語料、數據、評估等開源工具和系統;同時這個團隊還有打造基礎設施,尤其是將幾千張和幾萬張卡連在一起的網絡算力,如基于RDMA(直接訪問GPU內存)和RoCE(基于 InfiniBand 的網絡無法將數萬張卡連在一起);關鍵是能持續穩定的攀升GPT-3.5,我們認為誰先達到GPT-3.5,誰將能進入第一梯隊。

第二是要打造模型產業化的能力。攀升至GPT-3.5水平后,要開發產業化能力,這里主要是具備足夠的指令調優和對齊研發的能力。需要對代碼做指令調試,它是提高模型邏輯能力和團隊用 AI 來開發的關鍵;在對齊上,要基于RLHF (Reinforcement Learning from Human Feedback)正向學習,結合人類反饋與自然語言對話對齊,與人的價值觀對齊。有了這些,就具備了中國的ChatGPT的能力。

第三是平臺開發和生態建立。后臺打造API等相對來說比較直接;前臺需要開發推廣ChatGPT和plugin等;早期可以用簡單的商業模型搭建起來,這就足以成為未來的平臺和生態的制高點。總結一下,打造基礎模型、模型產業化能力和平臺及生態開發推廣能力,是早期中國攀升GPT-3.5的核心要素。

算力資源競賽

中國目前在追趕GPT3.5的團隊約有10個左右,算力將在未來贏家和產業發展格局的形成中起到關鍵作用。年底前看誰能到達3.5,能擁有或持續獲取算力是非常重要的。

我們所了解到的預估,是中國約有20萬張A100卡。今天國際頭部大模型團隊可能需要用1萬張H100(約10萬A100)。而目前的算力情況來看,國內未來能有這樣資源體量的團隊可能不超過2個。

產業發展,齊頭并進

第一,在追趕的過程當中,資本投入和創業公司將扮演一個重要的角色,目前已經有多個擁有足夠實力和資金儲備的團隊。早期挑戰很大,長期發展機會非常強。

第二,中國的大廠百度、阿里、騰訊等都投入了足夠的研發能力和開發資源,一起參與打造GPT,大廠在追趕期是有一定優勢的,比如資源等。

第三,中國在追趕的過程中有額外的挑戰,我們在算力方面有大量的工作要做,要補齊在算力上的限制,比如在算法和數據方面探索更多的潛力,在產業發展上,雖然算力是一個短期的挑戰,但是中長期的機會就是中國自己做算力了。在中國做這個產業發展有更多的兩個不確定性,一個不確定性是算力的不確定性,但長期是個機會;另外是軟件棧的不確定性,這也是中國自建的一個機會。

第四,中國的產業發展有越來越多國際化的機會,因為其他國家和地區是沒有能力獨立去自研的,比如東南亞、阿拉伯世界、非洲、南美,甚至于歐洲等,中國的大模型都有能力去觸達它。

最后,中國的應用生態在中期和長期的發展空間是相當寬廣的,早期已經有很多中國的創業公司和大廠開始在準備開發基于大模型的應用。在國際化層面,中國的創業者在早期也有去北美的機會,尤其是做相對來講敏感度不是很強的,比如企業應用客服等,這些中國的創業者都有更寬的機會,既可以在中國做,也可以在美國做,或者是在其他國家做。

全球化的創業機會

每個人都會有Copilot,每個人都會有Autopilot,每個人長期下來都會有副駕駛員的團隊,人類的組織形式也會因此發生相應變化。綜合在一起,每個職業的產能都將極大地提高。

OpenAI分析,19%的勞動力將會被GPT影響至少50%。高盛研究,全球范圍3億人的工作將被AI自動化,80%的美國勞動力會被GPT影響至少10%。

基于對一些創業公司使用大模型的初步調研,我們發現,其中超過77%的公司使用的是OpenAI的接口(其中GPT-4占21%,GPT-3.5占46%);基于開源模型自研和使用Stable Diffusion的公司,各占3%。

國家引導

由于大模型的技術和它產業發展的本質,需要規模大和時間周期長的投入和布局。在基礎設施層面,國家有機會起更大的作用,做出更多政策上面的引導。

尤其在一些特定領域,中國有彎道超車的機會,比如說在醫療、生命科學、數字城市這些賽道,用大模型來驅動創新,中國有獨特的優勢。

同時由于大模型對產業和社會的特殊影響,國家也會做出多個維度的監管治理。

社會影響

大模型對生產關系和社會關系有本質性的長期的影響。

首先對于教育而言,社會影響跟國外一樣大。教育非常重要,過去在全球競爭格局當中,中國的學生體量大,中國的碼農多,中國學科學的人多。但是有了大模型之后,這個局面被改變了,給我們帶來了全新挑戰。但是,挑戰的另一面就是機會。中國未來的教育怎么發展?值得思考。

另外是對科研的影響,尤其是產學研更有效的結構性組合,讓中國在科學發展基礎上有更多的加速創新機會。未來的科研格局里我們有新的機會,第四范式、第五范式是數據和計算驅動的,產學研在中國有重新組合的機會。

最后是關于文化和文明,這跟語言和文化的底蘊有關。大模型代表了每個國家的基本文明,這一次大模型為先的創新,有機會在這個方面更進一步地做適合中國傳統和文明的一個創新。

第三部分 新機會:系統性、全方位的如何探索和把控我們的機會

全方位探索把控:“人+事”的機會空間

我們提出的框架主要針對創業公司,但對于任何組織和企業而言,只要是在有組織的去追求某個目標,它在結構本質上和創業公司都是一樣的。因此,不僅是創業公司團隊,其他相關人員也可以將這個框架應用于自己所做的企業、自己做的事情,從中獲得有助于探索大模型時代的啟示。不管你是從事什么行業,都可以在這個框架當中得到相應的經驗收獲。

新時代對人的機會在哪里?對事務的機會又在哪里?

第一,強烈建議不要盲目追逐熱點,浮躁可能導致不利后果。尤其值得強調的是,這次追逐熱點的代價可能更高,因為它涉及范式轉變,需要改變思考方式和執行方式。如果盲目追逐熱點,可能會付出巨大代價,其中包括機會成本。

第二,要勤于學習。這次技術變革相對復雜,建議大家閱讀必要的論文。僅僅依賴別人的解讀可能無法深入理解,必須花時間去深入研究關鍵論文,克服慣性思維。有一本書叫《科學發展的范式》,值得大家一看。一般大的范式,過去沒法克服慣性思維,包括深度學習,因為這是不同的思考體系,所以一定要盡量克服慣性思維。

第三,一定要深度思考。務必認真思考這次技術變革對人和事務方面的影響,沒有人能夠避開這一挑戰。

第四,必須采取行動導向。一旦理清思路,要立即采取行動。這次技術變革不進則退,涉及結構性改變,需要及時調整。在人際關系方面,這次技術變革可能會拉大人與人之間的距離,所以一旦想明白,要果斷采取行動,不然你很快掉隊。本來你跟你后面的人、前面的人可能距離不大,但一不小心你可能被甩得很后面,或者你有機會遠遠超過今天和你跑在差不多一條線上的人。

“事”的機會空間

事情方面,基于這次范式變更的本質,對于創業公司和企業,基本上可以通過三個維度去探索機會:第一,在產品和業務層面去探索機會;第二,你所在的產業是不是有根本性的變革,在產業變革的過程當中去探索更大的機會,你可能面臨換個生意的選擇,在價值鏈上占一個不同的價值點;第三,你所在的產業的研發體系是不是徹底變革了。由于產業的研發體系會在有效環節發生大變化,大量的變化是找到全新的、由于研發體系變更而帶來的機會,有可能就得徹底換一個新的賽道,或者是在同一賽道里面用完全不同的方法去做產品。

我們給大家一個系統性的框架,我們從數字化基礎、數字化應用、改造世界,這三個機會版塊,進行完整的、系統性的機會探索體系。

數字化發展基礎

數字化發展基礎永遠是平臺驅動的,像移動互聯網/云、人工智能/邊緣計算、新興平臺等。

數字化的應用

我們將人群分為“消費者”、“創作者”、“企業”三個類別,把它分成一格一格的,代表人群時長的分割和人類的基本組織形成,用來系統、完整的探索數字化應用。

在這里,創作者人群是我們特別關注的,他們是站在前沿的:碼農、設計師、科學家等。

消費者的需求結果體系,可以借助馬斯洛的人類需求層次出發;企業的需求比較穩定,都是降本增效。

認識世界、改造世界

認識世界,包括認識自己是世界的一部分,要把知識數字化。

數字化有6種功能可見(Affordance):1. 信息(2D)。這個數字化的能力基本上觸達了每一個人類,我們每個人基本上都用電腦,用手機,觸達所有的人;2. 體驗(3D)。尤其是三維的體驗,元宇宙,目前只有少數的品類,游戲、社交等;3. 關系(抽象)。Web3.0是數字化的抽象關系,信任、激勵機制、所有權等,這個需要時間來逐步探索和發展;4. 物理外部環境。數字化驅動的物理環境交互,自動駕駛、機器人等;5. 生理內部感知。數字化人內在的腦機接口、內部測試機制,這個目前也是覆蓋少數類別,如康復等。6. 知識(模型)。數字化帶來的知識是嵌入的,可以用在所有場景之下。

這次我們創新的空間,基本上是用二維的信息,加上嵌入知識,去找所有可以應用的類別;有些品類可以用到其他的數字化能力,如機器人等,可以三位一體地滿足人的需求。系統性地探索我們的機會。以上是這個完整的框架。

數字化基礎的機會

穩定的數字化平臺結構

數字化平臺的特點是:前端是“完整可延伸”的體驗,有設備、容器、畫布等;后端是完整可延伸的能力,有計算、存儲、通訊。

值得關注的一個點是,目前為止任何一個萬億美元的公司都在前端做設備和操作系統,這是價值的控制點。

數字化的底層基礎設施是計算體系,是芯片,是基礎服務,是開源代碼等等。在今天大模型流行的時代,基礎設施領域存在大量的機會。某種意義上,從投資和創業者的角度來講,這是最容易賺錢的地方。就像在淘金時代,一批人去加州淘金,淘金人的很多會死掉,但是如果你賣勺子、賣鏟子、籃子的就不會,這是非常好的生意,因為沒有這些工具就沒法淘金。

進入大模型流行的時代,我們必須要有一系列新的算力、新的基礎設施。創業會有門檻,但是一定有機會。未來新一代的有效算力,都將基于GPT的系統架構,長期機會非常可觀。

基礎設施和工具

第一點,是算力,有效算力包括芯片、算力體系。

第二點,是新一代的算力體系和網絡架構。對未來機會來講,我們更多需要的是連在一起的帶寬和延時都很低的GPU。可能我們根本就不需要服務器這個概念,需要的是幾萬張卡連在一起的能力。

第三點,是大規模的訓練體系、微調體系、推理體系等跟大模型相關的基礎設施。

第四點,大模型時代需要一個全新的數據系統的數據堆棧,尤其是Embedding(嵌入),向量數據庫和基于向量數據庫的檢索系統。

第五條,開發工具鏈,有新的機會,尤其是開發框架和新開的新框架。

最后有大量的開源的模型體系,開源的工具,開源的數據集,創新的機會就在開源這里。

新平臺

在數字化基礎當中,更大的機會是平臺。

對于這個平臺,美國是OpenAI,有幾個創業公司,有谷歌、有微軟。中國有百度、阿里,百川智能是王小川的,光年之外是王慧文的,還有很多。大家可以設想一下,這些公司10年以后的體量有多大?

今天谷歌可以是1萬億美元的公司,這個將遠不止1萬億美元,成功的概率可能不一定高,也會一定艱難,但是只要你有能力,這就是非常值得探索的機會,因為這個平臺的體量實在太大了。

在新時代中,OpenAI的平臺基礎體系都已經搭建好了,前后臺系統已經準備好了,但它的關鍵應用(killer app)仍在發展中。目前,這個關鍵應用主要體現在前端的code interpret,就是一個數據分析師的功能。OpenAI自己想涉足的領域是教育和醫療,但它的平臺基礎和關鍵應用還在形成。

從平臺商業化的角度看,我們目前主要關注中國和美國市場。全球范圍內,只有這兩個地區有平臺公司。在美國,各平臺之間,是一場激烈的競爭。從投資和創業機會來看,創業空間很有限,基本上沒有了,市場主要被OpenAI、Anthropic等幾家小公司以及谷歌和微軟所占據。

新體驗端和新設備端

在大模型時代,硬件的體驗將不一樣。

有一個比較典型意義的公司叫Humane,是蘋果出來做硬件的的團隊,他們過去一直沒有找到好的產品。做的硬件是你戴在身上的,這個硬件能看到你所看到的一切、聽到你所聽到的一切,它不斷在幫你思考。

這個東西在很多場景比手機更管用。其他設備如頭盔和眼鏡等,也有機會。

第三代系統(自主/自動化大模型平臺機會)

第三代自動駕駛、機器人組合的機會也加速到來,需要新的硬件、新的算力、新的開發體系、新的模態,一定有用大模型來驅動下一個拐點的機會。

第三代系統,核心是指三位一體。大模型是生成模型,可以生成指令,控制設備和行動。這些模型是雙向的,它既感知認識、感知分析,又能夠進行控制。所以,因為大模型的本質,到了第三系統中,這個時代將被加速進入。

它的核心是行動體系,尤其是自主體系、自動駕駛體系、機器人體系和空間計算體系,這些體系將有機地交互,可以系統性地用越來越低的價格去采取行動,滿足人們的需求。

自動駕駛方面,有新的機會,為什么?

今天自動駕駛做了十幾年了,體系還是以視覺為主的,泛化能力還是不夠。我們人開車一點都不累,輕輕松松,聽聽音樂,講講話。我們為什么開車不累?因為我們有語言,我們能零樣本泛化。比如,我們在路上開車,看到前面有一個老人舉著一個旗子走過來,我們會知道還早,根本不用擔心,慢慢開過去繞過他就是了。但是今天的自動駕駛系統,遇到這個老人就會緊張的不得了,因為它從來沒有見過,它不知道該怎么辦,它沒有泛化能力。所以我們可以有全新機會,用新一代的語言模型帶來的泛化能力打通模態。當然用機器人、用大模型驅動新一代的機器人機會也一樣大,機器人和自動駕駛將是人類最大的兩個產業。

數字化應用的機會

這次技術的模型能力封裝了所有的知識。所以這次的技術覆蓋所有的需求,你要判斷的是這個模型是不是足夠強,模型在你這個領域的發展速度會不會很快。

首先我們必須做一個判斷,在大模型時代的早期模型能力,我們預測模型發展的速度,對我所在這個需求,它是否有比較務實的機會去有效地滿足用戶和客戶的需求?尤其是過去滿足不了的需求。也就是說,第一你要判斷是模型的能力,早期模型的發展速度和模型能力,對我所在這個產業能改變多少?

第二個判斷是,三位一體的體驗能夠建立起來的機會有多大。一開始,我們三位一體就是信息模型和行動體系組合在一起來滿足需求。在這里舉個例子,健身模式上可以用來做,比方說Peloton,它本來就是一個單車,我可以在上面給你信息,今天缺的就是模型,就是一個教練,是一個時刻提醒你告訴你怎么弄的。所以Peloton這樣就是三位一體,好的模型它內容已經有了。

第三個判斷是,大模型時代對你所在這個賽道,從開發生產的角度來講,能夠帶來全方位顛覆的機會有多大?比如你是做煉鋼的,那這次大模型給煉鋼這個產業帶來的研發體系變更不大。但如果,你是開發游戲的,那就全都變了,因為游戲任何環節它的開發都不一樣。

技術推動:大模型為先,形成閉環

所以,在“技術推動”這個方面,我們采用這個三角形,用高中低來判斷一下每個行業都要用這個技術推進的情況。

很多同學都在想:我這個領域能不能做?你一定要考慮你這個領域,你這個生意有沒有壁壘。這里有一個簡單的范式,你自己有數據,你可以自己開發模型,你可以用大模型來開發,你的模型被使用之后,使用的數據你拿得到,使用的數據回歸到閉環,你的既有數據越來越強。如果你有這樣一個結構,你這個生意肯定可以做。所以大模型為先,從數據到模型,到使用閉環,是這個時代落地的有效方式。

需求拉動:大模型為先,而非信息為先

需求拉動,要找到需求,對知識、對模型比較敏感的需求。同時,我們要強調一個概念:在這個時代,一定要做大模型為先的產品。

大模型為先:三位一體為王,自然語言為先

人類需求本質也是三位一體的,任何一件事情,我們既需要信息,又需要知識,又需要行動來滿足我們的需求。

比如說電商,今天都是用的信息,模型幾乎沒有。每一次看每一個領域,可以看這個領域里面的信息有多少,模型能有什么樣的模型,行動有什么樣的行動。大模型時代的產品,建議一定要做自然語言為先的產品。我們看到很多同學做產品,信息時代的慣性太大了,產品就是手機打開,看到圖片、視頻、文字,給出來的都是信息。這是過去的時代了。今天做產品,起步就需要是自然語言交互,去思考“你跟我怎么交互”?

有機會、行動導向,信息只是提供了一個基礎,三位一體是終局。如果創業賽道有機會三位一體,要大模型為先,搶先進去。

大模型基礎的閉環壁壘

考慮一個領域,生意有沒有壁壘,有一個簡單的范式:第一,你有自己的數據;第二,你可以自己開發模型,用大模型來開發模型;第三,你的模型被使用之后,使用的數據你能拿得到;第四,使用的數據,返回過來有個閉環,你的自有數據越來越強。

如果有這樣一個結構,這樣一個三位一體的體驗和閉環,大模型為先的時代里,落地是一定要做的。

改造世界

新能源科技

首先,核心是新能源技術的研發體系,大模型將帶來大量研發體系上的新機會,設計也好、生產也好,都可以用大模型來提升效益。

第二,新一代的能源運營、新一代的電網需要大量的數據、大量的模型的能力,把能源的供需平衡好、運營好。

第三,新一代核心技術,系統也好,部件也好,都可以切入大模型,直接植入大模型為先的技術。電池、觸電設備、風電控制體系這一系列的核心技術都可以切入大模型為先的技術,讓它做得更好。這里大廠已經有大量的機會在做了,對創業公司也打開了越來越多可以參與的創新機會。

新生命科技(生命科學)

第一,新的技術可以直接用到大量的生命科學體系當中。新的生命科學首先起步于今天深度學習的人工智能技術和相關的大模型技術,它本質上跟生命體系的計算過程在結構上是類似的。

第二,生命科學的產業結構越來越朝著今天的數字化工業的產業結構方向去走,在結構上會是非常類似的。有大量的計算和數據驅動直接生產、設計、制造,每個維度都可以用這個方法來做。

第三,大模型將對生命科學的基礎研發和核心創新起到根本性的作用,尤其是在核酸、蛋白這一層,在其他維度的生命科學的結構維度做大模型,將根本改變我們的研發環節。就是用大量的數據和算力,通過涌現更高效的加速科學探索和研發的方方面面,系統性地提高這個產業的進展和創新的速度,這是關于生命科學體系。

新材料科技(材料科學)

材料科學體系跟生命科學體系大模型時代和數字化它所產生的效應是一致的。在材料科學里面它更是產業驅動的,比如芯片所需要的材料,光伏、新能源需要的材料,這一切在產業發展上帶來的機會更直接、更優先,它是產業驅動的。

在結構上,大模型將系統性地切入數據驅動、計算驅動的材料設計、研發、制造等方方面面,比如材料基因、計算驅動的新的材料設計、材料工藝、材料生產等。

新空間科技

真正把空間用新的空間技術用好,是從地面開始,自動駕駛、深海、軌道、軌道之外、指數深空,新的衛星的、新的行星上,包括火星,這是長期有系統化的機會,大模型在每一個環節在探索。

在通訊、在遙感、在空間制造都可以直接驅動探索創新和商業價值的獲取,在這個當中既給國家和大學帶來非常多的創新的機會,同時也給有遠見、有抱負,愿意長期堅持的創業者一樣帶來非常多的機會。

尤其是像自動駕駛這樣一個巨大的產品,以大模型為先的方法,今天可以觸達的機會就很多,長期更快,這是目前面臨的商業化最大的發展,就是用技術、用大模型為領先的技術去探索更多的物理空間。

新執行環境

新的時代把事情的機會把控好,我們需要一個新的執行體系。

首先,馬太效應會非常明顯,對于已經擁有強大算力/數據/技術和財務資源的組織來講,他們會更具有優勢,同時,對于擁有大量高質量數據的人,也會獲得更多優勢,而且大模型在生成內容時可能存在偏見,少數人的聲音不被聽見。

同時,壁壘和競爭格局也有其特性,初創企業應該尋找未被大廠覆蓋的市場細分領域和定位,在AI領域不斷探索新技術、新方法和新應用,利用更多技術專利和知識產權建立競爭壁壘,也要注重與大廠建立合作關系(比如共享資源和數據),同時也需要具備較強的適應性和靈活性,快速適應市場變化。

此外,也應具備廣闊的國際化格局,這里既包括使用多種語言提供本地化服務,也要基于中國文化,提供相應的語言的工具和內容,另外,垂直領域大模型的解決方案也很重要,也要同時注重跨語言溝通和翻譯工具,以及針對中文語料的數據分析。

另外,知識產權結構也會有新格局,我們會面對不同的法律環境和保護方法,垂直領域數據的占比也會增加,而模型算法的占比會降低,同時也會有不同的產權激勵結構。

最后,初創企業也需要面對新型的社會關系,我們會有不同的政府監管環境,創業門檻也會大幅降低,創業者作為一種普世性職業的時代真正到來,同時人才需求也會發生變化,對應聘人才的技術能力要求會更高。

“人”的機會空間

對于個人來講,越來越重要的是你是不是有獨到的見解,而且你有很大的心力,可以堅持不懈地追求這個愿景。

能力相對來講越來越不重要,而你需要的是獨到的能力,是能用好工具的能力。如果你的能力是別人或多或少都有的,那就越來越不重要了。

技術驅動發展帶來的職業趨向。

對一個創始人來講最重要的是獨到的見解,尤其是對未來獨到的看法和很強的心力,可以長期堅持努力把他獨到的對未來的愿景可以實現出來,這是越來越重要的一個特性。

OpenAI本身就是最好的一個案例,OpenAI看好的是別人不看好的。OpenAI的科研能力、開發能力在總體上是遠遠不如谷歌、他們就幾百號人,但是他們做出來了,本身就是驗證了這一點,它(OpenAI)有著不同的愿景、不同的看法,它走的路是別人不走的路,它堅持走下去了,它靠這些徹底改變了世界。大家如果要一個案例,看 OpenAI 就行了。

人類歷史上由于生產力、生產關系的演變,在任何時代都有一類職業,它是最賺錢的,創造財富最多。

以前打獵最厲害,創造的財富最多。有一個時代武功最厲害,能打架的武士是最賺錢的。上個世紀末,在華爾街買公司、賣公司的人,是最賺錢的,也就是投資者。而這個世紀初,即使把風險算在內,創業者是創造財富最多的一個職業,毫無疑問。

在這個新時代創造價值、財富最多的是創業者,同時大模型時代為創業者帶來不同的發展機會,你需要的資金越來越少,你開發的周期越來越短,你創造價值機會越來越多,以后有越來越多的人都可以做創業,投資的生態也將為此而變,使創業者的機會越來越可觀,越來越普遍,越來越有價值。

同時在下個時代,最有價值的是科研,但不是傳統意義的科研,是新一代的科研。這個科研的典型代表就是OpenAI 。在OpenAI,你既是一個科研人員,同時又是碼農,同時又可以做生態。既能夠做科研寫論文,又能夠寫代碼,又能夠做平臺,是新一代的科學機構,是新一代的科學范式。

OpenAI開了個先例。有越來越多的OpenAI在未來10年、 20年、 30年、40年會涌現,因為今天的創業生態是70年的歷史,再往后5年,會有越來越多人做這個,這是新一代的科研的open research(開放科研)。

基礎范式的演變

科研的發展跟商業化合為一體

科學將進入第四范式和第五范式。新的科學范式需要數據、需要計算來發現新的科學現象,如果沒有商業化,數據哪里來,算力哪里來?所以本質上,科研的發展必須逐步逐步跟商業化合為一體。

今天引領信息科學的不是一流的大學,不是國立實驗室,早就是大廠。而今天引領數字化最前沿的人工智能的已經不是大廠,是創業公司,是OpenAI,是DeepMind。今天引領新空間科學的不是NASA,不是波音,是一家創業公司,叫SpaceX。越來越多的產業,比如生命科學、材料科學都會朝這個方向走。這種范式的變化是結構性的,就是因為科學的發現跟商業化分不開了。

從技術到價值:5個核心環節

今天全球的主流科學發展范式是1944年奠定的。1944年有一個人叫Vaneva Bush,那個時候羅斯福總統判斷二戰快結束了,他叫這個人寫一份報告,規劃如何讓美國在二戰之后保持技術的領先。這個人做了一番研究之后,寫了一本小冊子,名字叫《Science: the Endless Frontier》(《科學:無盡的前沿》)。

他在書中提出了一個范式:中央政府收稅,把這個稅的錢交給兩個地方,一個是研究型大學,在美國系統發展研究型大學,研究大學里面做基礎研究,做應用研究,做工程研究,教授和研究生一起做;第二,把錢給國立研究院等機構。今天中國也好,歐洲也好,或多或少都是采用這個范式。

產生的結果是有大量的科研結果形成論文,然后這些論文待在書架上10年或20年。接著有些大廠、有些其他機構說這些基礎研究可以來解決實際的問題的,這就是所謂的應用研究。應用研究一般都是大學或者研究機關或者大廠在做。做完之后,發現這個可以做技術,就把技術做出來。比如說芯片封裝技術、軟件驗證技術。這些技術做出來之后,有產品經理說這個技術可以做成產品,于是便把產品做出來。產品做出來,市場銷售、運營的人說這個可以去賣,于是便把產品賣給客戶。

技術驅動社會進步是這樣一個流水線。所以從技術到為人類提供價值,都是有5個核心環節一路走下來的。

創業公司開始做基礎研究了

但今天我們看到趨勢是越來越倒過來了。創業公司,它不光是做產品,做技術,做應用研究,也開始做基礎研究了。為什么?

第一,科學的范式變了,科學發展離不開商業化。科學必須要有數據,必須要有算力,所以離不開商業化。

第二,我們的歷史上從來沒有一個探索體系叫創業體系。創業體系是什么呢?它無縫不入,只要哪里有機會,哪里就有投資,就有想發財的年輕人。它比其他體系都更靈活,它能吸收人才,它有大量的資源可以用。因為今天全球的資本太多,都在找回報。如果你能改變世界,只要你真的行,都有人愿意投。我看到的一個現象是在一流大學,如伯克利、斯坦福,校內的每一個系長得越來越像一個基金,很多教授某種意義上都帶了好幾個創業團隊,這個趨勢越來越明顯。

當然,今天主流科研模型有它的優勢,它將繼續在適合這個模式的領域中開拓科學新前沿。新的范式需要不斷地探索、更新和創造。

(如需查看完整演講內容和PPT,可點擊演講實錄全文。)

    責任編輯:鄭潔
    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            富二代百家乐官网的玩法技巧和规则| 澳门百家乐赢钱| 优博网| 百家乐赌博牌路分析| 至尊百家乐官网年代| 威尼斯人娱乐城 老品牌值得信赖| 巨星百家乐官网的玩法技巧和规则| 新安县| 大发888加速器| 金百家乐的玩法技巧和规则| 罗盘24山八卦| 百家乐官网赌场网| 百家乐赌博玩法技巧| 百家乐官网博彩免费体验金3| 百家乐官网投注怎么样| 深泽县| 真人百家乐视频| 百家乐路单免费下载| 百家乐官网平玩法这样| 百家乐官网赌场视屏| 中国百家乐官网游戏| 金道博彩| 百家乐电脑赌博| 万达百家乐官网娱乐城| 百家乐官网长庄投注| 百家乐官网园会员注册| 彩票| 赌百家乐官网心里技巧| 百家乐官网试玩网站| 百家乐官网技术秘籍| 百家乐官网视频视频| 会宁县| 一二博网址| 亿酷棋牌世界下载| 大发888娱乐城真钱游戏| 百家乐挂机软件| 百家乐斗地主下载| 百家乐博赌场娱乐网规则| 神话百家乐的玩法技巧和规则| 百家乐游戏机说明书| 免费百家乐官网计划|