Llama的烏托邦為何崩塌?揭秘Meta AI從開源神話到內部風暴的致命失誤
前言
2025年10月底,Meta AI部門上演著一幕極度矛盾的戲碼:一邊,執行長馬克・祖克柏(Mark Zuckerberg)正揮舞著上億美元的年薪支票,瘋狂地從市場上挖掘頂尖AI人才;另一邊,公司卻決絕地裁掉了AI部門的600個職位,核心高管們紛紛離職或被邊緣化,就連圖靈獎得主楊立昆(Yann LeCun)也被認為自身難保。
這一切混亂的根源是什麼?Meta的Llama計畫,如何在短短一年內,從Llama 3的驚艷成功,走向Llama 4的災難性失敗?在這座世界頂尖的AI實驗室內部,究竟發生了什麼?
本文將透過對多位Meta前內部人士的訪談精華,為您揭開這場戲劇性衰敗背後的故事。
1. 烏托邦的「原罪」:理想研究與產品現實的內在衝突
Meta的AI部門從一開始,其架構就像一架精密的「天平」,試圖在兩個極端之間尋找平衡。
天平的一端,是由圖靈獎得主楊立昆領導的基礎AI研究實驗室(FAIR, Fundamental AI Research)。它的使命是進行尖端、長期的研究,目標直指通用人工智慧(AGI)。當年LeCun加入Meta時提出了三個條件:開放研究、發表所有工作成果、將程式碼開源。這奠定了FAIR實驗室的理想主義基調。
天平的另一端,則是並行設立的「生成式AI」(GenAI)部門。這個團隊的目標非常明確:產品化。他們負責將AI技術整合到Meta的現有產品中,例如Llama模型本身、Meta AI助理等,其負責人Ahmad Al-Dahle便是祖克柏從蘋果挖來,專門負責將AI融入Meta產品的關鍵人物。
在理想狀態下,FAIR的前沿研究能為產品帶來更強大的能力,而產品的商業成功又能為FAIR爭取到更多的研發經費。然而,這個烏托邦式的平衡極其脆弱,它的存在,完全依賴於一個前提:Meta的AI模型必須始終保持在技術的最前沿。
2. 「開源」的秘密:Llama從來都不是真正的開源
許多人認為Llama是「開源」的,但這個普遍的認知並不完全準確。Meta的策略,更精確地說,應該是「開放權重」(Open weights)。
簡單來說,「權重」(weights)指的是模型在經過大量資料訓練後,學習到的所有參數數值,這些數值儲存在幾個巨大的檔案中。Meta向公眾提供了這些訓練好的參數檔案,允許任何人下載、部署和微調。將「開放權重」想像成是給你一份烤好的蛋糕,但卻不給你完整的食譜、食材清單或烤箱溫度設定。你可以品嚐、分析甚至裝飾這塊蛋糕,但無法從頭複製它。
真正的開源還會包含釋出訓練資料、訓練程式碼以及更寬鬆的授權許可。對於任何一代的Llama模型,Meta從未公開這些關鍵組件。順帶一提,Llama這個名字本身也頗具巧思。據說是因為大型語言模型(Large Language Model)的縮寫「LLM」不好發音,Meta便補上元音,變成了朗朗上口的「Llama」,從此讓這個詞與羊駝緊密相連。
儘管如此,我們必須承認,相較於OpenAI、Anthropic和Google那種完全封閉、僅透過API提供服務的模式,Llama這種「半開源」的策略,已經為整個開源社群注入了無比旺盛的生命力。
3. 致命的失誤:當產品思維壓倒了核心技術演進
然而,這座理想的烏托邦,其崩塌的裂痕早已在Llama 3的巨大成功光環下悄然出現。
轉捩點發生在Llama 2和Llama 3取得巨大成功之後。Meta的領導層,特別是首席產品官(CPO)Chris Cox和祖克柏本人,越來越強調AI必須為Meta的產品服務。這種產品驅動的思維,讓那架精密的「天平」開始嚴重傾斜。
Llama 4的發展藍圖被深度地塑造了。團隊的重心被大量地轉移到對產品更友善的功能上,例如多模態能力的開發。然而,致命的疏忽也在此刻發生了:當Meta的GenAI團隊埋首於產品功能時,他們忽略了核心技術的演進。競爭對手正以前所未有的速度在推理(reasoning)和思維鏈(Chain-of-Thought, CoT)領域取得突破。
2024年9月,OpenAI發布了o1模型,其先進的思維鏈能力震驚業界。僅僅三個月後,2024年12月,來自中國的黑馬DeepSeek橫空出世,以更低的成本展現了強大的推理能力。Meta連續遭受了兩次重擊。
一位前員工在訪談中解釋了隨之而來的混亂:
我覺得DeepSeek的出現肯定是造成了公司裡面資源還有優先級管理上面的一些管理上的混亂吧。
當DeepSeek強大的推理能力公諸於世時,Meta的領導層陷入了恐慌。他們倉促地從FAIR實驗室抽調研究人員,包括田淵棟的團隊,前去「救火」,試圖在一個不可能的截止日期前,將先進的推理能力「嫁接」到Llama 4上。這個決定徹底打亂了產品工程和基礎研究的雙軌進程,也讓那架精密的「天平」應聲碎裂。
4. 外行領導內行:當不懂AI的人規劃AI的未來
綜合多位受訪者的觀點,一個核心問題浮上水面:Meta AI的中高層管理者(如副總裁、高級總監),許多人擁有的是基礎設施(infrastructure)或傳統電腦視覺的背景,但對大型語言模型缺乏深度的專業知識。
這就直接導致了前一章提到的戰略失誤。對於習慣了產品開發週期的管理者來說,多模態這類具體、可量化的功能,遠比「推理能力」這種抽象概念更容易被納入產品路線圖。他們缺乏對LLM核心技術的深刻理解,未能意識到推理能力並非純粹的學術追求,而是決定下一代模型競爭力的核心戰場。
其後果是,那些對技術有最深刻理解的人——也就是基層的「學術研究型博士」們——反而缺乏影響專案方向的話語權和資源。這就造成了「外行管理內行」的尷尬局面。由上而下設定的嚴苛截止日期,更為團隊帶來了巨大的壓力。當時負責帶領FAIR團隊「救火」的前研究總監田淵棟,對這個極具破壞性的流程有著深刻的反思:
做這樣的項目,這種項目其實是不能讓就是不懂的人來做整個領導者,或者說讓人來做規劃的… 如果在很強的最後期限壓力之下,最後結果就是這事情做不了,或者說大家沒有辦法去就是提出異議,那這樣的話最後質量就會變得 很差。
5. 激進的療法:一位年輕「救世主」的空降與新風暴
面對Llama 4的失敗,祖克柏決定徹底拋棄那架破碎的天平。他採取了極其激進的應對措施:重金聘請了年輕的天才Alexander Wang,並賦予他前所未有的權力。
Meta的AI架構被徹底重組。一個名為Meta超級智慧實驗室(MSL, Meta Superintelligence Labs)的超級部門應運而生,由Wang直接領導,並直接向祖克柏匯報。在這個新架構下,Wang還領導著一個名為「TBD」的特別團隊,由一群高薪聘請的頂級研究員組成,他們享有極端的特權,例如:三年內無需績效考核、可以無視任何副總裁的訊息、所有AI論文發表前都必須經過他們審核。此外,為了集中資源,一個統一的核心基礎設施團隊也被建立起來,統一管理所有GPU算力。
這一舉動在內部造成了劇烈震盪。曾經的靈魂人物Yann LeCun現在需要向Wang匯報;首席產品官Chris Cox被排除在AI團隊的直接領導之外;而另一位關鍵人物、前FAIR全球負責人Joelle Pineau則選擇離職,並迅速加入了競爭對手Cohere擔任首席AI官,凸顯了Meta人才流失的嚴重性。
祖克柏的激進療法,等於是用一支擁有至高權力的「特種部隊」,取代了原本平衡研究與產品的雙軌結構。然而,這種解決方案已經在Meta內部引發了巨大的不滿和政治摩擦,似乎正在為下一波內部衝突埋下伏筆。
結論
Meta的AI之旅,始於一個平衡研究與產品的理想化烏托邦。然而,當商業壓力與有缺陷的領導模式打破了這份脆弱的平衡後,最終迎來了Llama 4的災難性失敗。
這個故事讓人聯想到歷史上其他著名的企業實驗室(如貝爾實驗室)的衰落,它們同樣掙扎於純粹科學與商業化之間的衝突。
如今,祖克柏不惜打碎舊世界的平衡,將所有賭注押在了一位年輕天才和一支擁有極致權力的「特種部隊」身上。這種高度集權的頂層設計,能否最終帶領Meta贏得AI競賽?或者,他們只是將一種形式的混亂,換成了另一種?答案,也許很快就會揭曉。
天啊,Meta AI怎麼會在Llama大獲成功後,突然崩盤成這樣?我自己讀完這段內幕,真的是又震驚又疑惑——這到底是誰的錯呢?
當初Llama 3風靡全球,是因為Meta把開源權重丟給了大家,讓開發者自由發揮,結果卻不是完全的「開源」,而是只給了「蛋糕」卻沒給「食譜」。你能想像嗎?大家拿到模型參數,卻看不到訓練資料和完整程式碼。這種半開放策略真的能長久嗎?而且在Llama 4推進時,公司高層忽視了推理能力和技術深度的升級,把重心全部放在產品功能上,結果被OpenAI跟DeepSeek打得措手不及。
更讓人心寒的是,那些真正懂AI、做基礎研究的頂尖科學家,反而被外行管理層壓制,好像他們的聲音根本不重要。你說這種「外行領導內行」怎麼可能有好結果?田淵棟那句話說得太對了:「不懂的人帶頭做決策,只會讓質量下降。」我也好奇,如果當初Meta能堅持技術核心,是不是結局會完全不同?
最後還有個大轉折:祖克柏用一位年輕天才Alexander Wang組建了超級部隊,強勢接管所有AI資源。這到底是救火還是製造新危機?內部人才流失嚴重,新架構充滿矛盾,到底未來會走向輝煌還是更深的混亂?
我想問問大家,你們覺得一家公司在高速競爭中,是該選擇技術理想主義還是產品導向?Meta這種激烈的人事和策略調整,你認為會帶來真正突破還是徒增波瀾?歡迎留言分享你的看法,我真的很想知道你怎麼看待這場AI界的大戲!