OpenAI正在打造輻射硬件與軟件的萬億美元AI平臺。繼采購英偉達與AMD芯片,部署10GW與6GW數據中心后,它終于官宣了與博通的合作。這款傳聞已久的定制AI芯片,已經秘密設計了18個月,有望在2026年下半年投入使用,并于2029年底全面部署,整體規模高達10GW。
這款AI芯片為推理而生。按照參與該芯片設計的首位核心員工的說法,早在o1正式發布前的幾個月內,即進入去年下半年,團隊就已開始著手設計。期間,公司的模型團隊與芯片團隊,以及博通合作團隊,就已經緊密協作起來,試圖把智能的成本與延遲,一起壓向零的邊際。
事實上,OpenAI與博通的合作,已經超出了最初的設想。與其說它們在合作開發一款定制AI芯片,不如說它們在合作定制一整套完整的,能夠直接塞到數據中心里的算力系統。據雙方的聲明,OpenAI負責設計芯片和系統整體架構,博通設計端到端的以太網、PCIe和光纖連接解決方案組合。
它還是一套協同創新的方法論,圍繞OpenAI生態而生。OpenAI宣稱將其“在開發前沿模型和產品過程中積累的經驗直接嵌入到硬件中,從而釋放更高水平的功能和智能”。博通也稱,雙方討論的下一件事,是將算力從芯片的二維空間堆疊到三維空間,并將光學也引入其中。
這背后反映的是OpenAI正在打造一個自我閉環的模型+算力帝國。過去,OpenAI曾幾次嘗試讓芯片廠商圍著自己轉。GPU緊缺和溢價已經成為了OpenAI的瓶頸;更要命的是,OpenAI越來越綁定在英偉達的CUDA體系內,無法迅速最大化地釋放模型性能,也不會符合推理時代的token經濟學。
由OpenAI 研究員創建的深度學習編譯器Triton,最初兼容CUDA,然后逐步擴展到AMD ROCm等更多架構,讓旗下模型能跨硬件運行。微軟最初發布Maia 100,宣傳的可是專為Azure平臺設計,旨在運行生產級OpenAI模型。在初版“星門項目”的藍圖里,OpenAI更愿意使用以太網,希望避免使用InfiniBand。
OpenAI的野心是構筑自己的萬億美元AI商業生態。這次OpenAI開發者日,奧特曼展示了ChatGPT Apps SDK、AgentKit等,相當于要讓ChatGPT成為新的操作系統。但當天在接受Stratechery采訪時,奧特曼卻聲稱,自己現在花時間最多的地方,是基礎設施。
這呼應了Groq創始人Jonathan Ross的最近的觀點。誰掌控算力,誰才真正掌控AI,“自己造芯片,并不只是擁有一顆芯片,真正意義是你把命運掌握在自己手里”。
去年初,奧特曼提出的7萬億美元AI基礎設施計劃遭到所有人的嘲笑與質疑,如今,奧特曼計劃在2033年就將算力規模提升到驚人的250GW,差不多就要對應超過10萬億美元資金。
OpenAI的星門計劃之上,正在構筑出全球芯片星際艦隊:英偉達、AMD、博通、英特爾(通過英偉達),還包括ARM、三星、海力士等。

ARM已經深度介入,為OpenAI與博通的定制AI芯片,開發一款高度適配的專用CPU架構。有意思的是,ARM是軟銀的子公司,而軟銀又是OpenAI的股東與客戶。軟銀簽下的其中一份訂單,就是從OpenAI購買技術,以幫助ARM縮短芯片開發周期。這次OpenAI與博通合作,OpenAI聯合創始人Greg Brockman就宣布了AI設計AI芯片這一噱頭。
資本市場正在醞釀“內存超級周期”,無論是DRAM、NAND還是HDD,首次同時面臨短缺。DRAM是制造HBM的基礎,HDD是儲存Sora生成的視頻的最廉價的儲存介質,而NAND的未來將是有望取代HBM市場地位的HBF。OpenAI已經開始與三星和SK海力士合作開發AI芯片內存。
而在中國開啟算力生態軟硬件協同的關鍵角色是DeepSeek。此前瘋傳的《AI 2027》報告,虛構了美國公司OpenBrain與中國公司DeepCent之間的競爭,決定了智能體的未來。它們映射的正是現實世界的OpenAI與DeepSeek,以及各自所引領的AI生態。
DeepSeek創始人梁文鋒很早就認為,中國的AI發展缺乏硅谷的軟硬件協同生態,“很多國產芯片之所以發展受限,是因為缺乏配套的技術社區,往往只能獲得第二手信息。” 沒有前沿大模型的協同,閉門造不出好芯片。
自去年以來,DeepSeek對外公布了自己的代碼,還在陸續發表的論文里“指導”中國硬件廠商前來適配,設計出未來芯片的架構,包括突破CPU與GPU通信瓶頸與更智能化的互聯網絡。從魔改PTX到使用UE8M0 FP8 Scale的參數精度,DeepSeek先榨取英偉達GPU算力,再牽引國產算力生態的演進。
近期,DeepSeek-V3.2-Exp更新,作為實驗性版本,它不僅探索了新的稀疏注意力機制,也在推動中國算力生態的協同創新與格局演進。該模型的開發,用到了一款“土生土長”的新型編程語言TileLang,將是替代目前主流的OpenAI 領域特定語言(DSL)Triton的有力備選,已經擴展支持多款國產芯片。
該模型發布后,華為N騰和寒武紀均第一時間宣布完成適配工作,加上海光、昆侖芯、沐曦等的深度適配,意味著國產AI算力生態的軟硬件協同,已經進入實戰階段。
盡管DeepSeek目前仍然是一家AGI實驗室,但它的技術信仰仍然需要強大的算力支持。可以預見的將來,它會別英偉達GPU;讓中國頭部芯片廠商同步適配自己,相當于也“掌握了自己的命運”。開源與分享正在成為中國創新的公共品,模型與芯片廠商可以更快速地驗證設計方向,盡量減少協同成本。
圍繞OpenAI的生態是封閉的。源自這一體系的創新,將會通過硬件合作伙伴,部分或間接地外溢至其他模型層以及應用層企業。但更多的仍然是鎖定在OpenAI自己的技術黑箱與價值體系之內。
中國與美國的AI競爭,正在從算力與模型的單打獨斗,收斂到軟硬件協同的開源與閉源的競爭??駸岬馁Y金仍在繼續涌入。在美國,已經從產業資本邁向金融資本下場的新階段;在中國,無論是芯片還是模型,廠商數量眾多,各地建設熱火朝天,力爭把算力變成生產力。
]]>