🔥前 Google TPU 架構師 Jonathan Ross 開講:為什麼 Groq 不跟輝達競爭?
喬納森・羅斯(Jonathan Ross)曾參與 Google TPU 的核心架構設計,如今是 Groq 創辦人,也是 LPU(Language Processing Unit)的主要推動者。他近期的一段談話,清楚說明了 OpenAI 為何不斷進行算力相關交易,以及 Groq LPU 與輝達 GPU 在本質上的差異,對理解 AI 下一階段發展非常關鍵。
🔹 為什麼 OpenAI 必須不斷擴充算力?
在 AI 產業中,商業模式其實相當直接:算力等同於產能,而產能直接轉化為營收。Greg Brockman 曾在公開場合指出,若 OpenAI 的算力倍增,營收也有機會等比例甚至倍數成長。現階段的 AI 市場就像一座已經被證實存在的油田,需求早已確立,差別只在於誰能更快將算力轉換為可用的服務。因此,OpenAI 與雲端服務商、晶片公司之間頻繁出現資本與算力的互換,本質上是為了加速釋放這些既定需求。
🔹 Groq 為什麼選擇不與輝達正面競爭?
Jonathan Ross 的立場相當明確:競爭本身往往是對研發資源的浪費。當一家新公司選擇與既有巨頭競爭,通常意味著沿著對方已經走過的路再走一次,投入大量資金,卻只為了做出相似的產品。Groq 從一開始就選擇差異化策略,專注於解決尚未被妥善處理的問題,而不是加入 GPU 的正面戰場。
🔹 LPU 與 GPU 的根本差異在哪裡?
GPU 是為通用運算與模型訓練而生,設計目標在於高吞吐量,但代價是較高的延遲。對於需要即時互動的語言模型應用而言,這樣的特性並不理想。LPU 則是為語言與序列推理量身打造,重點在於極低延遲與穩定、可預期的回應時間。Jonathan Ross 指出,在深度研究或複雜推理場景中,等待數分鐘才能得到回應,會嚴重干擾思考與追問流程,這正是 LPU 想要根本改善的問題。