Make money doing the work you believe in

🔥前 Google TPU 架構師 Jonathan Ross 開講:為什麼 Groq 不跟輝達競爭?

喬納森・羅斯(Jonathan Ross)曾參與 Google TPU 的核心架構設計,如今是 Groq 創辦人,也是 LPU(Language Processing Unit)的主要推動者。他近期的一段談話,清楚說明了 OpenAI 為何不斷進行算力相關交易,以及 Groq LPU 與輝達 GPU 在本質上的差異,對理解 AI 下一階段發展非常關鍵。

🔹 為什麼 OpenAI 必須不斷擴充算力?

在 AI 產業中,商業模式其實相當直接:算力等同於產能,而產能直接轉化為營收。Greg Brockman 曾在公開場合指出,若 OpenAI 的算力倍增,營收也有機會等比例甚至倍數成長。現階段的 AI 市場就像一座已經被證實存在的油田,需求早已確立,差別只在於誰能更快將算力轉換為可用的服務。因此,OpenAI 與雲端服務商、晶片公司之間頻繁出現資本與算力的互換,本質上是為了加速釋放這些既定需求。

🔹 Groq 為什麼選擇不與輝達正面競爭?

Jonathan Ross 的立場相當明確:競爭本身往往是對研發資源的浪費。當一家新公司選擇與既有巨頭競爭,通常意味著沿著對方已經走過的路再走一次,投入大量資金,卻只為了做出相似的產品。Groq 從一開始就選擇差異化策略,專注於解決尚未被妥善處理的問題,而不是加入 GPU 的正面戰場。

🔹 LPU 與 GPU 的根本差異在哪裡?

GPU 是為通用運算與模型訓練而生,設計目標在於高吞吐量,但代價是較高的延遲。對於需要即時互動的語言模型應用而言,這樣的特性並不理想。LPU 則是為語言與序列推理量身打造,重點在於極低延遲與穩定、可預期的回應時間。Jonathan Ross 指出,在深度研究或複雜推理場景中,等待數分鐘才能得到回應,會嚴重干擾思考與追問流程,這正是 LPU 想要根本改善的問題。

🔹 供應鏈才是真正拉開差距的關鍵

輝達 GPU 高度依賴 HBM 記憶體與 CoWoS 先進封裝,這些環節正是目前半導體產業的主要瓶頸,也使得 GPU 從下單到出貨往往需要一年半到兩年。Groq 的 LPU 不使用 HBM,也不依賴 CoWoS,採用的是一條正交供應鏈,因此交期大幅縮短,從下單到出貨約六個月,能更快速回應市場對算力持續被低估的現實。

🔹 一句話總結

輝達正在建立的是以 GPU 為核心的算力帝國;而 Groq 則試圖重新定義即時推理與互動式 AI 的運算方式。這不只是效能層級的優化,而是一場從 TPU 思維走向 LPU 架構的世代轉移。 #就在剛剛輝達以200億美元收購了Groq的推論晶片技術授權

Dec 25
at
1:08 AM
Relevant people

Log in or sign up

Join the most interesting and insightful discussions.