吉米投資理財補給站 Ver2.0 (@jimifinance): "🔥前 Google TPU 架構師 Jonathan Ross 開講：為什麼 Groq 不跟輝達競爭？喬納森・羅斯（Jonathan Ross）曾參與 Google TPU 的核心架構設計，如今是 Groq 創辦人，也是 LPU（Language Processing Unit）的主要推動者。他近期的一段談話，清楚說明了 OpenAI 為何不斷進行算力相關交易，以及 Groq LPU 與輝達 GPU 在本質上的差異，對理解 AI 下一階段發展非常關鍵。 🔹 為什麼 OpenAI 必須不斷擴充算力？在 AI 產業中，商業模式其實相當直接：算…"

Make money doing the work you believe in

🔥前 Google TPU 架構師 Jonathan Ross 開講：為什麼 Groq 不跟輝達競爭？

喬納森・羅斯（Jonathan Ross）曾參與 Google TPU 的核心架構設計，如今是 Groq 創辦人，也是 LPU（Language Processing Unit）的主要推動者。他近期的一段談話，清楚說明了 OpenAI 為何不斷進行算力相關交易，以及 Groq LPU 與輝達 GPU 在本質上的差異，對理解 AI 下一階段發展非常關鍵。

🔹 為什麼 OpenAI 必須不斷擴充算力？

在 AI 產業中，商業模式其實相當直接：算力等同於產能，而產能直接轉化為營收。Greg Brockman 曾在公開場合指出，若 OpenAI 的算力倍增，營收也有機會等比例甚至倍數成長。現階段的 AI 市場就像一座已經被證實存在的油田，需求早已確立，差別只在於誰能更快將算力轉換為可用的服務。因此，OpenAI 與雲端服務商、晶片公司之間頻繁出現資本與算力的互換，本質上是為了加速釋放這些既定需求。

🔹 Groq 為什麼選擇不與輝達正面競爭？

Jonathan Ross 的立場相當明確：競爭本身往往是對研發資源的浪費。當一家新公司選擇與既有巨頭競爭，通常意味著沿著對方已經走過的路再走一次，投入大量資金，卻只為了做出相似的產品。Groq 從一開始就選擇差異化策略，專注於解決尚未被妥善處理的問題，而不是加入 GPU 的正面戰場。

🔹 LPU 與 GPU 的根本差異在哪裡？

GPU 是為通用運算與模型訓練而生，設計目標在於高吞吐量，但代價是較高的延遲。對於需要即時互動的語言模型應用而言，這樣的特性並不理想。LPU 則是為語言與序列推理量身打造，重點在於極低延遲與穩定、可預期的回應時間。Jonathan Ross 指出，在深度研究或複雜推理場景中，等待數分鐘才能得到回應，會嚴重干擾思考與追問流程，這正是 LPU 想要根本改善的問題。

🔹 供應鏈才是真正拉開差距的關鍵

輝達 GPU 高度依賴 HBM 記憶體與 CoWoS 先進封裝，這些環節正是目前半導體產業的主要瓶頸，也使得 GPU 從下單到出貨往往需要一年半到兩年。Groq 的 LPU 不使用 HBM，也不依賴 CoWoS，採用的是一條正交供應鏈，因此交期大幅縮短，從下單到出貨約六個月，能更快速回應市場對算力持續被低估的現實。

🔹 一句話總結

輝達正在建立的是以 GPU 為核心的算力帝國；而 Groq 則試圖重新定義即時推理與互動式 AI 的運算方式。這不只是效能層級的優化，而是一場從 TPU 思維走向 LPU 架構的世代轉移。 #就在剛剛輝達以200億美元收購了Groq的推論晶片技術授權

Dec 25

1:08 AM

Make money doing the work you believe in

Log in or sign up