← 全部文章
TECH

垂直整合的綜效:Kachaka 母集團 PFN,把「找最適推論方式」交給軟體

機器人底盤 Kachaka Pro,出自 Preferred Robotics——日本深度學習公司 Preferred Networks(PFN)旗下的機器人子公司。一家機器人公司,母集團連晶片和編譯器都自己做,這在全球機器人產業裡相當罕見。而把晶片、機器人、應用層這條線串起來的,是同一個目標:做出更便宜、更穩定的機器人應用。 這次想引用的,是 PFN 的 Preferred Computing Platform(PFCP)——官方的說法是「誰もが MN-Core を利用できる AI クラウドサービス」,一個讓任何人都能用上 PFN 自行研發的加速器 MN-Core 系列的 AI 雲端服務。

PFN 做了什麼

依 PFCP 官網與 PFN 2024 年 10 月的新聞稿,這套東西有三層:

晶片。 MN-Core 2 是 PFN 與神戶大學共同開發的處理器,專為深度學習的核心——矩陣運算——最佳化。它的設計哲學很激進:把網路控制、快取控制、指令排程這些傳統上由硬體電路負責的功能,整個搬進編譯器軟體,好讓晶片面積盡可能塞滿運算單元。前代晶片驅動的 MN-3 超級電腦,曾三度拿下 Green500(全球節能超算排行)世界第一。

編譯器。 硬體功能搬進軟體之後,「怎麼把一個 AI 模型跑得最快、最省」就變成編譯器的工作:它接收 PyTorch、JAX 等高階框架定義的計算圖,自動產生最適的指令排程與資料搬移,使用者不需要大改既有的工作負載。

這裡值得說清楚:與其說 PFN「用 AI 尋找最適推論模型」,更精確的描述是——他們把「為每個模型尋找最適執行方式」這件事,從工程師手上交給了自家軟體自動完成。搜尋最適解的主體是編譯器,被優化的對象是推論與訓練工作負載。

雲端服務。 PFCP 於 2024 年 10 月上線,由 PFN 自己構建營運,以全託管 Kubernetes 跑互動式開發、定期任務、分散式訓練到推論伺服器等多種工作負載,是目前唯一能使用 MN-Core 系列的平台。

下一步走得更深:依 PFN 2024 年 11 月的發布,專為生成式 AI「推論」設計的 MN-Core L1000 已在開發中,用 3D 堆疊 DRAM 直接疊在邏輯電路上方來突破記憶體頻寬瓶頸——PFN 預期它對比 GPU 等傳統處理器最高有 10 倍運算速度,同時大幅降低功耗,計畫 2026 年投入市場(以上均為 PFN 官方的預期宣稱)。

為什麼 Sigma 在意

因為這是同一件事,只是發生在不同樓層。

PFN 在晶片與編譯器層回答的問題是:「同樣一次推論,怎麼用最少的電、最少的運算效能、最短的時間跑完?」答案是讓軟體自動找最適執行方式,而不是堆更多通用算力。

Sigma 在應用層回答的是同一個問題:「同樣一次巡檢判讀,怎麼用最少的雲端費用跑完?」我們的答案是邊緣+雲端分層——持續性影像留在邊緣,雲端只判讀有意義的單張畫面,問題收斂到夠窄,輕量模型就夠用。

換句話說:上游有人在矽和編譯器裡把「推論該多便宜」這條路鋪得更深,下游的我們在場域裡用架構把同一條曲線往下壓。推論成本每降一個量級,就有一批原本不划算的機器人應用變得划算——這是我們一同前行、努力讓機器人應用有更高 CP 值的方法。


出處:Preferred Computing Platform 官網PFN 新聞稿:PFCP 提供開始(2024-10-21)PFN 新聞稿:MN-Core L1000 開發(2024-11-15)

#Preferred Networks#技術血統