生成式AI變革已經到來。隨著生成式AI用例需求在具有多樣化要求和計算需求的垂直領域不斷增加,我們顯然需要專為AI定製設計的全新計算架構。這首先需要一個面向生成式AI全新設計的神經網路處理器(NPU),同時要利用異構處理器組合,比如中央處理器(CPU)和圖形處理器(GPU)。通過結合NPU與其他合適的處理器,異構計算能夠實現最佳應用性能、能效和電池續航,賦能全新增強的生成式AI體驗。

工具箱中的處理器選擇

圖 1:正如在工具箱中選擇合適的工具一樣,選擇合適的處理器取決於諸多因素,將增強生成式AI體驗。

異構計算的重要性

生成式AI的多樣化要求和計算需求需要不同的處理器來滿足。支持處理多樣性的異構計算架構能夠發揮每個處理器的優勢,例如以AI為中心定製設計的NPU,以及CPU和GPU。每個處理器擅長不同的任務:CPU擅長順序控制和即時性,GPU適合併行數據流處理,NPU擅長標量、向量和張量數學運算,可用於核心AI工作負載。

異構計算能夠實現最佳應用性能、能效和電池續航,以最大化發揮生成式AI終端用戶體驗。

NPU演進

圖 2:NPU隨著不斷變化的AI用例和模型持續演進,實現高性能低功耗。

什麼是神經網路處理器(NPU)?

NPU專為實現以低功耗加速AI推理而全新打造,其架構隨著新AI演算法、模型和用例的發展不斷演進。AI工作負載主要包括由標量、向量和張量數學組成的神經網路層計算以及非線性啟動函數。優秀的NPU設計能夠為處理這些AI工作負載做出正確的設計選擇,與AI行業方向保持高度一致。

高通AI引擎

圖 3:高通AI引擎包括高通Hexagon NPU、高通Adreno GPU、高通Kryo或高通Oryon CPU、高通感測器中樞和記憶體子系統。

高通領先的NPU和異構計算解決方案

高通正在助力讓智能計算無處不在。業界領先的高通Hexagon NPU面向以低功耗實現持續穩定的高性能AI推理而設計。高通NPU的差異化優勢在於系統級解決方案、定製設計和快速創新。通過定製設計NPU並控制指令集架構(ISA),高通能夠快速進行設計演進和擴展,以解決瓶頸問題並優化性能。

Hexagon NPU是高通業界領先的異構計算架構——高通AI引擎中的關鍵處理器,高通AI引擎還包括高通Adreno GPU、高通Kryo或高通Oryon CPU、高通感測器中樞和記憶體子系統。這些處理器為實現協同工作而設計,能夠在終端側快速且高效地運行AI應用。

我們在AI基準測試和實際生成式AI應用方面的行業領先性能表現就是例證。請閱讀白皮書,深入了解高通NPU、我們的其他異構處理器,以及在第三代驍龍8和驍龍X Elite上業界領先的AI性能。

高通AI軟體棧

圖 4:高通AI軟體棧旨在幫助開發者一次編寫,即可實現隨時隨地運行和規模化擴展。

賦能開發者加速生成式AI應用

我們專注於在全球搭載高通和驍龍平台的數十億終端設備上實現便捷開發和部署,賦能開發者。利用高通AI軟體棧(Qualcomm AI Stack),開發者可在高通硬體上創建、優化和部署AI應用,一次編寫即可實現在不同產品和細分領域採用高通晶元組解決方案進行部署。

通過將技術領導力、定製晶元設計、全棧AI優化和生態系統賦能充分結合,高通技術公司在推動終端側生成式AI開發和應用方面獨樹一幟。高通技術公司正在賦能終端側生成式AI的規模化擴展。

下載白皮書:《通過NPU和異構計算開啟終端側生成式AI》

查閱《混合AI是AI的未來》白皮書第一部分第二部分