ZHCY189A january 2022 – march 2023 AM67 , AM67A , AM68 , AM68A , AM69 , AM69A , TDA4AEN-Q1 , TDA4AH-Q1 , TDA4AL-Q1 , TDA4AP-Q1 , TDA4APE-Q1 , TDA4VE-Q1 , TDA4VEN-Q1 , TDA4VH-Q1 , TDA4VL-Q1 , TDA4VM , TDA4VM-Q1 , TDA4VP-Q1 , TDA4VPE-Q1
下面我們來(lái)了解一下邊緣 AI 系統(tǒng)中可能的內(nèi)核類型:
CPU
中央處理單元 (CPU) 是可處理連續(xù)工作負(fù)載的通用處理單元。它們具有很高的編程靈活性,并可從龐大的現(xiàn)有代碼庫(kù)中受益。通常,大多數(shù)邊緣 AI 系統(tǒng)具有 2 到 8 個(gè) CPU 內(nèi)核,用于管理平臺(tái)和功能豐富的應(yīng)用。但是,僅含 CPU 的系統(tǒng)不適合像素級(jí)成像、計(jì)算機(jī)視覺(jué)和卷積神經(jīng)網(wǎng)絡(luò) (CNN) 處理等高度專業(yè)化的任務(wù)。CPU 還具有高功耗,但吞吐量卻是不同內(nèi)核類型中最低的。單核 CPU 系統(tǒng)與 AI 加速、圖像處理等專用硬件模塊配合使用,可以滿足低成本應(yīng)用的功率預(yù)算要求。
GPU
圖形處理單元 (GPU) 具有數(shù)百到數(shù)千個(gè)小型內(nèi)核,非常適合并行處理任務(wù)。GPU 最初設(shè)計(jì)用于實(shí)現(xiàn)一系列圖形操作,但現(xiàn)在已經(jīng)廣泛應(yīng)用于深度學(xué)習(xí)應(yīng)用中,尤其是在訓(xùn)練 DNN 時(shí)特別有用。然而,由于內(nèi)核數(shù)量眾多,GPU 功耗很大并具有更高的片上存儲(chǔ)器要求,這是其主要缺點(diǎn)之一。
DSP
數(shù)字信號(hào)處理器 (DSP) 是高能效的專用內(nèi)核,通常用于解決多個(gè)復(fù)雜的數(shù)學(xué)問(wèn)題。DSP 能夠以低功耗處理來(lái)自現(xiàn)實(shí)世界中視覺(jué)、音頻、語(yǔ)音、雷達(dá)和聲納傳感器的實(shí)時(shí)數(shù)據(jù),并有助于更大程度地提高每個(gè)時(shí)鐘周期的處理能力。然而,由于其編程難度較大,需要熟悉 DSP 硬件的特性、編程環(huán)境和 DSP 軟件優(yōu)化,才能實(shí)現(xiàn)最佳性能。
ASIC
專用集成電路 (ASIC) 和加速器能夠?yàn)橄到y(tǒng)應(yīng)用提供最高的性能和最低的功耗。當(dāng)您確定要加速的功能所屬的核心內(nèi)核時(shí),通常會(huì)使用它們。例如,CNN 的核心計(jì)算通常涉及矩陣乘法。對(duì)于傳統(tǒng)的計(jì)算機(jī)視覺(jué)任務(wù),專用硬件加速器能夠計(jì)算圖像縮放、鏡頭失真校正和噪聲濾波等操作。
FPGA
現(xiàn)場(chǎng)可編程門陣列 (FPGA) 是一類集成電路,可以對(duì)硬件模塊進(jìn)行重新編程并將其用于特定應(yīng)用。它們的功耗低于 GPU 和 CPU,但高于 ASIC。不過(guò),硬件編程比較難,并且需要掌握硬件描述符語(yǔ)言方面的專業(yè)知識(shí),比如 Verilog 或超高速 IC 硬件描述語(yǔ)言等。