Новини

FPGA-базиран ускорител на невронни мрежи превъзхожда графичните процесори

Той беше демонстриран като GoogLeNet Inception-v1 CNN, използвайки осем битова цялостна резолюция. Той постигна 16,8 тера операции в секунда (TOPS) и може да открие над 5300 изображения в секунда на Xilinx Virtex UltraScale + XCVU9P-3 fpga. Модулният, мащабируем подход го прави подходящ за откриване на обекти и приложения за обработка на видео в края и в облака, обясни Fawcett, както и за извеждане в центрове за данни и интелигентни камери.

DPU може да бъде конфигуриран да осигурява оптимална изчислителна производителност за топологии на невронната мрежа в приложения за машинно обучение, използвайки паралелната DSP архитектура, разпределената памет и преконфигурируемостта на логиката и свързаността за различни алгоритми.

DPU постига над 50% по-висока производителност от всички конкурентни CNN и превъзхожда графичните процесори за даден бюджет за мощност или разходи, твърдят от компанията. „Fpga е световно победителна платформа и архитектура, която е много гъвкава за устойчивост на бъдещето и може да превъзхожда графичните процесори в AI, с по-ниска латентност“, добави Факет.

Компанията също обяви, че спонсорира DPhil (PhD0 в Оксфордския университет за изучаване на техники за прилагане на дълбоко ускорение на обучението по fpgas. Работата ще бъде в сътрудничество със собствените изследвания на Omnitek за AI изчислителни двигатели и алгоритми.