Berita

Akselerator jaringan saraf berbasis FPGA mengungguli GPU

Itu ditunjukkan sebagai CNN GoogLeNet Inception-v1, menggunakan resolusi integer delapan-bit. Ini mencapai operasi 16,8 terra per detik (TOPS) dan dapat menyimpulkan lebih dari 5.300 gambar per detik pada Xilinx Virtex UltraScale + XCVU9P-3 fpga. Pendekatan modular, yang dapat diskalakan, membuatnya cocok untuk deteksi objek dan aplikasi pemrosesan video di tepi dan di awan, jelas Fawcett, serta untuk inferensi di pusat data dan kamera cerdas.

DPU dapat dikonfigurasi untuk memberikan kinerja komputasi optimal untuk topologi jaringan saraf dalam aplikasi pembelajaran mesin, menggunakan arsitektur paralel DSP, memori terdistribusi dan konfigurasi ulang logika dan konektivitas untuk algoritma yang berbeda.

DPU mencapai kinerja lebih dari 50% lebih tinggi daripada CNN yang bersaing dan melakukan GPU dengan daya atau anggaran biaya, menurut perusahaan. “FPGA adalah platform dan arsitektur yang mengalahkan dunia, yang sangat fleksibel untuk pembuktian di masa depan dan dapat mengungguli GPU di AI, dengan latensi yang lebih rendah,” tambah Fawcett.

Perusahaan juga telah mengumumkan mensponsori DPhil (PhD0 di Oxford University untuk mempelajari teknik-teknik untuk menerapkan akselerasi pembelajaran mendalam pada fpgas. Pekerjaan ini akan bekerja sama dengan penelitian Omnitek sendiri dalam mesin dan algoritma komputasi AI.