Penyebaran akselerator perangkat keras secara signifikan meningkatkan daya komputasi suatu sistem dengan membongkar tugas spesifik, intensif komputasi dari CPU tujuan umum hingga unit perangkat keras khusus yang dirancang untuk tugas-tugas tersebut. Ini mengarah pada beberapa efek utama pada kinerja dan efisiensi sistem:
** 1. Peningkatan kinerja melalui paralelisme dan spesialisasi
Akselerator direkayasa untuk melaksanakan operasi tertentu jauh lebih cepat daripada CPU dengan mengeksploitasi paralelisme dan sirkuit khusus. Misalnya, akselerator kriptografi perangkat keras dapat memproses banyak operasi kriptografi secara bersamaan, menyelesaikan tugas jauh lebih cepat daripada CPU yang menanganinya secara berurutan. Spesialisasi ini memungkinkan akselerator untuk memberikan speedup dramatis untuk beban kerja target mereka, sering meningkatkan kinerja dengan pesanan besar dibandingkan dengan eksekusi khusus CPU [8] [5] [7].
** 2. Meningkatkan efisiensi energi
Berlawanan dengan keyakinan tradisional bahwa menambahkan perangkat keras meningkatkan konsumsi daya, akselerator yang dirancang dengan cermat dapat mengurangi daya sistem secara keseluruhan. Ini karena akselerator dapat melakukan operasi lebih efisien, membutuhkan lebih sedikit siklus clock dan memungkinkan sistem berjalan pada frekuensi clock yang lebih rendah sambil mempertahankan atau meningkatkan kinerja. Misalnya, menambahkan akselerator ke sistem tertanam mengurangi siklus eksekusi hampir 90 kali lipat dan memotong konsumsi daya secara signifikan, kadang-kadang kurang dari seperlima dari daya cpu-alone, dengan memungkinkan frekuensi operasi yang lebih rendah dan komputasi yang lebih efisien [5].
** 3. Melepas beban kerja CPU dan memungkinkan aplikasi yang lebih kompleks
Dengan menangani tugas -tugas khusus seperti pemrosesan kriptografi, multiplikasi matriks, atau inferensi pembelajaran mesin, akselerator membebaskan CPU untuk fokus pada fungsi sistem lainnya. Pembongkaran ini tidak hanya meningkatkan throughput keseluruhan tetapi juga memungkinkan integrasi fitur yang lebih canggih dan aplikasi kompleks tanpa membebani prosesor utama [8].
** 4. Fleksibilitas dan kemampuan beradaptasi dalam desain sistem
Beberapa akselerator, seperti FPGA, menawarkan daya komputasi tinggi dan efisiensi energi, membuatnya cocok untuk tugas akselerasi yang fleksibel di tepi jaringan. Menyebarkan akselerator memungkinkan sistem untuk dirancang untuk beban kerja tertentu, menyeimbangkan kinerja, daya, dan kendala biaya secara efektif [4] [5].
** 5. Tantangan dan manajemen tingkat sistem
Heterogenitas yang diperkenalkan oleh akselerator membutuhkan dukungan sistem dan sistem operasi yang cermat untuk mengalokasikan sumber daya secara efisien dan menjadwalkan tugas. Manajemen yang tepat memastikan bahwa akselerator digunakan secara optimal, memaksimalkan manfaat kinerja mereka sambil mempertahankan stabilitas sistem dan efisiensi daya [7].
** 6. Pengurangan pergerakan data dan overhead komunikasi
Dalam akselerator yang dirancang untuk tugas-tugas seperti multiplikasi matriks, penggunaan kembali data on-chip dan buffering yang efisien mengurangi kebutuhan akan transfer data yang sering antara memori dan elemen pemrosesan, meminimalkan bottleneck bandwidth dan biaya energi yang terkait dengan pergerakan data [10].
Singkatnya, menggunakan akselerator meningkatkan kekuatan komputasi sistem dengan memungkinkan eksekusi tugas khusus yang lebih cepat dan lebih hemat energi, membebaskan sumber daya CPU, dan memungkinkan beban kerja yang lebih kompleks dan menuntut. Ini menghasilkan perolehan kinerja yang signifikan dan penghematan daya, terutama penting dalam lingkungan komputasi tertanam, tepi, dan kinerja tinggi [4] [5] [7] [8] [10].
Kutipan:
[1] https://www.ultralytics.com/blog/understanding-the-mpact-of-compute-power-on-ai-innovations
[2] https://premioinc.com/blogs/blog/performance-accelerators-in-the-context-of-computing-hardware
[3] http://www.dre.vanderbilt.edu/~gokhale/www/papers/hotedge20_hwaccelreco.pdf
[4] https://www.sciencedirect.com/science/article/abs/pii/s006524582300075x
[5] https://cdrdv2-public.intel.com/650470/wp-01112-hw-reduce-power.pdf
[6] https://www.usenix.org/system/files/osdi24-ma-jiacheng.pdf
[7] https://scail.cs.wisc.edu/papers/hotpar12_rinnegan.pdf
[8] https://www.appviewx.com/blogs/hardware-cryptographic-accelerators-to-enhance-security-without-slowing-down/
[9] https://publications.ics.forth.gr/tech-reports/2018/2018.tr473_accelerator_deployment_models_heterogeneous_processing.pdf
[10] https://pmc.ncbi.nlm.nih.gov/articles/pmc11767631/