Laitteistokiihdyttimien käyttöönotto parantaa merkittävästi järjestelmän laskennallista tehoa purkamalla tiettyjä, laskennallisesti intensiivisiä tehtäviä yleiskäyttöisen suorittimen erikoistuneisiin laitteistoyksiköihin, jotka on suunniteltu näille tehtäville. Tämä johtaa useisiin keskeisiin vaikutuksiin järjestelmän suorituskykyyn ja tehokkuuteen:
** 1. Lisääntynyt suorituskyky rinnakkaisuuden ja erikoistumisen kautta
Kiihdyttimet on suunniteltu suorittamaan tietyt toiminnot paljon nopeammin kuin suorittimet hyödyntämällä rinnakkaisuutta ja erikoistuneita piirejä. Esimerkiksi laitteistojen salauskisankiihdyttimet voivat käsitellä monia salausoperaatioita samanaikaisesti suorittamalla tehtävät paljon nopeammin kuin suorittimen, joka käsittelee niitä peräkkäin. Tämä erikoistuminen antaa kiihdyttimille mahdollisuuden toimittaa dramaattisia nopeuksia tavoitekuormilleen, mikä parantaa usein suorituskykyä suuruusluokoilla verrattuna vain suorittimen suorittamiseen [8] [5] [7].
** 2. Parantunut energiatehokkuus
Vastoin perinteistä uskomusta, että laitteiston lisääminen lisää virrankulutusta, huolellisesti suunnitellut kiihdyttimet voivat vähentää järjestelmän kokonaisvoimaa. Tämä johtuu siitä, että kiihdyttimet voivat suorittaa toimintoja tehokkaammin, vaatii vähemmän kellosyklejä ja antaa järjestelmän suorittaa alhaisemmilla kellotaajuuksilla säilyttäen tai parantamalla suorituskykyä. Esimerkiksi kiihdyttimien lisääminen sulautettuun järjestelmään vähensi suoritussykliä lähes 90-kertaisesti ja leikkaa virrankulutusta merkittävästi, joskus alle viidennekseen prosessorin pelasta, mahdollistamalla pienemmät käyttötaajuudet ja tehokkaampi laskenta [5].
** 3. Prosessorin työmäärän poistaminen ja monimutkaisempien sovellusten mahdollistaminen
Käsittelemällä erikoistuneita tehtäviä, kuten salausprosessointia, matriisin kertolaskua tai koneoppimisen päätelmiä, kiihdyttimet vapauttavat prosessorin keskittymään muihin järjestelmätoimintoihin. Tämä purkaminen ei vain lisää läpimenoaikaa, vaan mahdollistaa myös edistyneempien ominaisuuksien ja monimutkaisten sovellusten integroinnin pääprosessorin ylikuormittamiseen [8].
** 4. Joustavuus ja sopeutumiskyky järjestelmän suunnittelussa
Jotkut kiihdyttimet, kuten FPGA, tarjoavat sekä korkean laskennallisen tehon että energiatehokkuuden, mikä tekee niistä sopivia joustaviin kiihtyvyystehtäviin verkkojen reunalla. Kiihdyttimien käyttöönotto mahdollistaa järjestelmien räätälöinnin tietyille työmäärille, tasapainottaa suorituskykyä, tehoa ja kustannusrajoituksia tehokkaasti [4] [5].
** 5. Haasteet ja järjestelmätason hallinta
Kiihdyttimien ottama heterogeenisyys vaatii huolellista järjestelmää ja käyttöjärjestelmän tukea resurssien jakamiseksi tehokkaasti ja ajoittaa tehtävät. Oikea hallinta varmistaa, että kiihdyttimiä käytetään optimaalisesti, maksimoimalla niiden suorituskyvyn edut säilyttäen samalla järjestelmän vakautta ja tehon tehokkuutta [7].
** 6. Tietojen liikkumisen ja viestinnän yleiskustannusten vähentäminen
Tehtävissä, kuten matriisin kertolaskuissa, suunnitellut kiihdyttimet, sirujen uudelleenkäyttö ja tehokas puskurointi vähentävät tiedonsiirtojen tarvetta muisti- ja prosessointiolementtien välillä, minimoimalla kaistanleveyden pullonkaulat ja tiedon liikkeeseen liittyvät energiakustannukset [10].
Yhteenvetona voidaan todeta, että kiihdyttimien käyttöönotto parantaa järjestelmän laskennallista voimaa mahdollistamalla erikoistuneiden tehtävien nopeammat, energiatehokkaamman suorittamisen, prosessoresurssien vapauttamisen ja monimutkaisemman ja vaativamman työmäärän sallimisen. Tämä johtaa merkittäviin suorituskyvyn voittoihin ja tehonsäästöihin, erityisen tärkeisiin sulautetuissa, reuna- ja korkean suorituskyvyn laskentaympäristöissä [4] [5] [7] [8] [10].
Viittaukset:
.
[2] https://premioinc.com/blogs/blog/performance-accelerators-in-the-context-of-computing-hardware
[3] http://www.dre.vanderbilt.edu/~gokhale/www/papers/hotedge20_hwaccelreco.pdf
[4] https://www.sciencedirect.com/science/article/abs/pii/s006524582300075x
[5] https://cdrdv2-public.intel.com/650470/wp-01112-hw-reduce-power.pdf
[6] https://www.usenix.org/system/files/osdi24-ma-jiacheng.pdf
[7] https://scail.cs.wisc.edu/papers/hotpar12_rinnegan.pdf
.
[9] https://publications.ics.forth.gr/tech-reports/2018/2018.tr473_accelerator_deployment_models_heterogeneous_processing.pdf
[10] https://pmc.ncbi.nlm.nih.gov/articles/PMC11767631/