AVX指令集的詳解

一、AVX指令集補丁

AVX指令集是Intel公司於2011年推出的一種SIMD指令集，它可以實現8個雙精度浮點數或16個單精度浮點數的並行計算，從而加快向量運算的速度。但是，在使用AVX指令集時，有時候會出現處理器缺陷、操作系統錯誤或虛擬機中斷等問題。為了解決這些問題，Intel發布了AVX指令集補丁。

使用AVX指令集的程序需要在寄存器和內存中存儲更多的數據，因此會增加內存帶寬和CPU功耗，可能導致CPU降頻。AVX指令集補丁可以通過優化代碼的方式降低CPU功耗，從而使CPU不會出現降頻現象。

下面是一個使用AVX指令集的示例代碼，可以通過使用AVX指令集補丁來降低CPU功耗：

#include <immintrin.h>
float sum(float *a, int n){
    __m256 vec_sum = _mm256_set1_ps(0.0f);
    for (int i = 0; i < n; i+=8) {
        __m256 vec_a = _mm256_loadu_ps(a+i);
        vec_sum = _mm256_add_ps(vec_sum, vec_a);
    }
    float sum[8] __attribute__((aligned(32)));
    _mm256_store_ps(sum, vec_sum);
    return sum[0] + sum[1] + sum[2] + sum[3]
         + sum[4] + sum[5] + sum[6] + sum[7];
}

二、AVX指令集是什麼意思

AVX指令集（Advanced Vector Extensions）是Intel公司於2011年推出的一種向量擴展指令集，它可以實現更高效的並行計算和處理。AVX指令集在之前的SSE指令集的基礎上增加了更多的指令和功能。

AVX指令集包括256位SIMD指令和128位SIMD指令。其中256位SIMD指令需要使用特定指令擴展集成的CPU才能夠實現，而128位SIMD指令則可以在普通的x86架構CPU上運行。AVX指令集支持單精度浮點數、雙精度浮點數和整數數據類型的向量運算。

下面是一個AVX指令集的示例代碼，用於計算向量的平均值：

#include <immintrin.h>
float avg(float *a, int n){
    __m128 vec_sum = _mm_set1_ps(0.0f);
    for (int i = 0; i < n; i+=4) {
        __m128 vec_a = _mm_loadu_ps(a+i);
        vec_sum = _mm_add_ps(vec_sum, vec_a);
    }
    float sum[4] __attribute__((aligned(16)));
    _mm_store_ps(sum, vec_sum);
    return (sum[0] + sum[1] + sum[2] + sum[3]) / n;
}

三、AVX指令集降頻

使用AVX指令集會增加CPU的功耗和溫度，從而可能導致CPU降頻，影響計算性能。為了降低CPU功耗，可以採取以下幾個措施：

1.儘可能使用更高的製程工藝，以減少功耗和溫度。

2.使用更好的散熱系統，以提高CPU的散熱效果。

3.使用AVX指令集補丁，優化代碼的CPU佔用率，減少功耗和溫度。

4.使用降頻軟體或BIOS設置，降低CPU的頻率，減少CPU的功耗和溫度。

下面是一個使用AVX指令集並進行了降頻優化的示例代碼，可以通過設置CPU的頻率來降低CPU功耗：

#include <immintrin.h>
#include <x86intrin.h>
float sum(float *a, int n){
    __m256 vec_sum = _mm256_set1_ps(0.0f);
    for (int i = 0; i < n; i+=8) {
        __m256 vec_a = _mm256_loadu_ps(a+i);
        vec_sum = _mm256_add_ps(vec_sum, vec_a);
    }
    float sum[8] __attribute__((aligned(32)));
    _mm256_store_ps(sum, vec_sum);
    return sum[0] + sum[1] + sum[2] + sum[3]
         + sum[4] + sum[5] + sum[6] + sum[7];
}
void freq_reduce(){
    const unsigned int MSR_PLATFORM_INFO = 0xCE;
    const unsigned int MSR_IA32_PERF_STATUS = 0x198;
    const unsigned int freq_max = 3000; // original frequency is 3300 MHz
    const unsigned int frequency_reduction = 10; // 10% frequency reduction
    int eax, ebx, ecx, edx;
    __asm__ __volatile__("cpuid"
        : "=a"(eax), "=b"(ebx), "=c"(ecx), "=d"(edx)
        : "a"(0x1), "c"(0x0)
    );
    if (ecx & (1 <= freq_max) {
            unsigned int max_non_turbo_ratio = (eax >> 8) & 0xFF;
            unsigned int logical_proc_number = ((eax >> 16) & 0xFF) + 1;
            unsigned int temperature_target = (ecx >> 16) & 0xFF;
            unsigned int temperature_offset = edx & 0x7F;
            unsigned int frequency_low = (base_frequency * max_non_turbo_ratio
                * (100 - frequency_reduction)) / (100 * logical_proc_number);
            unsigned int msr = ((temperature_offset << 1) & 0xFF)
                | ((temperature_target << 8) & 0xFF00)
                | ((max_non_turbo_ratio << 24) & 0xFF000000);
            __asm__ __volatile__("wrmsr"
                :
                : "c"(MSR_PLATFORM_INFO), "a"(msr), "d"(0)
            );
            __asm__ __volatile__("rdmsr"
                : "=a"(eax), "=d"(edx)
                : "c"(MSR_IA32_PERF_STATUS)
            );
            unsigned int frequency_high = (eax & 0xFF) * base_frequency;
            unsigned int frequency = frequency_low < frequency_high
                ? frequency_low : frequency_high;
            msr = ((msr & 0xFFFFFFFFU) & ~0x1FFU)
                | ((frequency * logical_proc_number) / max_non_turbo_ratio);
            __asm__ __volatile__("wrmsr"
                :
                : "c"(MSR_IA32_PERF_STATUS), "a"(msr), "d"(0)
            );
        }
    }
}
int main(){
    float a[1024];
    for(int i=0;i<1024;i++) a[i]=1.0f;
    freq_reduce();
    for(int i=0;i<1000000;i++) sum(a,1024);
    return 0;
}

四、AES指令集

AES指令集是Intel公司於2010年推出的一種硬體加速指令集，用於加密和解密數據。AES指令集可以在無需外部加密晶元的情況下進行AES加密和解密，從而加快數據處理速度。

AES指令集可以生成隨機數和偽隨機數，以及安全的Hash值，還可以進行SHA加密。使用AES指令集可以有效地保護計算機系統的安全性。

下面是一個使用AES指令集進行AES加密和解密的示例代碼：

#include <wmmintrin.h>
#include <stdio.h>
int main()
{
    __m128i key128 = _mm_set_epi32(0x12345678, 0x90abcdef, 0x87654321, 0xcdef0123);
    __m128i data128 = _mm_set_epi32(0x08070605, 0x04030201, 0x88776655, 0x44332211);
    __m128i encrypted = _mm_aesenc_si128(data128, key128);
    __m128i decrypted = _mm_aesdec_si128(encrypted, key128);
    printf("Encrypted: %08X%08X%08X%08X\n", _mm_extract_epi32(encrypted, 3), _mm_extract_epi32(encrypted, 2), _mm_extract_epi32(encrypted, 1), _mm_extract_epi32(encrypted, 0));
    printf("Decrypted: %08X%08X%08X%08X\n", _mm_extract_epi32(decrypted, 3), _mm_extract_epi32(decrypted, 2), _mm_extract_epi32(decrypted, 1), _mm_extract_epi32(decrypted, 0));
    return 0;
}

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/236294.html

AVX指令集的詳解

一、AVX指令集補丁

二、AVX指令集是什麼意思

三、AVX指令集降頻

四、AES指令集

相關推薦

發表回復