精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

SIMD能力初體驗,你了解多少?

商務辦公
SIMD技術在大數據和機器學習領域有非常廣泛的應用。Clickhouse為什么快,NumPy為什么快,背后都離不開SIMD技術的支持。那么SIMD到底是什么呢,我們來看看。

SIMD,Single Instruction Multiple Data,是一種在CPU指令級別支持的并行處理技術。大家最早聽說這個詞,應該是在《計算機組成原理》的課上。

為了體現出區別,我們先看最簡單的模式:Single Instruction Single Data (SISD)。這種模式下,一個單核CPU接收并執行一條指令。該指令只加載內存單元里的一條數據到寄存器,然后進行處理。

Single Instruction Single Data

SIMD模式下,CPU的寄存器通常比較大,比如128bit,目前最新已支持到512bit。如果我們使用512bit寄存器,那么一次性就可以加載8個int64數字,以并行度=8的速度進行計算:

Single Instruction Multiple Data

當然,還有兩個分類 MISD 和 MIMD,這里就不細說了。

Intel CPU對SIMD的支持

Intel CPU通過擴充指令集提供了對SIMD的支持。按照出現順序,總共有三套:MMX、SSE 和 AVX:

我們可以通過Intel官方網站查詢自己的處理器是否支持(地址附在文章末尾)。下面以MacOS為例,簡單看一下。通過sysctl查看CPU型號:

sysctl -a | grep brand 
machdep.cpu.brand_string: Intel(R) Core(TM) i7-1068NG7 CPU @ 2.30GHz
machdep.cpu.brand: 0

下面是查詢結果,可見主流的SSE和AVX指令集都是支持的:

那么這些指令集怎么用呢?Intel官方提供了一套C語言庫,并且有詳細的函數文檔,名字為 "Intel? Intrinsics Guide"。

這些函數有明確的命名規范,由三段構成,分別是:

  1. _mm<位數>_mm 128bit,_mm256 256bit,_mm512 512bit。
  2. _<運算>_add 加, _sub 減,_mul 乘,_div 除,與或非同理。
  3. _<原始類型>_epi16 int16, _epi32 int32, _ps float32, _pd float64。

比如我想看下256bit下的加法,搜索 mm256_add 會返回一組函數:

接下來我們用這些指令來看看下性能吧。

準備工作

由于要做性能測試,編程語言是C/C++,所以選擇 google/benchmark 作為輔助。測試場景是兩個100w條數據的數組做加法,數組里的元素可以是int32、float32、int64等。后面我們采用float32進行測試。

google/benchmark 跟著Github上"Installation" 部分走就好了,最后必須執行安裝這一步:

sudo cmake --build "build" --config Release --target install

編寫代碼:

先寫一段比較正常的單測代碼,通過 #include <immintrin.h>可使用SIMD的能力。準備工作包括:

  1. 初始化3個長度為100w的數組 a、b、c, _mm_malloc負責內存分配。
  2. 對 a 和 b 進行初始化。

計算邏輯是 c = a + b,跑多少輪次由 benchmark::State &state 來控制。代碼如下:

#include <immintrin.h>
#include <benchmark/benchmark.h>

constexpr int N = 1000000;

static void normal(benchmark::State &state)
{
    float *a = static_cast<float *>(_mm_malloc(sizeof(float) * N, 16));
    float *b = static_cast<float *>(_mm_malloc(sizeof(float) * N, 16));
    float *c = static_cast<float *>(_mm_malloc(sizeof(float) * N, 16));
    for (int i = 0; i < N; ++i)
    {
        a[i] = i;
        b[i] = 2 * i;
    }

    for (auto _ : state)
    {
        for (int i = 0; i < N; ++i)
        {
            c[i] = a[i] + b[i];
        }
    }

    _mm_free(a);
    _mm_free(b);
    _mm_free(c);
}

BENCHMARK(normal);

我們將文件命名為 benchmark_float32.cpp。編譯并執行:

g++ -Wall -std=c++20 -msse4 -mavx512f -mavx512bw benchmark_float32.cpp -pthread -lbenchmark -o benchmark_float32

由于需要支持sse4 avx512,編譯時需要加上 -msse4 -maxv512f -mavx512bw。運行 ./benchmark_float32 結果如下:

2023-06-17T18:30:04+08:00
Running ./benchmark_float32
Run on (8 X 2300 MHz CPU s)
CPU Caches:
  L1 Data 48 KiB
  L1 Instruction 32 KiB
  L2 Unified 512 KiB (x4)
  L3 Unified 8192 KiB
Load Average: 3.24, 3.72, 4.09
-----------------------------------------------------
Benchmark           Time             CPU   Iterations
-----------------------------------------------------
normal        1821404 ns      1812256 ns          386

到當前為止,測試能夠跑起來了。我們再加一個 128bit 計算的支持。這需要3個函數:

  1. _mm_load_ps 將4個打包的float32加載到一個__m128類型的變量里。
  2. _mm_add_ps 對2個 __m128類型的變量做加法。
  3. _mm_store_ps 將1個__m128類型的變量存到一個float32*指向的內存里。

組裝起來就是:

for (int i = 0; i < N; i += 4)
{
    __m128 v1 = _mm_load_ps(a + i);
    __m128 v2 = _mm_load_ps(b + i);
    __m128 v3 = _mm_add_ps(v1, v2);
    _mm_store_ps(c + i, v3);
}

由于一個 __m128類型的變量可以容納4個float32,所以 i 每次加4。

同樣的方法,我們可以把 __m256 和 __m512 都納入測試,測試結果如下:

可以發現,這些擴容指令集的執行性能還是不錯的,不過由于load和store需要額外的時間,并沒有倍數的提升。

同樣的方式,我們拿 int32 和 int64 進行測試,測試結果如下:

我們看 Iterations 這個指標,這個指標越大,說明運行速度越快。我們將不同類型匯總成表格:

Iterations

float32

int32

int64

float32-O3

int64-O3

normal

388

383

361

1541

516

sse128

573

709

345

1441

2716

avx256

943

1176

550

1435

2959

avx512

1791

1872

759

6611

2601

可以發現,float32 和 int32 的迭代輪次逐個增加,而int64 在sse128和normal模式下基本持平,avx256和avx512呈現增加趨勢??赡茉蚴窃趕se128模式下,計算速度理論上增加100%,load和save的時間抵消了計算速度的收益。

另外,在編譯時開啟 -O3 最高級別的編譯優化之后, int64 在 SIMD下提速非常明顯,float32只有在 avx512模式下有明顯提速。

除了簡單的加減乘除,SSE 和 AVX 能夠支持很多形式的計算,包括但不限于:位運算、類型轉換、比較、加密算法、數學函數、統計函數、隨機數、字符串等,完整列表可參考 "Intel? Intrinsics Guide"。由于只是學習目的,并沒有對所有這些函數進行測試。

問了下ChatGPT “SIMD的劣勢”,給出的回復如下:

  • 需要特定的硬件支持:SIMD指令是由CPU硬件支持的,需要特定的硬件支持才能使用。如果CPU不支持SIMD指令集合,就無法使用SIMD指令。
  • 編碼復雜度高:使用SIMD指令需要對指令集有深入的了解和熟練運用,編碼過程相對比較復雜。
  • 數據結構限制:SIMD指令適用于處理順序存儲的數據,并且需要按照一定的方式將數據打包。因此,在某些情況下,需要進行數據結構的轉換才能使用SIMD指令。
  • 無法處理分支:SIMD指令是在數據流上進行操作,不能直接處理分支,需要將分支轉換為數據流并按照特定的方式處理分支。
  • 容易出現精度誤差:使用SIMD指令進行高精度計算時,可能會出現精度誤差。這是由于浮點數精度有限,并且處理過程中可能會將數據轉換為其他精度的數據類型而導致的。

單純從應用上來看,Clickhouse啟發了一眾大數據處理框架對SIMD能力的引入、NumPy庫的引入,還有多媒體領域的廣泛使用,我們有理由相信SIMD帶來的性能收益。

Clickhouse具體做了哪些優化,對SIMD的能力的應用有多充分,后面了解完再補充。

查詢CPU信息:
https://ark.intel.com/content/www/us/en/ark.html。

責任編輯:姜華 來源: 今日頭條
相關推薦

2020-03-25 08:47:22

智能邊緣邊緣計算網絡

2009-08-01 09:06:35

UbuntuOneLinux開源操作系統

2009-03-09 15:12:39

XenServer安裝

2023-10-29 08:35:47

AndroidAOP編程

2012-12-27 10:58:24

KVMKVM概念

2021-06-06 18:22:04

PprofGopher邏輯

2023-10-25 08:17:06

Lite模式代理類

2022-06-07 07:37:40

線程進程開發

2011-08-23 11:03:35

ATM

2023-09-07 10:26:50

接口測試自動化測試

2022-02-08 12:06:12

云計算

2019-08-07 17:18:18

云計算云原生函數

2025-01-16 10:41:40

2023-07-15 08:01:38

2015-11-09 10:44:37

DevOpsIT運維

2021-12-09 07:47:58

Flink 提交模式

2020-12-10 09:00:00

開發.NET工具

2023-12-24 12:56:36

協程

2023-08-17 10:12:04

前端整潔架構

2010-11-22 10:31:17

Sencha touc
點贊
收藏

51CTO技術棧公眾號

亚洲精品白虎| 国产suv精品一区二区| 日韩久久久久久久久久久| 牛牛在线精品视频| 久久青草欧美一区二区三区| 国产精品久久一区主播| 青青草国产在线观看| 神马午夜久久| 51精品国自产在线| 亚洲国产精品久久久久婷蜜芽 | 精品久久五月天| 国产淫片免费看| 黄网站免费在线播放| 99久久综合国产精品| 国产精品热视频| 日本一区二区欧美| 91免费精品| 国产视频精品一区二区三区| 亚洲精品永久视频| 亚洲精品mv| 夜夜嗨av一区二区三区| 亚洲精品影院| 欧美理论在线观看| 成人动漫一区二区在线| 成人激情视频在线| 蜜臀99久久精品久久久久小说| 中文视频一区| 中文字幕亚洲在线| 白丝女仆被免费网站| 亚洲精品视频一二三区| 91麻豆精品国产综合久久久久久| 亚洲中文字幕无码不卡电影| 国产网红女主播精品视频| 中文字幕一区二区三区视频 | 熟妇人妻中文av无码| 狠狠色丁香婷综合久久| 国产精品劲爆视频| 日韩三级一区二区| 国产亚洲激情| 136fldh精品导航福利| 国产污视频在线看| 黑丝一区二区| 欧美丰满少妇xxxxx做受| 又色又爽的视频| 国内成人精品| 亚洲人成在线观看| 熟女高潮一区二区三区| 日韩在线麻豆| 亚洲免费影视第一页| 国产真实乱人偷精品| 凹凸av导航大全精品| 精品区一区二区| 国产精九九网站漫画| 日韩欧美久久| 亚洲第一av网站| 中文字幕乱码一区| 欧美一区 二区| 亚洲国产婷婷香蕉久久久久久| 亚洲无人区码一码二码三码| 视频精品一区| 亚洲激情自拍图| 一女三黑人理论片在线| 日韩系列在线| 亚洲性夜色噜噜噜7777| 欧美波霸videosex极品| 日本电影一区二区| 精品国产一区久久久| 一区二区三区影视| 欧美福利在线| 性视频1819p久久| 日日夜夜狠狠操| 蜜桃视频一区二区三区在线观看| 国产精品爽爽爽| 国产模特av私拍大尺度 | 91夜夜揉人人捏人人添红杏| 99久久精品国产成人一区二区| 国产一区二区三区精品欧美日韩一区二区三区 | 寂寞少妇一区二区三区| 91黄在线观看| 亚洲 国产 欧美 日韩| 久久精品一二三| 中国成人亚色综合网站| 人妖欧美1区| 日韩欧美主播在线| 伊人色在线观看| 成人av动漫| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 东京干手机福利视频| 99re这里只有精品首页| 亚洲欧洲三级| 草草在线视频| 精品视频999| 无码国产69精品久久久久网站| 国产精品中文字幕亚洲欧美| 九九热99久久久国产盗摄| 一级片中文字幕| 久久99国产精品久久99| 国产伦理久久久| 欧洲不卡av| 午夜av区久久| 三日本三级少妇三级99| 亚洲黄色录像| 美女少妇精品视频| 亚洲无码精品一区二区三区| 国产成人无遮挡在线视频| 欧美精品亚洲精品| 亚洲色图美国十次| 在线观看视频一区二区欧美日韩| 无人码人妻一区二区三区免费| 偷拍亚洲精品| 欧美激情xxxxx| 91精品视频免费在线观看| aa级大片欧美| 8x8x华人在线| 国产精品久久久久久吹潮| 亚洲成人a**站| 久久成人小视频| 久久久噜噜噜| 国产伦视频一区二区三区| 日本www在线观看视频| 日韩欧中文字幕| 黄色性视频网站| 一区二区三区四区在线观看国产日韩 | 欧美日韩精品免费在线观看视频| 污污的网站在线免费观看| 欧美视频中文字幕| mm131美女视频| 亚洲精品日韩久久| 亚洲一区二区三区乱码aⅴ蜜桃女 亚洲一区二区三区乱码aⅴ | 日韩久久久精品| 日本不卡一二区| 全国精品久久少妇| 欧美一区二区三区四区夜夜大片| 超碰中文在线| 日韩免费观看高清完整版在线观看| 影音先锋男人看片资源| 石原莉奈一区二区三区在线观看| 国产精品制服诱惑| 激情影院在线| 精品国产乱码久久久久久久久| 欧美另类videoxo高潮| 久久国产精品免费| 亚洲欧美久久234| 成人av色网站| 日韩在线免费观看视频| 黄色av一区二区| 欧美激情综合五月色丁香小说| 亚洲成熟丰满熟妇高潮xxxxx| 西野翔中文久久精品字幕| 午夜美女久久久久爽久久| 好男人www在线视频| 亚洲午夜日本在线观看| 国产精品无码自拍| 亚洲国产清纯| 看欧美日韩国产| 日韩精品99| 一区二区三区视频观看| 影音先锋国产在线| 一色屋精品亚洲香蕉网站| 久久精品国产露脸对白| 综合国产在线| 国产精品裸体一区二区三区| 国产福利电影在线播放| 亚洲国产日韩欧美在线99| 国产毛片aaa| 国产欧美一区二区精品性色| 精品日韩久久久| 欧美在线三级| 狠狠色综合一区二区| 综合日韩av| 中文字幕久久精品| 国产精品无码天天爽视频| 亚洲一区二区3| 日本黄色特级片| 久久精品999| 黑人巨茎大战欧美白妇| 日本一区福利在线| 国产精品久久久久久久久久久久 | 黑人操亚洲女人| 日韩欧美在线视频日韩欧美在线视频 | 国产精品爽爽久久| 偷拍一区二区三区四区| 法国空姐电影在线观看| 精品一区二区三区免费观看| 一级性生活视频| 色婷婷av一区二区三区丝袜美腿| 国产精品久久久久久久久久ktv| 国产三级在线播放| 精品无人国产偷自产在线| 亚洲视频一区在线播放| 亚洲综合999| 精品人妻中文无码av在线 | 999国内精品视频在线| 999av小视频在线| 在线看日韩欧美| 狠狠人妻久久久久久综合麻豆| 色婷婷精品久久二区二区蜜臀av| 欧美精品久久久久久久久46p| www.av精品| 亚洲视频一二三四| 亚洲免费婷婷| www插插插无码免费视频网站| 久久av电影| 国产成人成网站在线播放青青| 人人鲁人人莫人人爱精品| 久久99精品久久久久久噜噜| 国产福利电影在线| 亚洲国产欧美一区| 国产成人久久精品77777综合| 欧美日韩国产综合视频在线观看中文 | 三年中国国语在线播放免费| 红桃视频国产精品| 亚洲一区二区三区精品视频| 色老板在线视频一区二区| 97久久精品午夜一区二区| 2019年精品视频自拍| 午夜精品视频在线| 欧美草逼视频| 日韩性生活视频| 成人免费视频| 日韩国产欧美精品在线| 午夜精品久久久久久久99老熟妇| 欧美日韩一区二区电影| 亚洲不卡视频在线观看| 亚洲国产美女搞黄色| 我要看黄色一级片| 中日韩免费视频中文字幕| 黄色性生活一级片| 不卡大黄网站免费看| 日本少妇xxxx软件| 国产精品正在播放| 成人性生交视频免费观看| 美腿丝袜亚洲三区| 青青草精品视频在线观看| 免费亚洲视频| 超碰97人人射妻| 免费久久99精品国产自在现线| 成年人看的毛片| 亚洲无吗在线| 国产欧美精品aaaaaa片| 国产一区清纯| 久久久久久av无码免费网站下载| 欧美成人69| 欧美一级爱爱视频| 国产主播一区| 91午夜在线观看| 在线精品亚洲| 久久久999视频| 亚欧美中日韩视频| 国模吧无码一区二区三区| 久久99伊人| 一级特黄性色生活片| 日韩二区在线观看| 亚欧美在线观看| 久久99国产精品久久| 色婷婷一区二区三区在线观看| 国产一区二区三区精品视频| 亚洲一区二区三区三州| 国产福利一区二区三区| 婷婷五月精品中文字幕| 99精品欧美一区二区三区小说| 亚洲一区二区三区无码久久| 2017欧美狠狠色| 国产黄色大片免费看| 国产精品久久久久久久第一福利| 国产精品夜夜夜爽阿娇| 亚洲综合在线免费观看| 日本学生初尝黑人巨免费视频| 欧美日韩中文字幕| 天天干天天插天天射| 欧美日韩精品是欧美日韩精品| 99精品久久久久久中文字幕| 亚洲精品一线二线三线无人区| 视频二区在线| 中文字幕久热精品视频在线| 欧美高清视频| 97婷婷大伊香蕉精品视频| 欧美黑人国产人伦爽爽爽| 色在线视频观看| 成人高清视频观看www| 成午夜精品一区二区三区软件| 国产另类自拍| 久久高清免费| 日韩a级在线观看| 日韩精彩视频在线观看| 天天操精品视频| av电影一区二区| 免费91在线观看| 激情久久av一区av二区av三区| 啪啪小视频网站| 欧美zozo另类异族| 国产免费永久在线观看| 九九九久久国产免费| 日韩精品一区二区三区| 91精品入口蜜桃| 不卡在线一区| 97国产在线播放| 韩国欧美国产一区| 青青草福利视频| 亚洲国产日日夜夜| 中文字幕永久免费视频| 亚洲电影天堂av | 中文字幕亚洲不卡| 九九九在线观看| 日韩片之四级片| 在线激情网站| 欧亚精品中文字幕| 51亚洲精品| 一区二区精品在线观看| 久久久999| 亚洲av熟女高潮一区二区| 成人欧美一区二区三区白人| 黄色片中文字幕| 亚洲成av人片在线观看香蕉| 黄色成人影院| 国产精品视频xxxx| 精品在线手机视频| 免费看欧美黑人毛片| 国产自产v一区二区三区c| 法国空姐电影在线观看| 精品国产乱码久久久久久婷婷| 精品国产区一区二| 色多多国产成人永久免费网站 | 国产一区二区精品在线| 围产精品久久久久久久| 一级在线免费视频| 久久人人爽人人爽| 男女啊啊啊视频| 亚洲成色www8888| 人人超在线公开视频| 91久久爱成人| 欧美韩国一区| 日本高清免费观看| 国产精品进线69影院| 成人黄色三级视频| 尤物九九久久国产精品的分类 | 亚洲黄色影片| 国产国语老龄妇女a片| 亚洲免费在线观看| 国产精品污视频| 欧美成人中文字幕在线| 日韩精品成人| 精品人妻大屁股白浆无码| 国产呦精品一区二区三区网站| 国产真实乱在线更新| 欧美酷刑日本凌虐凌虐| 欧美成年黄网站色视频| 国产女同一区二区| 99久久婷婷| 一级日本黄色片| 一区二区三区精品视频| 亚洲av无码乱码国产精品久久| 欧美乱大交xxxxx| 在线日韩成人| 无码人妻精品一区二区三区在线| 91网页版在线| 无码一区二区三区| 日韩中文字幕在线视频播放| 粉嫩av国产一区二区三区| 男同互操gay射视频在线看| 国产一区二区在线看| 麻豆亚洲av成人无码久久精品| 欧美精品一区二区三区一线天视频 | 久久免费成人精品视频| 麻豆成人入口| 亚洲激情在线观看视频| 国产精品国产三级国产aⅴ中文| 国产精品一区二区人人爽| 久久97精品久久久久久久不卡| av成人综合| www.四虎成人| 中文字幕一区二区三区在线播放| 亚洲a视频在线观看| 91精品国产91久久久久久最新 | 国产成+人+综合+亚洲欧美| 在线视频不卡国产| 成人在线视频一区二区| 手机在线看片1024| 日韩亚洲在线观看| 噜噜噜天天躁狠狠躁夜夜精品 | 伊人久久大香线蕉综合影院首页| 国产911在线观看| 久久综合久久综合久久| 国产乱淫av片免费| 欧美黑人性视频| 欧美性感美女一区二区| 亚洲精品一二三四| 一本到不卡免费一区二区| 97超碰资源站在线观看| 就去色蜜桃综合| 国产乱一区二区| 黄色片视频免费| 久操成人在线视频| 欧美精选视频在线观看| 绯色av蜜臀vs少妇| 在线观看不卡一区| 欧美精品videossex少妇| 色就是色欧美| www.66久久| 国产人妖一区二区三区|