もっと見る

ずっとCortex-A9をいじってるのでA53でも速くて羨ましいよ(?)

おるみんさん、世界を裏から操る裏帝だったのか…やはり…

最初にUbuntu使ったの、Karmic Koalaとかだから、もうちょっとでアルファベット一周するな…

Intelの新命令マニュアル読めば書いてあるけど、前回読んだの何ヶ月か前なので変わってるかも

Skylake-SPとかでAVX512でスループット倍!みたいな話はありますが実はAVX2のスループットも増えているため倍ではない(しなんならAVX512使うとクロックがより落ちる)

AMXって今のとことbfloat16/int16/int8ぐらいしか無くなかった?

てかあれって1コアに1個あれが入るの?

Intel AMX、こんなの入れちゃうんだ…みたいな思いはある

マスクレジスタとかscatterとかconflict detectionとかのおかげ

SIMTっぽいプログラミングもできるようになったし

AVX512、いろいろ入るとAVX2までではベクトル化出来なかったいろいろな処理がベクトル化できるようになるというのはある

SSEだと単精度は倍精度の2倍のスループットでるし、単精度でいい時は単精度にすべき(?)

SSE推奨はそうだし、x86_64なら無条件でSSE2まで入ってるから変な場合を除いてx87を使う理由はなさそう

x87命令今も動くけどそういう話ではなく?

そすうぽよ :poyo: :sabakan: さんがブースト

倍精度、kb10uyさんがいうように制度が高いわけではないけれどダイナミックレンジが広い場合も使う

これは逆に科学計算が倍精度メインで四倍精度マシンとかがほぼない理由でもあって、現実のデータの有効数字はすごいやつでも10桁とかそこらなので、倍精度で足りがち

単精度でも24bit程度の精度があるわけで、これで足りないのは元データの有効数字がめっちゃ桁数ある、とかの場合になりそう

もっと見る
Mastodon @ Poyo server

Mastodonぽよ鯖 かわいい絵文字もあるよ!ぽよぽよしていってね!