さくらインターネットに間借りしている3台のサーバインスタンスのうち,cs-tklab2は卒研で使っている関係上,アップグレードを先延ばしにしていましたが,本日先ほど,Ubuntu 22.04LTSから24.04LTSへ更新完了しました。一応ApacheもPHP (7.4→8.3)も動いているようですが,不都合あるようでしたらチマチマ直していきます。
卒研テーマ例)Arm CPU向け可変長精度計算高速化
Arm CPU向けの可変長精度計算,特にBLASレベルの高速化を希求する。SVEが使える環境は,コンシューマレベルでは2025年2月現在なさそうで,AWSとか不老とか富岳を使う必要があるが,とりあえず128bit SIMDのNEONから対応を考える。比較検討するのは同じく128bitの下記二つ。
- WASM SIMD
- SSE
BNCmatmulの書き換えが必要になりそうだけど,それよりはC++でTemplateライブラリにしてMPBLASに合わせた方が良さげ。
Copilot+PC仕様のWindowsマシン上でWSL環境とかVisual Studio環境がまともに動くようならこれ使うけど,基本,Rasberry Piでいいんじゃないかなと。とりあえず1台買ったので,まずはBNCmatmulのコンパイルができるところまでは持っていくつもり。
卒研テーマ例)MPIBNCmatmulの実装と性能評価
卒研というより,教員個人研究の延長線上のテーマですが,現状のBNCmatmulのOpenMP並列化された基本線形計算の機能を,分散メモリ並列環境のMPIに対応させるという,単純ですが労力のかかるテーマです。MPIBNCpackという先行ライブラリがあり,MPFR任意精度計算は対応済み。あとはDD, TD, QDといったマルチコンポーネント固定精度計算部分をMPI化するというのがメインの開発になります。あとはBLAS1, 2, 3のベンチマークテストをスパコン上で行うという,これも結構面倒なものになりますが,Python化しておけば楽なので,検証用スクリプト開発が核心になりそう。