サイトアイコン 高性能計算研究室

卒研テーマ名)QD, GQDへの3倍精度実装の追加と高性能化

Branch-freeアルゴリズムをTDとQDに取り入れたCPU用,GPU(CUDA)用のマルチコンポーネント方式のライブラリを構築し,ベンチマークテストを行ってGitHubにオープンソースとして公開する。MPLAPACK/MPBLASに組み込めることが望ましい。前の奴のブラッシュアップ版。SIMD化,CUDA化とベンチマークテストも含めて二人以上で取り組んでも可。余裕があれば,binary64ベース(DD, TD, QD)だけではなく,binary32ベースのDS, TS, QS実装も欲しい。

参考1)CPU上での多倍長精度浮動小数点演算実装

参考2)GPU(CUDA)上での多倍長精度浮動小数点実装

モバイルバージョンを終了