![]() |
1
6
似乎BLAS实现由 the default libblas-dev package 对于Ubuntu 14.04(可能还有其他Ubuntu发行版),包含了对某些矩阵元素为零的情况的优化。 对于Ubuntu 14.04,BLAS(和cblas)实现/包的源代码可以从 here .
解压缩该存档后,我们有一个
对于cblas_sgemm,当参数
请注意,对于此行主调用
当我们在中检查相应的fortran例程时
上面是处理以下情况的代码段:
跳过这个do循环可以使以这种方式实现的sgemm函数在
从实验上看,并不是所有的blas实现都有这种优化。在完全相同的平台上测试,但使用
请注意,此处的fortran(77)代码似乎与旧版本的
|
![]() |
CodeRider · Ubuntu中的HR架构 6 年前 |
![]() |
sander · 如何通过http连接到ubuntu服务器? 7 年前 |
![]() |
M.Bwe · 从php脚本ubuntu更新、复制文件 7 年前 |
![]() |
user3162878 · 没有目录,使用主页登录=/ 7 年前 |