关键词:
首先声明,本文借鉴自:http://blog.csdn.net/u011314529/article/details/51505029
所以,可参考链接的博文。但原文有个瑕疵就是,cublas.lib错写成了cudlas.lib。
其次,我还是记下我的CUDA8.0的安装和测试过程,是为备忘。
步骤如下:
1.下载安装CUDA:
1.1 下载。请到 cuda官网,选择合适的版本。如果版本不合适,安装的时候会提示的,但还是下载最新的比较好;
1.2 安装。双击cuda_7.5.18_win10.exe,一步步来就好。
2.VS2013配置和测试
2.1 重启计算机。关于是否添加环境变量,笔者安装的时候系统已自动添加好对应的环境变量,如果没有,请查看上文链接的博文;
2.2 配置VS。也请参考上述博文,不再赘述。
3.测试
上两个测试文件。
3.1
1 #include< stdio.h> 2 #include "cuda_runtime.h" 3 #include "device_launch_parameters.h" 4 bool InitCUDA() 5 { 6 int count; 7 cudaGetDeviceCount(&count); 8 if(count == 0) 9 { 10 fprintf(stderr, "There is no device. "); 11 return false; 12 } 13 int i; 14 for(i = 0; i < count; i++) 15 { 16 cudaDeviceProp prop; 17 if(cudaGetDeviceProperties(&prop, i) == cudaSuccess) 18 { 19 if(prop.major >= 1) 20 { 21 break; 22 } 23 } 24 } 25 if(i == count) 26 { 27 fprintf(stderr, "There is no device supporting CUDA 1.x. "); 28 return false; 29 } 30 cudaSetDevice(i); 31 return true; 32 } 33 34 int main() 35 { 36 if(!InitCUDA()) 37 { 38 return 0; 39 } 40 printf("HelloWorld, CUDA has been initialized. "); 41 return 0; 42 }
3.2
1 // CUDA runtime 库 + CUBLAS 库 2 #include "cuda_runtime.h" 3 #include "cublas_v2.h" 4 5 #include <time.h> 6 #include <iostream> 7 8 using namespace std; 9 10 // 定义测试矩阵的维度 11 int const M = 5; 12 int const N = 10; 13 14 int main() 15 { 16 // 定义状态变量 17 cublasStatus_t status; 18 19 // 在 内存 中为将要计算的矩阵开辟空间 20 float *h_A = (float*)malloc (N*M*sizeof(float)); 21 float *h_B = (float*)malloc (N*M*sizeof(float)); 22 23 // 在 内存 中为将要存放运算结果的矩阵开辟空间 24 float *h_C = (float*)malloc (M*M*sizeof(float)); 25 26 // 为待运算矩阵的元素赋予 0-10 范围内的随机数 27 for (int i=0; i<N*M; i++) { 28 h_A[i] = (float)(rand()%10+1); 29 h_B[i] = (float)(rand()%10+1); 30 31 } 32 33 // 打印待测试的矩阵 34 cout << "矩阵 A :" << endl; 35 for (int i=0; i<N*M; i++){ 36 cout << h_A[i] << " "; 37 if ((i+1)%N == 0) cout << endl; 38 } 39 cout << endl; 40 cout << "矩阵 B :" << endl; 41 for (int i=0; i<N*M; i++){ 42 cout << h_B[i] << " "; 43 if ((i+1)%M == 0) cout << endl; 44 } 45 cout << endl; 46 47 /* 48 ** GPU 计算矩阵相乘 49 */ 50 51 // 创建并初始化 CUBLAS 库对象 52 cublasHandle_t handle; 53 status = cublasCreate(&handle); 54 55 if (status != CUBLAS_STATUS_SUCCESS) 56 { 57 if (status == CUBLAS_STATUS_NOT_INITIALIZED) { 58 cout << "CUBLAS 对象实例化出错" << endl; 59 } 60 getchar (); 61 return EXIT_FAILURE; 62 } 63 64 float *d_A, *d_B, *d_C; 65 // 在 显存 中为将要计算的矩阵开辟空间 66 cudaMalloc ( 67 (void**)&d_A, // 指向开辟的空间的指针 68 N*M * sizeof(float) // 需要开辟空间的字节数 69 ); 70 cudaMalloc ( 71 (void**)&d_B, 72 N*M * sizeof(float) 73 ); 74 75 // 在 显存 中为将要存放运算结果的矩阵开辟空间 76 cudaMalloc ( 77 (void**)&d_C, 78 M*M * sizeof(float) 79 ); 80 81 // 将矩阵数据传递进 显存 中已经开辟好了的空间 82 cublasSetVector ( 83 N*M, // 要存入显存的元素个数 84 sizeof(float), // 每个元素大小 85 h_A, // 主机端起始地址 86 1, // 连续元素之间的存储间隔 87 d_A, // GPU 端起始地址 88 1 // 连续元素之间的存储间隔 89 ); 90 cublasSetVector ( 91 N*M, 92 sizeof(float), 93 h_B, 94 1, 95 d_B, 96 1 97 ); 98 99 // 同步函数 100 cudaThreadSynchronize(); 101 102 // 传递进矩阵相乘函数中的参数,具体含义请参考函数手册。 103 float a=1; float b=0; 104 // 矩阵相乘。该函数必然将数组解析成列优先数组 105 cublasSgemm ( 106 handle, // blas 库对象 107 CUBLAS_OP_T, // 矩阵 A 属性参数 108 CUBLAS_OP_T, // 矩阵 B 属性参数 109 M, // A, C 的行数 110 M, // B, C 的列数 111 N, // A 的列数和 B 的行数 112 &a, // 运算式的 α 值 113 d_A, // A 在显存中的地址 114 N, // lda 115 d_B, // B 在显存中的地址 116 M, // ldb 117 &b, // 运算式的 β 值 118 d_C, // C 在显存中的地址(结果矩阵) 119 M // ldc 120 ); 121 122 // 同步函数 123 cudaThreadSynchronize(); 124 125 // 从 显存 中取出运算结果至 内存中去 126 cublasGetVector ( 127 M*M, // 要取出元素的个数 128 sizeof(float), // 每个元素大小 129 d_C, // GPU 端起始地址 130 1, // 连续元素之间的存储间隔 131 h_C, // 主机端起始地址 132 1 // 连续元素之间的存储间隔 133 ); 134 135 // 打印运算结果 136 cout << "计算结果的转置 ( (A*B)的转置 ):" << endl; 137 138 for (int i=0;i<M*M; i++){ 139 cout << h_C[i] << " "; 140 if ((i+1)%M == 0) cout << endl; 141 } 142 143 // 清理掉使用过的内存 144 free (h_A); 145 free (h_B); 146 free (h_C); 147 cudaFree (d_A); 148 cudaFree (d_B); 149 cudaFree (d_C); 150 151 // 释放 CUBLAS 库对象 152 cublasDestroy (handle); 153 154 getchar(); 155 156 return 0; 157 }
特别注意,是cublas.lib,不是cudlas.lib
祝好运。
vs2015配置cuda8.0
...;https://developer.nvidia.com/cuda-downloads2 直接使用默认选项安装 3 设置环境变量: 安装完毕后,在计算机上点右键,打开属性->高级系统设置->环境变量,可以看到系统中多了CUDA_PATH和CUDA_PATH_V8_0两 查看详情
opencv3.2.0+win10+cuda8.0+vs2013编译
...备计算机必须有支持CUDA的NVIDIAGPU,并且装好了驱动程序。安装CUDAtoolkit,本文使用的是CUDA8.0。下载地址下载OpenCV3.2选择的winpack版本,解压到指定文件目录下。下载地址下载安装CMake。版本使用的是cmake-3.10.1-w 查看详情
cuda8.0怎么安装
参考技术A步骤如下:1.下载安装CUDA:1.1下载。请到cuda官网,选择合适的版本。如果版本不合适,安装的时候会提示的,但还是下载最新的比较好;1.2安装。双击cuda_7.5.18_win10.exe,一步步来就好。2.VS2013配置和测试2.1重启计算机。... 查看详情
windows764位机上安装配置cuda75或80+cudnn50操作步骤
...a-installation-guide-microsoft-windows/index.html#axzz4TpI4c8vf 进行安装:在windows7上安装cuda8.0/cuda7.5的系统需求:(1)、ACUDA-capableGPU(本机显卡为GeForceGT640M);(2)、AsupportedversionofMicrosoftWindows(Windows764位);(3)、AsupportedversionofMicrosoftVisualStudio(... 查看详情
同时安装cuda8.0和cuda9.0(代码片段)
...nvidia.com/cuda-90-download-archive建议选择使用 .run 文件安装,因为使用 .deb可能会将已经安装的较新的显卡 查看详情
win10+vs2017+opencv3.4.1+cuda8.0配置
...,因此会出现无法编译的情况试了好多次都失败了,以下配置为vs2017下的截图但在vs2015步骤完全一样。走了一天的坑,最后放弃了使用vs2017从而下载vs015VS2015专业版下载链接http://download.microsoft.com/download/B/8/9/B898E46E-CBAE-4045-A8E2-2D33... 查看详情
[转]windows+vs2013爆详细caffe编译安装教程
1. 安装cuda Cuda是英伟达推出的GPU加速运算平台 我这里安装的是cuda7.5,已经安装过的忽略,还没有安装过的这里有安装教程.windows下面安装还是非常简单的. 点击打开链接 (我的显... 查看详情
windows10+anaconda+tensorflow+cuda8.0环境配置(代码片段)
...ython3.5版本,anaconda2(python2.7)和3(python3.6)都需要额外安装3.5。因为已经装了anaconda2,本教程就用2好啦。1.安装Anaconda 官网地址: https://www.continuum.io/downloads下载完毕后打开安装包,一步一步安装就可以了。注意安装之... 查看详情
windows1064bit下安装tensorflow+keras+vs2015+cuda8.0gpu加速
原文地址:http://www.jianshu.com/p/c245d46d43f0写在前面的话2016年11月29日,GoogleBrain工程师团队宣布在TensorFlow0.12中加入初步的Windows支持。但是目前只支持64位,而且Python版本为3.5版本,需要CUDA8.0。之前Tensorflow对windows的支持并不好,... 查看详情
怎样配置vs2013+qt5开发环境
...上篇《怎样配置VS2013+Qt5开发环境》继续讲解开发环境的安装和设置。安装包下载到本地电脑以后,要首先安装qt5.5.1,然后再安装vs插件,最后启动VS2013进行配置。在本篇,我会将所有需要注意的要点一一向大家介绍。 查看详情
vs2013安装及opencv3.0的配置
vs2013的安装改善计划,不勾选。Windows8 和windowsphone不勾选 然后进行解压安装。(我安装在了e盘的次级目录)安装完成,点击“启动”登陆界面,点击“以后再说”。设置默认环境。在帮助-注册产品中进行密钥激活。B... 查看详情
(转)深度学习主机环境配置:ubuntu16.04+nvidiagtx1080+cuda8.0
...系统,不过是最新的16.04版本,另外在NvidiaGTX1080的基础上安装相关GPU驱动,外加CUDA8.0,因为都比较新, 查看详情
安装cuda9.0+cudnn7.0与cuda8.0共存(代码片段)
...文献:https://blog.csdn.net/weixin_32820767/article/details/80421913一安装cuda9.01.在自己的目录下为cuda9.0新建一个文件夹,用于存放 cuda_9.0.176_384.81 查看详情
cuda8.0如何安装TensorFlow-gpu?
】cuda8.0如何安装TensorFlow-gpu?【英文标题】:HowtoinstallTensorFlow-gpuwithcuda8.0?【发布时间】:2018-07-1213:18:18【问题描述】:我尝试按照官网的说明安装,导致导入tensorflow时出现ImportError:ImportError:libcublas.so.9.0:cannotopensharedobjectfile:No... 查看详情
ubuntu16.04安装cuda8.0(很详尽,包括一些坑的解决方法)
...本篇绝大部分操作需要管理员权限,即sudo,也许不把cuda安装到/usr/lib而是自己的home目录下可 查看详情
caffe在window下编译(windows7,cuda8.0,matlab接口编译)
1.环境:Windows7,Cuda8.0,显卡GTX1080,Matlab2016a,VS2013 (ps:老板说服务器要装windows系统,没办法,又要折腾一番)2.下载caffe包:https://github.com/BVLC/caffe/tree/windows 按照Github上的命令行就行: 这里的Pro 查看详情
vs2013链接sqlserver2012的问题
...,该怎么解决啊??求大神指教。参考技术A你应该是先安装的vs,建议先安装sql再安装vs;或你卸载掉sqlexpress再安装sqlserver,最后配置vs就好了。 查看详情
ubuntu16.04下安装cuda8.0
一、首先安装NVIDIA显卡驱动通过NVIDIA-Linux-x86_64-367.44.run文件安装。1.添加PPA.sudoadd-apt-repositoryppa:graphics-drivers/ppa2.刷新并安装新的驱动程序sudoapt-getupdatesudoapt-getinstallnvidia-367nvidia-settings(如果需要的话,)卸载:删除所有的nvi 查看详情