caffe中使用python的简单介绍

本文目录一览：

1、怎样用python调用已经训练好的caffe
2、新手试运行了一个 caffe 的 Python 代码，出现这个错误是怎么回事
3、caffe的python接口求助
4、caffe中怎么写python层

怎样用python调用已经训练好的caffe

定义CAFFE为caffe跟目录，caffe的核心代码都在$CAFFE/src/caffe 下，主要有以下部分：net, blob, layer, solver.

net.cpp:

net定义网络，整个网络中含有很多layers， net.cpp负责计算整个网络在训练中的forward, backward过程，即计算forward/backward 时各layer的gradient。

layers:

在$CAFFE/src/caffe/layers中的层，在protobuffer (.proto文件中定义message类型，.prototxt或.binaryproto文件中定义message的值) 中调用时包含属性name， type（data/conv/pool…）， connection structure (input blobs and output blobs)，layer-specific parameters（如conv层的kernel大小）。定义一个layer需要定义其setup, forward 和backward过程。

blob.cpp:

net中的数据和求导结果通过4维的blob传递。一个layer有很多blobs， e.g,

对data，weight blob大小为Number * Channels * Height * Width, 如256*3*224*224；

对conv层，weight blob大小为 Output 节点数 * Input 节点数 * Height * Width，如AlexNet第一个conv层的blob大小为96 x 3 x 11 x 11；

对inner product 层， weight blob大小为 1 * 1 * Output节点数 * Input节点数； bias blob大小为1 * 1 * 1 * Output节点数（ conv层和inner product层一样，也有weight和bias，所以在网络结构定义中我们会看到两个blobs_lr，第一个是weights的，第二个是bias的。类似地，weight_decay也有两个，一个是weight的，一个是bias的）；

blob中，mutable_cpu/gpu_data() 和cpu/gpu_data()用来管理memory，cpu/gpu_diff()和 mutable_cpu/gpu_diff()用来计算求导结果。

slover.cpp:

结合loss，用gradient更新weights。主要函数：

Init(),

Solve(),

ComputeUpdateValue(),

Snapshot(), Restore(),//快照（拷贝）与恢复网络state

Test()；

在solver.cpp中有3中solver，即3个类：AdaGradSolver, SGDSolver和NesterovSolver可供选择。

关于loss，可以同时有多个loss，可以加regularization（L1/L2）；

Protocol buffer：

上面已经将过， protocol buffer在 .proto文件中定义message类型，.prototxt或.binaryproto文件中定义message的值；

Caffe

Caffe的所有message定义在$CAFFE/src/caffe/proto/caffe.proto中。

Experiment

在实验中，主要用到两个protocol buffer: solver的和model的，分别定义solver参数（学习率啥的）和model结构(网络结构)。

好吧，copy了一大段，不晓得有没有帮助，说点accuracy = 0.5的问题。简单说，就是分错了，好吧我知道这是废话。既然是分错了，那么就要检查下了，首先检查你的训练模型。

根据训练过程来看，训练应该是已经收敛了，（反正loss一直在减小）。

这句可能是我理解问题，如果模型收敛的话，loss应该趋于平稳，如这样。

哦这是对数图。如果没有完全收敛的话，考虑下调整参数吧。说到调参，又是个坑啊。。。这个我也是懵懵懂懂。不过可以参考某些大牛的做法，比如用浅层CNN参数初始化深层CNN，或者学hinton老爷子用DBN来搞个预训练。不过即使是随机初始参数，按道理不应该出现这种accuracy=0.5的情况。个人感觉要么就是训练没有完成，要么就是在做最后二分的那一层有什么问题。。。

其实应该先检查训练数据，训练数据搞混了，其他都是白搭。

如果检查模型，你可以先看下你参数更新的梯度是否已经趋于零了，然后再看看你二分那一层有木有问题。

当然，说了这么多，可能也没啥帮助，如果你哪天改用matlab或者theano了，可以交流下，caffe确实不甚了解。。。

在尝试用caffe分类一个自己的二分类图像数据库。根据训练过程来看，训练应该是已经收敛了，（反正loss一直在减小）。然而测试集上的accuracy一直都是=0.5.

所以现在想着把生成的模型文件调出来用数据测试下，观察下是什么问题，请问应当如何去实现呢。

或者各位如果能指点下，可能是什么原因导致的accuracy = 0.5 不变。那就更好啦。

谢谢！

新手试运行了一个 caffe 的 Python 代码，出现这个错误是怎么回事

一、问题

在成功编译caffe的源码之后，可以在Python环境中使用caffe。

在Ubuntu环境下，打开python解释程序，输入import caffe时：出现以下错误

import caffe

Traceback (most recent call last):

File “stdin”, line 1, in module

ImportError: No module named caffe

二、解决思路

基本思路是把caffe中的python导入到解释器中

三、解决方法

第一种方法：设置环境变量

在终中输入：

export PYTHONPATH=~/caffe/python #caffe的路径下面的python

则该终端起作用，关掉终端后或重新打开一终端，则失效。

放到配置文件中，可以永久有效果，命令操作如下：

A.把环境变量路径放到 ~/.bashrc文件中

sudo echo export PYTHONPATH=”~/caffe/python” ~/.bashrc

B.使环境变量生效

source ~/.bashrc

第二种方法：通过代码来实现

在每个python代码中使用以下代码： (这个方法在写python代码时有用)

caffe_root = ‘~/caffe/python ‘

import sys

sys.path.insert(0, caffe_root + ‘python’)

import caffe

caffe的python接口求助

一、前期环境以及准备1、安装python在caffe中，python2和python3的接口都有。但frcnn中只能支持python2.7，所以千万不要装成python3。为了方便，不用自己去pip一大堆库，我建议安装anaconda2，里面已经安装了很多第三方的库。另附python，Windows的第三方库，里面很全。或许有一些库你要去官网上下载。2、安装（更新）显卡驱动和cudaNVIDIA的显卡驱动安装应该不用我说了吧，到官网上下载吧。我要说明一点的是，我的1080ti在安装显卡驱动时，说和Windows不匹配。怎么解决呢？更新Windows，到官网上下驱动，再安装。成功！还有就是记得更新你的显卡驱动，以防老的驱动不支持cuda。CUDA安装的话，也是傻瓜试的安装。提醒一点的是，不要改变他的安装路径，默认路径。然后去NVIDIA的官网上下载cudnn库，这个库的话需要去NVIDIA注册一个账号，然后问你用这个来完成什么工作之类的巴拉巴拉。这个库长什么样呢？下载完解压缩，得到一个cuda的文件夹，里面有3个文件夹然后打开你的CUDA文件夹，默认路径是C:\ProgramFiles\NVIDIAGPUComputingToolkit\CUDA\v8.0把cudnn库里面的3个文件夹里面的文件，分别加到cuda里面对应的文件夹。然后打开cuda需要编译的部分，默认路径是C:\ProgramData\NVIDIACorporation\CUDASamples\v8.0因为我用的VS2015，那么我就用打开2015的那个，然后改成release运行。至此，显卡计算的环境就搭建完成了。3、cmake和gitcmake的话，我建议直接下载编译好的能运行的文件（到官网上下载），然后解压文件，把bin的路径添加到Path中。git：因为frcnn里面有很多linux的脚本，你可以不用，但用的话会很方便的。所以我建议安装git。同样，傻瓜式的安装，直接到官网上下载。二、py-faster-rcnn1、编译caffe的python接口GPU版本（如果你编译过了就不用了）因为frcnn的编译过程用需要用到python的caffe包，所以必须要先编译一次caffe。如果你已经编译过caffe的py接口就不用了。下载微软的Caffe，git的地址你可以用git直接下载，或者在git的地址里下载，随便你。[plain]viewplaincopygitclonecdcaffegitcheckoutwindows打开caffe\scripts，然后编辑build_win.cmd文件第7行的VERSION是你VS的版本，VS2015对应的是14，VS2013对应的应该是12；第8行改为0；第9行改为0（如果你不用GPU，那就还是1）；13行的python_version是你的python版本，2.x就是2，3.x就是3；24,28行是你的python的安装目录，如果你是anaconda就改你的anaconda的目录，否则就不改。同样69-95行同样修改。以上2张图是我的cmake文件配置。进入caffe\scripts，打开cmd，直接执行build_win.cmd。注意他会自动下载需要的库，因为服务器呢都不在国内，所以我建议挂个VPN，不然你且等呢吧。这样cmake后呢，python的接口就已经编译好了，不用再编译一遍了。把caffe\python下的caffe的文件夹copy到python的第三方包的文件夹就ok。这样caffe的python接口就好了，你可以进cmd的python试一下importcaffe。如果说，他提示少了什么包，你直接pip这个包就好了，找不到的话，百度一下就有。但只要你跟着上面我的方法做应该不会出现什么问题。2、编译py-faster-rcnn依赖库首先呢，我们先去编译一下frcnn的依赖库。Windows下，不能使用自带的lib，把自带的lib删了，重新下载，这里给出git的地址。好了，现在你的库应该长成这样，有setup.py和setup_cuda.py。进cmd，install这2个文件。现在你肯定会遇到问题，提示你VC版本不对怎么呢，先set一下：输入SETVS90COMNTOOLS=%VS140COMNTOOLS%，VS后面的数字就是你的版本。还有不要忘了把你VS的c1.exe加到path下。编译好frcnn的依赖库后，应该是这个样子的。3、给caffe加frcnn的层现在，我们再下载一个caffe，跟前面一样，把build_win.cmd进行修改。然后我们就可以把frcnn的一些特有的层加到caffe里编译了。1）添加层和文件打开py-faster-rcnn\caffe-fast-rcnn\src\caffe\layers文件夹，找到4个文件分别为然后copy到你新的caffe的对应文件夹caffe\src\caffe\layers里。接着我们添加头文件，打开py-faster-rcnn\caffe-fast-rcnn\include\caffe，把fast_rcnn_layers.hpp这文件copy到caffe的对应文件夹下caffe\include\caffe。2）配置2个新层打开你的caffe\src\caffe\proto下的caffe.proto，进行编辑。在407行左右往原来的文件里添加新的层的配置信息[plain]viewplaincopyoptionalROIPoolingParameterroi_pooling_param=8266711;optionalSmoothL1LossParametersmooth_l1_loss_param=8266712;messageROIPoolingParameter{//Pad,kernelsize,andstrideareallgivenasasinglevalueforequal//dimensionsinheightandwidthorasY,Xpairs.optionaluint32pooled_h=1[default=0];//Thepooledoutputheightoptionaluint32pooled_w=2[default=0];//Thepooledoutputwidth//MultiplicativespatialscalefactortotranslateROIcoordsfromtheir//inputscaletothescaleusedwhenpoolingoptionalfloatspatial_scale=3[default=1];}messageSmoothL1LossParameter{//SmoothL1Loss(x)=//0.5*(sigma*x)**2–ifx1.0/sigma/sigma//|x|-0.5/sigma/sigma–otherwiseoptionalfloatsigma=1[default=1];}3）cmake新的caffe的python接口就是再执行一遍build_win.cmd就行。编译好之后，把caffe根目录下的python文件夹替换py-faster-rcnn\caffe-fast-rcnn的python文件夹。三、demo完成以上步骤你的py-faster-rcnn就已经编译成功了。如果你想用demo测试一下的话可以用.\data\scripts里的脚本去下载已经训练好的model，文件挺大的、速度挺慢的。所以给大家提供一个百度5，把caffemodel文件放在data\faster_rcnn_models，然后执行tools\demo.py就能看到结果了

caffe中怎么写python层

这两天一直在研究faster rcnn的源码，可是依旧感觉云里雾里，故下定决心把caffe调用Python

layer的流程仔细走一遍，好明白到底是什么在调用python layer。话说 linux

调试还真是蛋疼啊，木有ide那样直接下断点，gdb又不会用，只能傻比比的不断的LOG(INFO)输出。还好最终还是明白了，我就直接顺着

faster rcnn来说，并记录在此。

faster

rcnn最核心的代码就是在lib文件中，其他的都只是各种调用文件而已。不过lib里写了很多个模块，如何让caffe知道模块在哪里，并调用呢？这是

我搞一晚上的初衷。我先大概说一下caffe正常的流程，首先从文件中读入solver并生成一个solver，然后根据solver的net路径生成一

个net，net调用layer_factory循环生成每个层，最后根据读入model或是filler来初始化参数。实际上也怪自己马虎大意，没太细

看代码，导致所用的时间比较多。从上面的流程可以知道layer_factory是循环生成每个层，我看.cpp文件也的确写了#if

WITH_PYTHON_LAYER，然后有什么什么操作，比如储存python

layer的python_param，并调用setup，不过我没看出来这里实际上已经是利用boost进行C++

Python混编了。这些操作的定义就在python_layer.hpp文件中，我当初还以为在什么pythonXXX.cpp中，找了半天也没找到。

layer_factory中python

layer的setup相关具体操作是，先根据param找到module的位置，再加载module，再根据层名加载层，然后前向计算反向计算什么的。

这些就已经算是达到目的了。不过只是知道相对路径，怎么可能加载成功呢？然后又继续找啊找，终于在faster

rcnn的tools文件中找到。_init_paths里有写一些预操作，比如将lib路径写入PYTHONPATH中，当然如果写入的话，这样就可以

直接加载了。终于搞定。

这次也算是个小问题而已，不过只有再理清了整条脉络，看代码才会更加清晰，故也算是个重要的问题吧。不过这次也算是暴露了我不认真的问题，以后还是要耐心仔细找答案才行啊。

原创文章，作者：小蓝，如若转载，请注明出处：https://www.506064.com/n/159861.html