目标检测 anchor的生成
两个名词:目标的真实边界(ground_truth bounding box)。而以像素为中心生成多个大小和宽高比(aspect ratio)的边界框,称为anchor box。基于深度学习的目标检测不使用传统的滑窗生成所有的窗口作为候选区域,FasterRCNN提出的RPN网络,处理较少但准确的候选区域。锚框即可理解为某个检测点处的候选区域。 假设图像高(h),宽为(w)。以每个像素为中心,大小(s in (0,1]),宽高比(r
转 Caffe学习系列(4):激活层(Activiation Layers)及参数
在激活层中,对输入数据进行激活操作(实际上就是一种函数变换),是逐元素进行运算的。从bottom得到一个blob数据输入,运算后,从top输入一个blob数据。在运算过程中,没有改变数据的大小,即输入和输出的数据大小是相等的。 输入:n*c*h*w 输出:n*c*h*w 常用的激活函数有sigmoid, tanh,relu等,下面分别介绍。 1、Sigmoid 对每个输入数据,利用sigmoid函数执行操作。这种层设置比较简单,没
Tensorflow object detection API 搭建物体识别模型(四)
四、模型测试 1)下载文件 在已经阅读并且实践过前3篇文章的情况下,读者会有一些文件夹。因为每个读者的实际操作不同,则文件夹中的内容不同。为了保持本篇文章的独立性,制作了可以独立运行的文件夹目标检测。 链接:https://pan.baidu.com/s/1tHOfRJ6zV7lVEcRPJMiWaw 提取码:mf9r,下载到桌面,并解压,目标检测目录下存在:nets、object_detection、training三个
caffe pytho接口
一:搭建Caffe 1.下载happynear的Caffe源码https://www.github.com/happynear/caffe-windows,第三方库3rdparty文件http://pan.baidu.com/s/1bSzvKa。 2.将3rdparty文件(bin,include,lib)解压至caffe-windows(假设Caffe源码解压后的文件夹名为caffe-windows)中的3rdparty文件夹中,
Stable Diffusion img2img图生图高级教程:换脸、换服装、换背景、换风格案例精讲
Stable Diffusion 图生图功能是Stable Diffusion中一个强大的图像生成和编辑功能,它能够通过随机过程将一张图像转换为另一张具有不同风格和特征的图像。 在本篇Stable Diffusion 图生图教学中,我将带领你探索这一强大的图像生成和编辑技术。img2img图改图功能以其高质量的图像生成、风格转换和编辑能力受到广泛关注。你将学会如何有效地使用Stable Diffusion 图生图功能来满足自
ubuntu16.04 安装caffe时出现 .build_release/tools/caffe: err
原博客搬移到:https://blog.csdn.net/u013171226/article/details/107680277 在Ubuntu上面搭建caffe环境,搭建完成之后运行sudo make runtest -j8失败,提示错误为:.build_release/tools/caffe: error whi
YOLOv3——引入:FPN+多尺度检测 (目标检测)(one-stage)(深度学习)(CVPR 2018)
论文下载:https://pjreddie.com/media/files/papers/YOLOv3.pdf 论文代码: https://github.com/pjreddie/darknet 一、算法特点: 1、基本思想: YOLO系算法的思想都是,首先通过特征提取网络对输入图像提取特征,得到一定大小的特征图(比如13*13),然后将输入图像划分网格成13*13个单元格,接着如果Ground Truth中某个目标
Windows下Python3.5+numpy+keras+tesorflow的环境配置
python3.5安装TensorFlow pip install tensorflow 安装numpy,scipy,theano,keras(深度学习框架) 这里很简单 直接命令行输入: python -m pip install numpy python -m pip install scipy python -m pip install theano python -m pip install keras python3
notMNIST 数据集pyTorch分类
简介 notMNIST数据集 是于2011公布的,可以认为是MNIST数据集地一个加强版本。数据集包含了从A到J十个字母,由large与small两个子集组成。其中samll数据集是经过手工清理的,包含19k个图片,误分类率越为0.5%,large数据集是未经过手工清理的,包含500k张图片,误分类率约为6.5%。 作者推荐在large数据集上训练网络,在small数据集上测试网络。可以将large数据集分为5/6和1/6,使用5/
1.3 循环神经网络模型-深度学习第五课《序列模型》-Stanford吴恩达教授
循环神经网络模型 (Recurrent Neural Network Model) 上节视频中,你了解了我们用来定义序列学习问题的符号。现在我们讨论一下怎样才能建立一个模型,建立一个神经网络来学习 XXX 到 YYY 的映射。 可以尝试的方法之一是使用标准神经网络,在我们之前的例子中,我们有9个输入单词。想象一下,把这9个输入单词,可能是9个one-hot向量,然后将它们输入到一个标准神经网络中,经过一些隐藏层,最终会输出9个值为
1.Anaconda安装Tensorflow报错UnicodeDecodeError: ‘utf-
安装TensorFlow pip install --ignore-installed --upgrade tensorflow 报错: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 45: invalid start byte 修改: D:\studySoftware\Anaconda3\Lib\site-packag
pytorch 生成随机数;linspace();torch.logspace();ones/zeros/ey
在使用PyTorch做实验时经常会用到生成随机数Tensor的方法,比如: torch.rand() torch.randn() torch.rand_like() torch.normal() torch.linespace() 在很长一段时间里我都没有区分这些方法生成的随机数究竟有什么不同,由此在做实验的时候经常会引起一些莫名其妙的麻烦。 所以在此做一个总结,以供大家阅读区分,不要重蹈我的覆辙。 均匀分布 torch.r
Keras搭建DNN解决多分类问题
Keras介绍 Keras是一个开源的高层神经网络API,由纯Python编写而成,其后端可以基于Tensorflow、Theano、MXNet以及CNTK。Keras 为支持快速实验而生,能够把你的idea迅速转换为结果。Keras适用的Python版本是:Python 2.7-3.6。 Keras,在希腊语中意为“角”(horn),于2015年3月份第一次发行,它可以在Windows, Linux, Mac等系统中运行。
快速理解YOLO目标检测
YOLO(You Only Look Once)论文 近些年,R-CNN等基于深度学习目标检测方法,大大提高了检测精度和检测速度。例如在Pascal VOC数据集上Faster R-CNN的mAP达到了73.2。而YOLO和SSD在达到较高的检测精度的同时,检测速度都在40FPS以上。这里主要对YOLO做简单介绍。整个YOLO的网络结构如图,前面20层使用了改进的GoogleNet,得到14×14×1024的tensor,接下来经过
ANN, CNN和RNN的区别
ANN、CNN和RNN都是深度学习中常用的神经网络模型,它们各自适用于不同类型的数据处理任务。下面我将详细介绍这三种模型的区别和应用场景。 什么是ANN? ANN是人工神经网络的简称(Artificial Neural Network)。它是一种由多个神经元组成的结构,每个神经元都有输入、输出和一组可调参数(权重和偏置)。ANN有多层结构(输入层、隐藏层和输出层),通过前向传播来计算模型的输出结果,再通过反向传播算法来优化模型的参数。AN