2019-11-25

教程

5 分钟读完 (大约 769 个字)

Re：从零开始的行人重识别（四）

度量学习之三元组损失

Schroff F, Kalenichenko D, Philbin J. Facenet: A unified embedding for face recognition and clustering[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 815-823.

这篇论文虽然是是用在人脸识别上的，但是行人重识别中的一个影响力十分大损失函数——triplet loss就是在这篇论文中提出的，之前用到的对比损失（contrastive loss）能够起到缩小类内距离，增大类间距离的作用，从而通过距离判断两类相似与否。但是contrastive loss有一个痛点，就是我们无法约束类间距离和类内距离的大小，虽然缩小了类内距离，也扩大了类间距离，但是类内距离仍然可能比类间距离大，这就是contrastive loss的局限性。由此作者想到增加一个类内距离比类间距离小的约束，于是三元组诞生了，如下图所示：

Triplet Loss

2019-11-22

教程

3 分钟读完 (大约 455 个字)

Re：从零开始的行人重识别（三）

度量学习之对比损失

Hadsell R, Chopra S, LeCun Y. Dimensionality reduction by learning an invariant mapping[C]//2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06). IEEE, 2006, 2: 1735-1742.

这篇论文早在2006年就被提出来，其中最重要的核心思想就是减小类内距离，扩大类间距离。因此作者提出一个对比损失（contrastive loss）函数：
$$
L(W,Y,\vec{X_1},\vec{X_2})=(1-Y)\frac{1}{2}{(D_W)}^2+(Y)\frac{1}{2}{(\max{0,m-D_W})}^2
$$
其中，
$$
D_{W}(\vec{X_1},\vec{X_2})={\left|G_W(\vec{X_1})-G_W(\vec{X_2})\right|}_2
$$

2019-11-18

教程

5 分钟读完 (大约 800 个字)

Re：从零开始的行人重识别（二）

用分类来学习行人特征

Geng M, Wang Y, Xiang T, et al. Deep transfer learning for person re-identification[J]. arXiv preprint arXiv:1611.05244, 2016.

该论文的提出的模型是使用的ImageNet上训练好的模型进行初始化，然后对特征采用了两个子网络进行训练，一个是分类子网络，一个是验证子网络。分类子网络的输入是一张一张的图像，采用的损失函数是cross-entropy loss，这样使得类间特征的距离扩大。验证子网络的输入是成对的图像，值得注意的是这里采用的损失函数不是contrastive loss而是与之前一样的cross-entropy loss，参考作者给出的原因是他们发现用contrastive loss反而模型性能会变差，具体操作是将成对的图像特征相减，然后当做是二分类模型，输出相似或者不相似，这样能使类内特征的距离减小。

2019-11-17

教程

9 分钟读完 (大约 1351 个字)

Re：从零开始的行人重识别（一）

绪言

马上研二要开题了，提前通过blog的方式先把研究思路理清楚，也算是重新温习一下学习过程中遇到的问题吧，希望能给自己带来一些新的思路，同时帮助一些刚刚接触reID的同学入门（~~虽然应该没什么人会看~~），如有勘误可以提出来，我会及时改正的。

2019-05-22

学习笔记

9 分钟读完 (大约 1350 个字)

Good Semi-supervised learning That requires a Bad GAN论文阅读笔记

前置知识

GAN（生成对抗网络）在semi-supervised learning（半监督学习）上取得了较强的实证成果，但是有两点是我们都没搞明白的：

discriminator（判别器）是如何从与generator（生成器）的联合训练中收益的
为什么一个好的classification（分类）效果和一个好的生成器不能同时获得

本质目标

为了更好的寻找能正确分类的low-density boundary（低密度边界）

2019-05-07

学习笔记

7 分钟读完 (大约 1001 个字)

CADA-VAE论文阅读笔记

文中涉及的概念

Few-shot learning

每个类只有很少的可见例子（一般小于10），训练一个模型对其分类。

Zero-shot learning

现有一些可见的例子和一些不可见的例子，使用可见的例子训练模型能够对不可见的例子进行分类。

Generalized zero-shot learning

现有一些可见的例子和一些不可见的例子，使用可见的例子训练模型能够对所有的例子进行分类。

多模态对齐，寻找不同模态（如图像、文字、语音）中的属性的对应关系，文中主要是指多个VAE中的latent space的属性的对齐。

2019-03-30

学习笔记

1 分钟读完 (大约 122 个字)

简单理解PRF

精准率

模型输出的结果是正确的概率

召回率

模型中原本应该输出的结果是实际输出的概率

混淆矩阵

2019-03-27

环境配置

几秒读完 (大约 19 个字)

tensorflow+cuda+cudnn安装成功的版本（持续更新）

tensorflow	cuda	python	cudnn	visual C++ redistributable	build tools
gpu-1.13.1	10.1	3.7	7	2015 update 3	2015 Update 3
gpu-1.13.1	10.0	3.6	7	2015 update 3	2015 Update 3
gpu-1.12.0	9.0	3.5	7	2015 update 3	2015 Update 3

2019-03-26

环境配置

2 分钟读完 (大约 242 个字)

Anaconda常用指令

1. 查看包

conda list     # 查看安装了哪些包
conda env list # 查看有哪些虚拟环境
conda -V       # 查看conda的版本

2019-03-26

学习笔记

2 分钟读完 (大约 273 个字)

Markdown常用标记

1. 标题

# 一级标题
## 二级标题

Re：从零开始的行人重识别（四）

度量学习之三元组损失

Re：从零开始的行人重识别（三）

度量学习之对比损失

Re：从零开始的行人重识别（二）

用分类来学习行人特征

Re：从零开始的行人重识别（一）

绪言

Good Semi-supervised learning That requires a Bad GAN论文阅读笔记

前置知识

本质目标

CADA-VAE论文阅读笔记

文中涉及的概念

Few-shot learning

Zero-shot learning

Generalized zero-shot learning

简单理解PRF

精准率

召回率

混淆矩阵

tensorflow+cuda+cudnn安装成功的版本（持续更新）

Anaconda常用指令

1. 查看包

Markdown常用标记

1. 标题

链接

分类

标签云

最新文章

归档

标签

最新文章

归档

标签

Your browser is out-of-date!

度量学习之三元组损失

度量学习之对比损失

用分类来学习行人特征

绪言

前置知识

本质目标

文中涉及的概念

Few-shot learning

Zero-shot learning

Generalized zero-shot learning

Multi-modal alignment

精准率

召回率

混淆矩阵

1. 查看包

1. 标题

链接

分类

标签云

最新文章

归档

标签

最新文章

归档

标签

Your browser is out-of-date!