邢子晗's Blog

发表于2025-07-16|深度学习

基础部分基本法则根据$df=f’(x)dx$,我们定义向量微分和矩阵微分 df=\sum_{i=1}^n\frac{\partial f}{\partial x_i}dx_i=\frac{\partial f}{\partial\mathbf{x}}^Td\mathbf{x}=\frac{\partial f}{\partial \mathbf{x}}\cdot d\mathbf{x} df=\sum_{i=1}^{m}\sum_{j=1}^{n}\frac{\partial f}{\partial X_{ij}}dX_{ij}=\mathrm{tr}\left(\frac{\partial f}{\partial \mathbf{X}}^{T}d\mathbf{X}\right)=\mathbf{X}\cdot...

论文随笔-CFARnet

发表于2025-03-05|论文深度学习

介绍本人最近受够代码了，下定决心来点不一样的，do some math（如果能在下方打赏就更好了，码文不易，希望能赞助买奶茶钱买可乐钱）恒虚警率这个约束是经典符合假设检验中的标准要求，随着科技进步，机器学习这一方法已经开始被人们使用在各个领域这篇文章的主要内容：定义了一个可以用于贝叶斯和机器学习的CFAR检测器框架：将CFAR约束应用于贝叶斯最优检测器，可以用于任意复合假设检验提出learning-based CFAR检测器的性能门限，证明CFAR-constrained Bayes检测器渐进收敛于GLRT 提出了CFARnet，一种深度学习的恒虚警检测将CFARnet与GLRT进行性能对比相同性能下：CFARnet计算复杂度<GLRT GLRT表现不佳时：CFARnet仍有很好的性能，且仍能保持恒虚警特性检测器经典检测器似然比检验（Likelihood Ratio Test,LRT)[1]： T_{LRT}(\boldsymbol{x}) = 2 \log \frac{p(\boldsymbol{x} \mid z...

序列模型与循环神经网络

发表于2025-03-04|深度学习

序列介绍现实生活中,有许多数据并不是像图片一样,看一眼就能了解全部信息. 举个简单的例子: 一句话中,词语的出现顺序可能也会影响这句话的信息量:“狗咬人”所带来的信息远没有“人咬狗”带来的信息量大…… 序列数据已经存在了人们的生活中当中: 音乐、语言和视频地震:大地震后,往往伴随小的余震如何对序列进行统计上述提到了信息量,而信息量这个词往往就和概率相关了在时间$t$观察到$x_t$，那么得到$T$个不独立的随机变量$(x_1,…x_T) - p(\boldsymbol x)$ 使用条件概率展开$p(a,b)=p(a)p(b|a)=p(b)p(a|b)$ 所以$p(\boldsymbol...

微调

发表于2025-03-04|深度学习

介绍神经网络除了最后一部分,其余部分都是在做特征提取,如果目标数据集属于原数据集,那么训练好的模型就可以直接拿来用了. 实际上Chatgpt就是属于这种(一句话总结:让你的模型站在巨人的肩膀上……) 假设使用数据集已经训练出了一个模型,那这个对目标数据集仍有很好的适用性(最后一层因为label的原因,往往发生改变) 微调的方式训练是一个目标数据集上的正常训练任务，但使用更强的正则化使用更小的学习率使用更少的数据迭代源数据集远复杂于目标数据，通常微调效果更好重用分类器权重固定一些层神经网络通常学习有层次的特征表示低层次的特征更加通用高层次的特征则更跟数据集相关可以固定底部一些层的参数，不参与更新更强的正则代码这里的代码比较复杂,所以没有全部放入文章中建议认真看 https://courses.d2l.ai/zh-v2/assets/notebooks/chapter_computer-vision/fine-tuning.slides.html 123pretrained_net =...

图像增广

发表于2025-03-04|深度学习

介绍在不同场景下,图片很可能环境中其他因素干扰,比如噪声如果在训练数据时引入噪声,模型往往有更好的鲁棒性数据增强增加一个已有数据集，使得有更多的多样性在语言里面加入各种不同的背景噪音改变图片的颜色和形状翻转: 12345678import torchvision #图片,图片增广的办法,生成结果两行四列,scale图片画多大def apply(img, aug, num_rows=2, num_cols=4, scale=1.5): Y = [aug(img) for _ in range(num_rows * num_cols)] d2l.show_images(Y, num_rows, num_cols, scale=scale)apply(img, torchvision.transforms.RandomVerticalFlip()) #上下翻转apply(img, torchvision.transforms.RandomHorizontalFlip()) ...

Resnet残差网络

发表于2025-03-02|深度学习

思考模型越复杂,是不是带来的好处就越多呢? 结构残差块家族也有许多成员 Resnet块重复多次,就得到了resnet网络总结残差块使得很深的网络更加容易训练甚至可以训练一千层的网络残差网络对随后的深层神经网络设计产生了深远影响，无论是卷积类网络还是全连接类网络

batch norm批量归一化

发表于2025-03-02|深度学习

介绍在训练模型的时候,对于一个网络来说: 前部:数据集中在前部,网络前面的层变化,则会导致后面的层也跟着变化->收敛速度慢后部:损失是集中在网络后面的,所以往往后面的层训练较快那有没有一种方式,使网络后面的层尽量保持不变呢?批量归一化定义通过固定小批量数据的均值和方差，再引入可学习参数 γ 和 β 对数据进行调整，有助于加速模型的训练收敛，提高模型的稳定性。计算小批量均值和方差的公式： \mu_B = \frac{1}{|B|} \sum_{i\in B} x_i \text{ and } \sigma_B^2 = \frac{1}{|B|} \sum_{i\in B} (x_i - \mu_B)^2 + \epsilon然后对其做额外的调整: x_{i + 1} = \gamma \frac{x_i - \mu_B}{\sigma_B} + \beta不再学习均值和方差,转而学习参数 γ 和 β 作用位置作用在全连接层和卷积层输出上，激活函数前全连接层和卷积层输入上对全连接层，作用在特征维对于卷积层，作用在通道维实现1234567net =...

DL-CFAR检测算法

发表于2025-02-25|信号处理CFAR深度学习

论文随笔-利用深度学习进行恒虚警检测引言之前已经提及，常用的CFAR一共有四种方法，但是都有一定的限制，CA-CFAR[1] 利用参考单元功率的算术平均值作为噪声水平估计值。它的一个变种，即单元平均恒定虚警率（GOCA-CFAR）[2]，可以提高原始方案的虚警率。虽然这两种方案在同质场景中表现良好，但在多目标场景中，它们的性能会因错误的噪声水平估计而下降。为了提高多目标场景下的性能，有人提出了最小单元平均 CFAR（SOCA-CFAR）[3]。然而，它在密集多目标场景中并不能显著提高性能。有序统计 CFAR（OS-CFAR）[4] 可以处理这类问题，但它带来了显著的计算复杂性. 一、复习1.RDM的获取以 FMCW 雷达为例，发射一个由 M 个啁啾（啁啾是频率随时间线性增加的正弦波）组成的帧，然后以逐个啁啾的方式将发射和接收的啁啾混合成 M 个中频（IF）信号。然后，我们在每个啁啾信号中提取 N 个中频信号样本，并使用预定的采样周期。如图所示，CCM...