分类: FSL

2 篇文章

[CVPR 2024]Transfer CLIP for Generalizable Image Denoising
概括:作者发现 CLIP 里冻结的 ResNet 图像编码器,其前 4 层多尺度密集特征对噪声相对不敏感同时保持内容判别性。于是通过训练一个编码器,将带噪声的图像还原为干净图像。 CLIP 提供了两种图像编码器,ResNet 和 ViT。ResNet 通过连续的 Conv-block 和 Pooling 操作提取多尺度特征图,ViT 则是将图像分解…
[NeurIPS 2024]Mind the Gap Between Prototypes and Images in Cross-domain Finetuning
最近 FSL 的文章看的比较少,这篇算其中之一,感觉讲的比较有意思,所以记录一下。 简单说就是在以往的 FSL 问题的处理方法中,用到 Prototype 的方法基本都是先将图像嵌入,然后通过一个转换头后在对同一类的图像求加权平均得到他们的 Prototype。然后在测试的时候求图像和每个 Prototype 的欧氏距离找最小的作为答案。本文中提到…