关于PAN多级特征融合在维持原图比例不变时，填充区域的Attention Mask如何使用的问题 #372

urbaneman · 2024-07-16T02:54:23Z

感谢您的工作和对开源社区的贡献。

我想在自己的数据使用RT-DETR，数据目标在原尺度为正方形目标，我想利用这个信息，在数据处理时保持原图比例，我也参考了这个issue13，但是里面没有 Attention Mask 相关讨论。

我想咨询的问题是：
在图像保持原图比例缩放时，会引入填充像素，填充部分的Attention Mask在DETR中会被置为1，并在encode的时候忽略

但是在 RT-DETR 中采用直接resize的方法，没有填充，keep_ratio: False，Attention Mask作用在了CDN中

Line 299 in 5b628ea

memory = self.encoder[i](src_flatten, pos_embed=pos_embed)

我需要在原图比例上使用RT-DETR，那么PAN结构的特征融合时填充像素特征是否会影响非填充目标特征的表达？是否需要对遮挡像素的特征做mask?

The text was updated successfully, but these errors were encountered:

urbaneman assigned lyuwenyu Jul 16, 2024

Provide feedback