what is the 3 types :image space (IS), high-level feature space (FS) and two-stage (TS) resampling? what is the difference? pros and cons?
这三种类型:图像空间(IS),高级特征空间(FS)和两阶段(TS)重采样,都是处理不平衡数据的方法,但它们在操作方式和应用领域上有所不同:
图像空间(IS)重采样:这种方法直接在图像空间中进行重采样。也就是说,它通过复制或插值图像像素来生成新的样本1。这种方法的优点是简单直观,但缺点是可能会产生不真实的图像,特别是当使用如 SMOTE 这样的插值方法时1。
高级特征空间(FS)重采样:这种方法在高级特征空间中进行重采样,这些特征通常是通过预训练的卷积神经网络生成的1。这种方法的优点是可以生成更具代表性的样本,因为高级特征通常能够捕获图像的重要信息2。然而,这种方法的缺点是需要预训练的模型来生成高级特征,而且可能会丢失一些低级的、细粒度的信息2。
两阶段(TS)重采样:这种方法结合了上述两种方法。在第一阶段,它在图像空间中进行过采样,以利用大量的数据进行卷积神经网络的训练。然后,在第二阶段,它在特征空间中进行欠采样,以微调网络的最后几层1。这种方法的优点是可以充分利用大量的数据进行训练,同时通过在特征空间中进行欠采样来减少过拟合的风险1。然而,这种方法的缺点是需要更多的计算资源,因为它需要进行两次采样,并且需要训练和微调模型1。