WOFA 方案核心设计（简洁版）

一、网络架构设计

采用 “编码器 – 嵌入器 – 失真层 – 提取器 – 解码器” 多级结构：

编码器（Enc）：两层FC，将 30 位二进制水印$w \in \{0,1\}^{1×30}$映射为灰度噪声图案$w_n^e \in \mathbb{R}^{1×H×W}$，公式：$w_n^e = Enc(w)$；
嵌入器（Emb）：基于 5 层 U-Net 将$w_n^e$与原始图像$I_o \in \mathbb{R}^{3×H×W}$融合，输出水印图像$I_w$，公式：$I_w = Emb(w_n^e, I_o)$；
失真层：含 $N₁$（阶段 I，模拟部分掩膜、几何变换、高斯噪声，输出$w_n’ = N_1(w_n^e)$）和 $N₂$（阶段 II，模拟完整部分盗用 + 信道失真，输出融合图像$I_f = N_2(I_w, I_b)$）；
提取器（Ext）：5 层 U-Net 从$I_f$中恢复预测噪声图案$w_n^p$，公式：$w_n^p = Ext(I_f)$；
解码器（Dec）：“4 卷积 + 2FC” 将噪声图案解码为水印，公式：$w_{pred} = Dec(w_n^p)$（阶段 II）或$w_{pred} = Dec(w_n’)$（阶段 I）。

分两阶段训练：

阶段 I（训 Enc+Dec）：固定 Emb、Ext，仅优化 Enc 和 Dec，最小化水印预测损失：$\mathcal{L}_1 = BCE(w, w_{pred})$，目标建立 “失真噪声图案→水印” 稳定映射；
阶段 II（训 Emb+Ext）：冻结 Enc、Dec 权重，优化 Emb 和 Ext，损失函数：$\mathcal{L}_2 = MSE(I_o, I_w) + MSE(w_n’, w_n^p) + BCE(w, w_{pred})$，目标保证$I_w$视觉质量、$w_n^p$准确性及水印还原精度。

嵌入：$w \xrightarrow{Enc} w_n^e \xrightarrow{Emb(I_o,·)} I_w$；
盗用模拟：$I_w \xrightarrow{N_2(I_b,·)} I_f$（含部分掩膜$I_s = I_w⊙m$、几何变换、背景融合）；
提取：$I_f \xrightarrow{Ext} w_n^p \xrightarrow{Dec} w_{pred}$，通过$\mathcal{L}_1 = BCE(w, w_{pred})$和$\mathcal{L}_{pattern} = MSE(w_n’, w_n^p)$确保$w_{pred}$与$w$一致。

发送评论编辑评论