WOFA 方案核心设计(简洁版)
一、网络架构设计
采用 “编码器 – 嵌入器 – 失真层 – 提取器 – 解码器” 多级结构:
- 编码器(Enc):两层FC,将 30 位二进制水印$w \in \{0,1\}^{1×30}$映射为灰度噪声图案$w_n^e \in \mathbb{R}^{1×H×W}$,公式:$w_n^e = Enc(w)$;
- 嵌入器(Emb):基于 5 层 U-Net 将$w_n^e$与原始图像$I_o \in \mathbb{R}^{3×H×W}$融合,输出水印图像$I_w$,公式:$I_w = Emb(w_n^e, I_o)$;
- 失真层:含 $N₁$(阶段 I,模拟部分掩膜、几何变换、高斯噪声,输出$w_n’ = N_1(w_n^e)$)和 $N₂$(阶段 II,模拟完整部分盗用 + 信道失真,输出融合图像$I_f = N_2(I_w, I_b)$);
- 提取器(Ext):5 层 U-Net 从$I_f$中恢复预测噪声图案$w_n^p$,公式:$w_n^p = Ext(I_f)$;
- 解码器(Dec):“4 卷积 + 2FC” 将噪声图案解码为水印,公式:$w_{pred} = Dec(w_n^p)$(阶段 II)或$w_{pred} = Dec(w_n’)$(阶段 I)。
二、训练过程
分两阶段训练:
- 阶段 I(训 Enc+Dec):固定 Emb、Ext,仅优化 Enc 和 Dec,最小化水印预测损失:$\mathcal{L}_1 = BCE(w, w_{pred})$,目标建立 “失真噪声图案→水印” 稳定映射;
- 阶段 II(训 Emb+Ext):冻结 Enc、Dec 权重,优化 Emb 和 Ext,损失函数:$\mathcal{L}_2 = MSE(I_o, I_w) + MSE(w_n’, w_n^p) + BCE(w, w_{pred})$,目标保证$I_w$视觉质量、$w_n^p$准确性及水印还原精度。
三、水印计算过程
- 嵌入:$w \xrightarrow{Enc} w_n^e \xrightarrow{Emb(I_o,·)} I_w$;
- 盗用模拟:$I_w \xrightarrow{N_2(I_b,·)} I_f$(含部分掩膜$I_s = I_w⊙m$、几何变换、背景融合);
- 提取:$I_f \xrightarrow{Ext} w_n^p \xrightarrow{Dec} w_{pred}$,通过$\mathcal{L}_1 = BCE(w, w_{pred})$和$\mathcal{L}_{pattern} = MSE(w_n’, w_n^p)$确保$w_{pred}$与$w$一致。

