作为人工智能模型从实验室走向真实场景的关键问题之一,域偏移长期制约着模型的可靠落地。在自动驾驶、遥感识别、医学分析、地震检测等任务中,训练数据与实际应用数据往往来自不同设备、环境或采样条件,数据分布差异会直接影响模型的泛化能力和部署可靠性。
模型在有标签的源域数据上表现良好,但迁移到新的、无标签的目标域数据时,性能往往明显下降。如何在缺少目标域标注的情况下提升模型跨域泛化能力,是领域自适应基础研究中的重要问题。
近日,马坚伟教授团队在人工智能基础研究领域,围绕无监督领域自适应中的理论建模、可解释性与计算效率取得创新突破,提出 Feature-Space Planes Searcher(FPS)特征空间决策平面搜索框架,并以 “Feature-Space Planes Searcher: A Universal Domain Adaptation Framework for Interpretability and Computational Efficiency” 为题,在人工智能领域国际顶刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》发表长文(共18页)。
哈工大数学学院为论文第一完成单位。数学学院博士生成知同和副研究员蒋一然为共同一作,马坚伟教授为通讯作者,博士生葛煜龙、李宇峰,硕士生覃仲恒,副教授林荣智为合作者。
传统无监督领域自适应方法大多通过调整深层特征表示,缩小源域与目标域之间的差异。但这一过程通常需要更新大量参数,在大规模预训练模型中会带来显著计算开销,也使模型迁移过程更难解释、更难控制。
FPS 提供了一种新的基础研究思路:当预训练模型已经形成稳定的特征空间结构时,领域自适应可以转化为固定特征空间中的决策边界优化问题,即把领域自适应过程理解为在预训练模型参数基础上,寻找最符合目标域分布规律的决策平面。
这里的关键不在于让模型重新改变特征空间,而在于识别目标域数据中已经存在、但尚未被标签显式揭示的特征空间结构性先验与几何模式。例如,同类样本应在特征空间中更加紧凑,不同类别之间应保持相对分离,决策边界应尽量避开样本密集区域。这些来自数据结构本身的先验,共同构成了 FPS 进行边界搜索的基础。
该框架下的实验表明,领域自适应不一定必须依赖复杂而昂贵的特征对齐,仅调整决策边界也可以实现高效、稳定、可解释的跨域迁移。这一工作为领域自适应基础研究提供了新的理论视角和方法框架。该框架既可用于自然图像分析,也适用于蛋白质二级结构预测、遥感影像分类、地震检测等任务,并为大模型在真实复杂场景中的低成本部署和可靠应用提供了新的研究路径。

不同领域样本分布偏移与决策面错位示意图

在蛋白质二级结构预测、遥感影像分类和地震检测等多任务中应用