(7分钟科普下)www.51cao.gov.cnUofT、UBC、MIT和复旦发布：扩散模型驱动的异常检测与生成综述

扩散模型（Diffusion Models, DMs）近年来展现出巨大的潜力，在计算机视觉和自然语言处理等诸多任务中取得了显著进展，而异常检测（Anomaly Detection, AD）作为人工智能领域的关键研究任务，在工业制造、金融风控、医疗诊断等众多实际场景中发挥着重要作用。近期，来自多伦多大学、不列颠哥伦比亚大学、麻省理工学院、悉尼大学、卡迪夫大学和复旦大学等知名机构的研究者合作完成题为 “Anomaly Detection and Generation with Diffusion Models: A Survey” 的长文综述，首次聚焦于 DMs 在异常检测与生成领域的应用。该综述系统性地梳理了图像、视频、时间序列、表格和多模态异常检测任务的最新进展并从扩散模型视角提供了全面的分类体系，结合生成式 AI 的研究动向展望了未来趋势和发展机遇，有望引导该领域的研究者和从业者。扩散模型通过正向扩散与反向去噪的马尔可夫过程实现数据分布建模。正向过程遵循随机微分方程，逐步将数据分布转化为高斯噪声；反向过程通过神经网络学习去噪映射，渐进式恢复原始数据。其生成机制在捕捉复杂数据分布的细微差异上具有显著优势。与传统的广泛用于无监督 AD 任务的 GANs、VAE 和 Transformer 等相比，DMs 在生成样本的质量和多样性方面表现出色，在 AD 领域展示出出色潜力。基于 DMs 的异常检测通过建模数据分布的内在结构，将异常定义为与正常数据模式的显著偏离。根据异常评分机制不同，可分为三大核心范式，如图 3 所示。基于重构评分的方法通过扩散模型反向去噪过程重构输入样本，以重构误差作为异常分数。正常样本因符合学习到的分布，重构误差小；异常样本偏离分布，重构误差显著增大。典型应用如工业质检中，利用 U-Net 架构的扩散模型通过像素级重构误差定位异常。基于密度的评分方法利用扩散模型对数据概率密度的估计能力，将负对数似然作为异常分数。正常样本对应高概率密度，负对数似然值低；异常样本位于低概率区域，分数超过阈值即判定为异常。基于分数的评分方法利用数据分布的梯度信息（分数函数）量化样本与数据流形的偏离程度。正常样本位于流形表面，梯度范数小；异常样本处于低概率区域，梯度范数显著增大。三种方法从不同维度刻画异常：重构评分基于样本空间距离，密度评分基于概率分布似然，分数评分基于流形几何梯度。实际应用中，重构方法对图像局部异常更敏感，密度方法适合时序数据全局检测，分数方法在高维非结构化数据中表现更优。在图像异常检测（Image Anomaly Detection, IAD）领域，DMs 面临两大核心挑战：“恒等快捷方式”（Identity Shortcut）问题与高昂的计算成本。前者指模型在重构时倾向于直接复制输入中的异常区域，从而掩盖了异常；后者则源于扩散过程固有的多步迭代推理，限制了其实时应用。为应对这些挑战，综述中探讨了一系列前沿方法。例如，通过掩码重构、潜空间特征编辑或对抗性训练来打破 “恒等快捷方式”，迫使模型学习正常数据的深层分布而非简单复制。同时，为解决计算效率问题，研究者们提出了模型蒸馏、高效 ODE 求解器、潜空间扩散（Latent Diffusion Models, LDMs）以及模型稀疏化等多种加速策略。这些方法通过减少采样步数或在更低维的空间中操作，显著降低了推理时间和资源消耗，为扩散模型在工业质检、医疗影像分析等高要求的 IAD 场景中的实际部署铺平了道路。图 4：图像异常检测方法示意图。(a）展示了基础的基于重构的方法；(b）展示了为解决 “恒等快捷方式” 问题而设计的条件式或多阶段变体方法，旨在提升对异常的敏感度。视频异常检测（Video Anomaly Detection, VAD）的核心在于处理时序维度和复杂的运动模式，这使其比静态图像检测更具挑战性。异常可能表现为反常的动作序列或与既定模式不符的动态变化。因此，有效的 VAD 框架必须能够对时空依赖性进行建模。综述指出，先进的扩散模型通过引入光流、运动矢量或集成时空 Transformer 架构，将运动信息显式地融入到生成过程中。这种设计使模型能够学习正常事件的时空演化规律，从而敏锐地捕捉到速度、方向或加速度上的异常变化。例如，模型通过对过去帧或运动表征进行条件化，预测未来的正常帧，并将预测结果与实际观测进行比较。这种基于运动和时序上下文的建模方式，极大地提升了模型在监控、自动驾驶等动态场景中检测复杂异常事件的准确性和鲁棒性。图 5：视频异常检测框架示意图。该框架集成了时空特征提取与运动建模，通过光流或 Transformer 等技术将运动信息融入扩散模型，以有效识别空间外观和时间演变中的异常。时间序列异常检测（Time Series Anomaly Detection, TSAD）面临的挑战源于数据的内在时序依赖性、不规则采样和潜在的长期关联。综述归纳了扩散模型在该领域的两大主流范式：基于重构（reconstruction-based）与基于插补（imputation-based）。基于重构的方法利用扩散模型强大的生成能力来复原输入的时间序列，那些无法被精确重构、导致较大误差的数据点或片段被视为异常。而基于插补的方法则巧妙地将异常检测任务转化为一个缺失值填补问题，模型尝试填补序列中的部分数据，异常点会因其与上下文的低 “协调性” 而导致插补质量显著下降，从而被识别出来。为了有效捕捉时间序列的复杂动态，这些模型通常会集成循环神经网络（RNNs）或注意力机制（Attention），以增强对长短期依赖关系的建模能力，使其在金融欺诈检测、设备故障预警等任务中表现出色。图 6：时间序列异常检测（TSAD）框架示意图。该图展示了基于扩散模型的两种主流 TSAD 路径：(a）基于重构的路径通过比较原始序列与重构序列的差异来计算异常分数；(b）基于插补的路径则通过评估模型对缺失值的插补质量来判断异常。表格数据因其混合数据类型（如数值型、分类型、序数型）和普遍存在的缺失值，对异常检测构成了独特的挑战。直接应用为图像设计的扩散模型往往效果不佳。为此，该领域的研究重点在于开发专门的预处理技术和模型架构。综述中提到，扩散模型驱动的表格异常检测（Tabular Anomaly Detection, TAD）方法通常首先通过专门的嵌入层将异构数据统一到连续的表征空间。随后，经过改造的 DMs（如结合 Transformer 架构或高斯混合模型）在这一空间中学习正常数据的联合分布。在推理阶段，通过计算样本的重构损失或生成概率来识别异常。针对缺失值问题，一些方法在训练中引入掩码机制，使模型学会在存在数据缺失的情况下进行稳健的推理。这些适应性设计使得扩散模型能够有效处理金融、医疗等领域的复杂表格数据，精确识别其中的欺诈、病变等异常模式。图 7：表格异常检测框架示意图。该框架展示了处理包含混合数据类型（如数值型、分类型）的表格数据的典型流程。数据首先经过专门的预处理和嵌入模块，然后输入到适用于表格数据的扩散模型中，最终通过计算重构损失来识别异常。多模态异常检测（Multimodal Anomaly Detection, MAD）通过融合来自不同数据源（如图像、文本、传感器数据）的互补信息，显著提升了检测系统的准确性和鲁棒性。其核心挑战在于如何有效对齐和融合异构的模态信息。综述总结了三种主流的融合策略：早期融合在输入层即合并特征；晚期融合在决策层结合各模态的独立输出；而动态融合则能根据输入数据的上下文自适应地调整各模态的权重。协同扩散（Collaborative Diffusion）等先进框架通过构建共享的嵌入空间和动态融合模块，有效解决了模态对齐和信息不均衡的问题，在工业检测、智能监控等场景中展现了巨大潜力。异常生成（Anomaly Generation, AG）的主要动机是解决现实世界中异常样本稀缺的根本性难题。扩散模型凭借其卓越的生成能力，可以创造出逼真且多样的合成异常。该技术以正常数据为 “种子”，通过引入文本描述、掩码或在潜空间进行特定操作等条件化引导，精确地控制生成异常的类型、位置和严重程度。这些生成的异常数据不仅可以用于扩充训练集以增强检测模型的泛化能力，还能作为 “陪练” 来系统性地评估和提升模型的鲁棒性，并为自监督学习范式提供了宝贵的训练信号。尽管 DMs 在异常检测与生成领域取得了一定的进展，但仍面临诸多挑战。其一，计算效率。DMs 的训练和推理过程通常需要较高的计算资源和时间成本，这限制了其在实际场景中的应用，无法满足工业等应用场景下快速响应需求。其二，模型对复杂场景的适应性。在物理世界中，多模态异构数据往往具有复杂的分布和噪声，如何使 DMs 在这些复杂情况下仍能准确地检测任意可能异常，仍需进一步探索。展望未来，该领域展现出出色应用前景和研究潜力。第一，优化 DMs 的架构和算法，提高其计算效率，使其能够在资源受限的环境中运行。开发轻量级的扩散模型，或者采用模型压缩、加速推理等技术，有望解决计算效率问题。第二，增强 DMs 对复杂场景的理解和适应能力也是关键。通过引入多模态信息、改进数据增强技术等方式，使模型能够更好地处理复杂多变的数据。第三，探索 DMs 与基础模型以及强化学习等前沿技术的结合，将为面向现实应用的异常检测与生成模型带来新的突破。技术框架的系统性构建：首次将基于 DMs 的异常检测方法划分为基于重构、基于密度、基于分数三大评分范式，并针对图像、视频、时间序列等不同数据模态，阐述模型架构分类和最新进展。学术研究的前瞻性展望：客观剖析当前技术瓶颈，包括扩散过程的多步计算开销、小样本场景的泛化能力不足、理论解释的缺失等；展望主要研究趋势，如与大语言模型融合实现上下文感知检测、基于元学习的快速领域适应、以及面向实时场景的高效架构设计。

                                www.51cao.gov.cn当时是在前老板阿布拉莫维奇的领导下，俱乐部享受了一段辉煌时期，收获了多个重要奖杯并拥有多位巨星。而如今，切尔西的联合所有者伯利和贝赫达德-埃格巴利则采取了不同的策略，通过培养年轻球员来逐步建立坚实的基础。他们试图招募欧洲最优秀的年轻才俊以及来自世界各地的技术型球员，以期实现长期的成功。然而，今年夏天的世俱杯奖金，冠军可获得9700万英镑，在总计7.75亿英镑的奖金池中，对于像切尔西这样的球队来说将是一个转折点。每天都能听到直升机的声音，不管是不是集中注意力的好方式，这都是生活中会遇到的情况。我们会尽力以最好的状态集中注意力，为比赛做好准备。www.51cao.gov.cn免费网站在线观看人数在哪软件这种形态我在Rapid这款产品上看到了，它让我有这种Aha moment。输入请求时，它不会每一步都要求用户确认。而如果使用Manus、Winserve时不开启自动模式，每一步都得确认——其实很多步骤是不需要确认的。然而，“工作流程”也许不会被淘汰，因为很多东西终究需要人来设计好——人的一个优势在于足够稳定、足够可被信任。IT之家注：GPMI（General Purpose Multimedia Interface，通用多媒体接口）由深圳市 8K 超高清视频产业协作联盟牵头，联合华为、创维、海信、TCL 等 50 余家头部企业共同研发，是拥有自主知识产权的接口技术。该技术有“双向多流、双向控制、高功供电、生态兼容、极速传输、快速唤醒、全链安全”等优势，能同时支持音视频流、数据流、控制信号等多信号的聚合传输及最高 480W 的设备供电，解决了当前超高清音视频接口标准功能单一、形态多样、创新能力不足等问题。
                            

                                20250811 🔞 www.51cao.gov.cn我们总是会说要在决赛前庆祝一下，如果决赛输了就没得庆祝了。这是令人 难以置信的一周，今天晚上会小小的庆祝一下。无人一区二区区别是什么红桃6v2.4.5经杨某申请，法院调取了北京市公安局大兴分局观音寺派出所卷宗，根据卷宗显示，某公司的员工薛某在询问笔录中陈述：“在2024年2月21日承租人在交完租金以后，要求我们找保洁人员打扫房间，我们后勤的工作人员会根据小区地点在附近通过自己的渠道来找保洁，将要求说明以后让保洁进房间打扫。租户没有告诉我们将个人物品搬进房屋内。如果租户告诉我，我们就会跟保洁交代客户的要求。能联系上保洁，保洁说租户的物品已被她扔掉了。”
                            

📸 李炯记者赵海建摄

                                20250811 🔞 www.51cao.gov.cn然而，按传统货物通关模式，尚未取得上市许可的“科研原型机”出境需提供复杂认证材料，等待常常耗时数月。“科研成果转化最怕等，晚一步就可能失去先机。”陈福荣很焦急。双人床上剧烈运动会越睡越累吗布伦特福德方面预计会有球队接触他们的主教练，有报道指出列维已经与托马斯-弗兰克进行了非正式的会谈。弗兰克当前的合同还有两年，据悉其中有一项1000万镑的买断条款。弗兰克与布伦特福德之间还达成了一项君子协定，即弗兰克将在俱乐部再执教一年。
                            

📸 赵红娟记者解晓锋摄

                            🍆 坐在出事客机11A座位的40岁英国公民维什瓦什·库马尔·拉梅什被证实在事故中幸存。现场视频显示，他可以在无人帮助的情况下走路离开事故现场。红桃17·c18起草