文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式
女性一晚上3次纵欲导致不孕在过去的七天里,拜仁和尼科-威廉斯的代表进行了两次会面,双方接触非常频繁。拜仁有意引进并想努力争取,阿森纳也有意向,现在就看巴萨要如何抉择了。据悉,签订合同的人员可获得100万格里夫纳(约合17.7万元人民币)的奖励,是标准工资的4倍,此外,每月还有12万格里夫纳(约合2.1万元人民币)起的战斗奖金,以及其它福利。女性一晚上3次纵欲导致不孕成片ppt网站大片谷物联合收割机、混流式烘干机、履带旋耕机……近日,第四届中国—非洲经贸博览会在湖南长沙开幕。在博览会上,不少农机装备吸引观众驻足。演唱会现场虚假演唱的现象越来越普遍,粉丝们辛苦攒钱买票,却只能看到偶像“开口即跑调”,依靠技术手段掩盖真实演唱水平。
20250812 🔞 女性一晚上3次纵欲导致不孕之所以会有“反者道之动”的说法,本质上就是近5年的快速发展里,汽车的趋势已经经历了太多的野蛮生长。从最早的拼60km/h等速续航,再到拼车内的屏幕数量,到拼智驾的开城速度,再到不久前的纯拼谁的价格低、纯拼性价比、拼关于智驾的宣传,再到了和买手机一样拼参数。y31成色好的y31下班后,李佳梁收到了朋友和同事的询问,“他们把视频发给我问这是不是我”。谈到自己在网络上“火”了的看法,他笑着告诉记者,这些暖心、贴心的事情一直发生着,“可能大家对交警的印象就是指挥交通、贴罚单,比较严厉”。
📸 林燕钦记者 王淑芳 摄
20250812 🍓 女性一晚上3次纵欲导致不孕“一老一小”关乎民生、连着民心。完善普惠养老、普惠托育服务价格形成机制,对基本服务收费加强引导;多渠道增加公建托位供给,大力发展社区嵌入式托育和家庭托育点,支持有条件的幼儿园延伸发展托育服务……一项项普惠政策举措,体现了切切实实的民生关怀。男欢女爱免费观看武则天电视剧危险驾驶罪属于行为犯,处罚最轻。指在道路上实施特定高危驾驶行为,如醉酒驾车(血液酒精≥80mg/100ml)、追逐竞驶等。主观上故意犯罪,行为人明知违法仍实施,但对实害结果通常无故意。将会面临拘役(1-6个月)并处罚金,若同时构成其他犯罪(如交通肇事罪),择一重罪处罚;以危险方法危害公共安全罪属于故意制造高度紧迫危险,刑罚最重。指的是采用与放火、爆炸相当的危险方法(如繁华路段高速逆行、蓄意驾车冲撞人群)威胁不特定多数人安全。该罪名主观上属于故意犯罪,行为人明知行为高度危险且放任或希望危害发生。该罪名的刑罚分为:未造成严重后果的处以3-10年有期徒刑;致人重伤、死亡或重大财产损失的处以10年以上至死刑。与危险驾驶罪的关键区别在于行为需达到与放火、爆炸相当的紧迫危险性。例如:醉驾后明知可能撞上他人而主观放任结果发生,构成本罪。
📸 武传新记者 文永华 摄
🔞 洛杉矶市长巴斯则在声明中强调,特朗普部署国民警卫队导致混乱升级,洛杉矶居民正真切地感受着恐惧,这种恐惧在社区和家庭中蔓延,将民众置于危险境地,而这是洛杉矶最不需要的。17c