首页 - 自媒体资讯 > 腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势

发布于:2025-01-07 作者:xcadmin 阅读:1 当前页面链接:https://lawala.cn/post/580.html
腾讯优图实验室提出了一种名为DynamicControl的新架构,超越了现有的ControlNet++技术。该架构通过动态条件选择机制,显著增强了图像生成的可控性与质量。DynamicControl利用多模态大语言模型(MLLM)推理能力,结合双循环控制器和多控制适配器,实现自适应的条件组合和优化,确保生成图像高度符合预期视觉效果。

在当今的人工智能领域,生成式模型正以前所未有的速度发展,文本到图像(Text-to-Image, T2I)的生成任务尤为引人注目,这一任务不仅要求模型能够根据给定的文本描述生成相应的图像,还要求生成的图像在视觉上与文本高度一致,现有的方法往往难以在多个条件之间实现平衡,导致生成的图像与输入条件不一致。

为了解决这个问题,一项名为“DynamicControl”的新研究应运而生,这项研究由Quantum Bit、南洋理工、浙大等多家研究机构联合提出,旨在通过一种新颖的多控制适配器和高效的条件评估器,将大型语言模型(MLLM)的强大推理能力集成到T2I生成任务中,从而实现对多种控制信号的自适应选择和优化。

背景介绍

现有的文本到图像生成模型大多依赖于预训练的扩散模型,这些模型能够根据给定的文本提示生成高质量的图像,这些模型在处理复杂的视觉任务时仍然面临挑战,尤其是在需要同时考虑多种控制条件的情况下,如何在一个场景中同时控制物体的形状、颜色和纹理等属性?

为了解决这些问题,研究人员提出了“DynamicControl”框架,该框架不仅可以将多模态语言模型的推理能力直接集成到T2I生成任务中,还能自适应地选择不同的条件类型和数量,从而大大增强了生成过程的可控性。

核心创新

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第1张

1. 双循环控制器

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第2张

DynamicControl的核心是一个双循环控制器,它可以产生真实的排名分数,用于监督与MLLM预测的条件一致性,具体来说,首先引入一个双循环控制器来生成真实排名分数,作为与MLLM预测的条件一致性监督信号,利用这些排名分数和预选条件得分进行动态控制,实现可控的图像生成。

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第3张

2. 新颖高效的多控制适配器

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第4张

为了适应多种控制信号,研究人员设计了一种新颖而高效的多控制适配器,这个适配器可以自适应地解释复杂的控制信号,从而从输入条件中提取全面的多控制嵌入,这种设计使得模型能够在不牺牲图像质量或图像文本对齐的情况下,大大增强可控性。

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第5张

3. 多条件自适应选择

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第6张

DynamicControl还采用了一种选择性方法,即只选择那些达到预定义阈值及以上的条件参与后续的T2I模型优化,这种方法确保了只有最相关和质量最高的条件才会影响最终的图像生成过程,这个阈值是可学习的参数,允许模型自适应地确定各种数据集的阈值和调整它们。

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第7张

实验结果

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第8张

实验结果表明,DynamicControl显著增强了可控性,而不会牺牲图像质量或图像文本对齐,具体来说,不同条件控制和数据集下的可控性比较显示,DynamicControl在多个方面都优于现有的方法,从各种条件控制的实验结果来看,DynamicControl也表现出了更好的FID(↓)/ CLIP 分数(↑)。

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第9张

可视化结果

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第10张

为了更直观地展示DynamicControl的效果,研究人员还提供了一些可视化结果,这些结果显示,DynamicControl生成的图像在颜色、纹理、布局等方面更加符合预期,且与源图像的相似度更高,这表明DynamicControl不仅提高了生成图像的质量,还增强了其可控性和多样性。

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第11张

结论

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第12张

DynamicControl为可控视觉生成提供了新的视角,它通过将MLLM的推理能力集成到T2I生成任务中,实现了对多种控制信号的自适应选择和优化,这不仅提高了生成图像的质量,还增强了其可控性和多样性,未来,随着技术的不断发展和完善,DynamicControl有望在更多领域得到应用,为人类带来更多便利和惊喜。

腾讯优图推出创新架构:动态条件选择,引领超越ControlNet++的新趋势,图片,腾讯优图,ControlNet++,人工智能,2,3,4,第13张

二维码

扫一扫关注我们

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 dousc@qq.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

当前页面链接:https://lawala.cn/post/580.html

标签: #腾讯优图 #ControlNet++ #人工智能 #2 #3 #4

相关文章

发表评论

自媒体

电话咨询
自定义链接2