利用NVIDIA的3D引导生成式AI Blueprint,通过先进的AI技术控制AI图像的构图,这一技术能够生成具有丰富细节和逼真效果的3D图像,实现精准的构图控制,借助这一技术,用户可以更轻松地创建出高质量的图像作品,为设计、艺术等领域带来革命性的变革。
AI赋能的图像生成技术日新月异,从早期模型生成带有过多手指的人类图像,到如今创造出令人叹为观止的逼真视觉效果,尽管已经取得了显著的进步,但仍然存在一项挑战:实现创意掌控。 使用文本创建场景正变得越来越容易,不再需要复杂的描述,模型在针对提示词的一致性方面也进行了改进,要描述构图、拍摄角度、物体摆放等精细细节,仅通过文字仍然是一项艰巨的任务,修改和调整这些细节更是难上加难,尽管如此,NVIDIA在年初的CES展会上发布了面向RTX PC的NVIDIA 3D引导生成式AI Blueprint,旨在帮助用户克服这些挑战并快速获取先进的AI功能。 NVIDIA 3D引导生成式AI Blueprint允许用户从头开始生成完全控制构图的图像,它使用Blender中的3D场景草稿向图像生成器(Black Forest Labs的FLUX.1-dev)提供深度图,与用户的提示词一起生成所需的图像,深度图帮助图像模型理解物体应如何放置,这项技术的优势在于,它不需要高度细节化的物体或高质量纹理,因为这些将被转换为灰度,由于场景是3D的,用户可以轻松地移动物体并更改相机角度。 该解决方案的底层是ComfyUI,这是一个强大的工具,允许创作者以有趣的方式链接生成式AI模型,用户可以通过ComfyUI Node Editor Blender插件将Blender连接到ComfyUI,用户可以利用NVIDIA NIM微服务在GeForce RTX GPU上部署FLUX.1-dev模型,并以其最佳性能运行,该解决方案充分利用了NVIDIA TensorRT软件开发套件以及FP4和FP8等优化的精度格式,值得注意的是,3D引导的生成式AI Blueprint需要NVIDIA GeForce RTX 4080及以上GPU。 对于AI艺术家来说,这个Blueprint包含了开始使用高级图像生成工作流所需的一切:Blender、ComfyUI、连接两者的Blender插件、FLUX.1-dev NIM微服务以及运行该微服务所需的ComfyUI节点,还附带了安装程序和详细的部署说明,该Blueprint采用一种结构化的方式深入图像生成,提供了可根据特定需求量身定制的工作流,让创作更加轻松,效果更加惊艳。 对于AI开发者来说,该Blueprint可以作为构建类似工作流或扩展现有工作流的基础,它附带了源代码、示例数据、文档和入门工作示例。 这个AI Blueprint在NVIDIA RTX AI PC和工作站上运行,充分利用了NVIDIA Blackwell架构的最新性能突破,3D引导的生成式AI Blueprint中包含的FLUX.1-dev NIM微服务经过TensorRT优化,并量化为FP4精度,适用于Blackwell GPU,推理速度比原生PyTorch FP16提升了一倍以上,对于使用NVIDIA Ada Lovelace架构GPU的用户,FLUX.1-dev NIM微服务还附带FP8精度,同样由TensorRT加速,这些改进使得高性能工作流更容易实现,从而能够进行快速迭代和实验,量化还有助于减少模型运行所需的显存。 目前已有10个NIM微服务可用于RTX,支持从图像和文本生成到语音AI和计算机视觉的用例,更多Blueprint和服务即将推出,这个AI Blueprint以及NIM微服务现在已经在相关平台上推出,为那些希望在RTX PC和工作站上创建、定制和突破生成式AI界限的用户提供了强大的基础。 为了深入了解NIM微服务和AI Blueprint以及如何在AI PC和工作站上构建AI智能体、创意工作流等,可以关注RTX AI Garage系列博客,该博客每周都会发布社区驱动的AI创新和内容,有关软件产品的详细信息,请参阅相关通知。