A Meta revelou uma nova IA para a geração de imagens 3D a partir de comandos em texto, o 3dGen. A tecnologia promete criar objetos tridimensionais com alta fidelidade e rapidez para aplicações em videogames, aplicativos de realidade aumentada e virtual, além de efeitos especiais no cinema. A novidade, porém, ainda não está disponível para o público.
O 3DGen se destaca por contar com renderização baseada em física (PBR), essencial para a realocação de iluminação em aplicações reais, e por oferecer retexturização generativa de formas 3D previamente geradas ou criadas por artistas — o que permite adicionar novos comandos de texto para aperfeiçoar os objetos.
3DGen da Meta
De acordo com a Meta, o 3DGen utiliza os componentes AssetGen e TextureGen para gerar os objetos 3D com uma combinação de visualização espacial e textura, o que resulta em “uma taxa de sucesso de 68% em comparação com o modelo de estágio único”.
Publicado por @aiatmetaVer no Threads
Na apresentação da tecnologia, a Meta compara o seu modelo com outras soluções disponíveis no mercado. Segundo a empresa, o 3DGen supera concorrentes em termos de fidelidade ao prompt e qualidade visual para descrições textuais complexas, além de ser significativamente mais rápido.
Em uma demonstração registrada no documento sobre a IA, a Big Tech mostra os resultados obtidos com o 3DGen ao lado dos modelos Rodin Gen-1, Meshy v3, Tripo3D e CSM Cube 2.0.
A geração de conteúdo 3D é uma das partes mais desafiadoras e demoradas do design e desenvolvimento de jogos, aplicações de realidade aumentada e virtual, e efeitos especiais na indústria cinematográfica.
Com assistentes de IA que funcionam como artistas 3D, novas opções para a criação de objetos e figuras tridimensionais tornam-se possíveis e mais acessíveis. As ferramentas facilitam, por exemplo, a colocação virtual de produtos em vídeos gerados por usuários.
Vale lembrar que há outras soluções de IA generativa para criar objetos 3D a partir de fotos, ilustrações ou descrições textuais que foram anunciadas recentemente, como o Stable 3D da Stability AI e o Lumiere do Google.