O Natal chegou mais cedo e trouxe um presente: a versão 6 do Midjourney. A mais recente e avançada iteração do popular modelo de geração de imagens com inteligência artificial do coletivo de pesquisa homônimo fundado por David Holz, foi lançada ontem em versão alfa — e já há usuários avançados entusiasmados com as melhorias que ela traz.
Novos Recursos Surpreendentes
Entre as novas funcionalidades estão imagens drasticamente aprimoradas e mais realistas, altamente detalhadas e a capacidade de gerar texto legível dentro das imagens, algo que havia escapado ao Midjourney desde o seu lançamento em 2022, mesmo enquanto outros geradores de imagens com IA rivais, como o DALL-E 3 da OpenAI e o Ideogram, lançavam esse tipo de recurso.
“Este modelo pode gerar imagens muito mais realistas do que qualquer coisa que lançamos antes”, escreveu Holz em uma mensagem postada no servidor Discord do Midjourney, que tem mais de 17 milhões de membros. Holz disse que a V6 foi na verdade o “terceiro modelo treinado do zero em nossos superclusters de IA” e levou nove meses para ser desenvolvido.
Como Ativar a MJ V6?
A atualização não será aplicada por padrão aos usuários — pelo menos, não para mim. Você precisará digitar o comando “/settings” no servidor Discord do Midjourney ou em uma mensagem direta (DM) para o bot do Midjourney e usar o menu suspenso no topo para selecionar a V6. Ou, você pode fazer isso da maneira antiga e digitar manualmente “–v 6” após seus prompts.
O Que Há de Novo na V6?
Especificamente, Holz destacou várias novas funcionalidades, incluindo:
- Muito mais precisão no seguimento de prompts, bem como prompts mais longos
- Melhoria da coerência e conhecimento do modelo
- Melhoria na criação de imagens e remix
- Habilidade limitada para desenhar texto (você deve escrever seu texto entre “aspas” e –style raw ou valores de –stylize mais baixos podem ajudar)
- Melhoria dos upscalers, com modos ‘subtle’ e ‘creative’ (aumenta a resolução em 2x)”
- Novos métodos de prompting encorajados
Novo Método de Prompting Desenvolvido
O fundador e líder do projeto Midjourney também esclareceu que um método completamente novo de prompting foi desenvolvido.
O prompting do Midjourney — como os usuários geram imagens digitando descrições de texto específicas e palavras-chave no servidor Discord ou na versão alfa do site — sempre foi um tanto esotérico e técnico, com os usuários compartilhando exemplos de técnicas que funcionaram bem para eles nas redes sociais, como incluir nomes de câmeras (por exemplo, Leica M11), estoque de filme (35mm) e resolução (8k), para obter resultados de alta qualidade, fotorealistas ou cinematográficos do modelo de IA.
No entanto, Holz deixou claro em sua postagem no Discord que esses tipos de truques de prompting não resultarão mais no tipo de resultados desejados pelos usuários. “Você precisará reaprender como fazer prompts”, escreveu ele.
“O prompting com V6 é significativamente diferente do V5. Você precisará ‘reaprender’ como fazer prompts.
V6 é MUITO mais sensível ao seu prompt. Evite ‘lixo’ como ‘premiado, fotorrealista, 4k, 8k’.
Seja explícito sobre o que você quer. Pode ser menos vibey, mas se você for explícito, agora é MUITO melhor em entendê-lo.
Se você quer algo mais fotográfico/menos opinativo/mais literal, você provavelmente deve usar –style raw por padrão.
Valores mais baixos de –stylize (padrão 100) podem ter melhor compreensão do prompt, enquanto valores mais altos (até 1000) podem ter melhor estética.
Por favor, conversem uns com os outros no prompt-chat para descobrir como usar o v6.”
Exemplos do Midjourney V6
Melhor do que eu subir imagens aqui, vou deixar dois conteúdos que posts que mostram a capacidade da v6.
Prompt da imagem de capa
Sim, eu faço as imagens de capa das notícias e artigos usando AI. Essa imagem foi criada usando Midjourney. O prompt foi:
A laptop on top of a clean workstation being powered by a power cable coming out of albert einsteins head –v 6.0