MagicQuill: Um Sistema Inteligente de Edição de Imagens InterativoMagicQuill: An Intelligent Interactive Image Editing System
A edição de imagens envolve uma variedade de tarefas complexas e requer técnicas de manipulação eficientes e precisas. Neste artigo, apresentamos o MagicQuill, um sistema integrado de edição de imagens que permite a rápida concretização de ideias criativas. Nosso sistema apresenta uma interface simplificada, porém robusta em funcionalidades, permitindo a articulação de operações de edição (por exemplo, inserção de elementos, apagamento de objetos, alteração de cor) com entrada mínima. Essas interações são monitoradas por um modelo de linguagem multimodal grande (MLLM) para antecipar intenções de edição em tempo real, evitando a necessidade de entrada explícita de comandos. Por fim, aplicamos um poderoso prévio de difusão, aprimorado por um módulo plug-in de dois ramos cuidadosamente aprendido, para processar solicitações de edição com controle preciso. Resultados experimentais demonstram a eficácia do MagicQuill em alcançar edições de imagens de alta qualidade. Visite https://magic-quill.github.io para experimentar nosso sistema.