Le mashup Mozbot : Roger explore le monde de l’imagerie IA générative

La génération d’images d’IA a fait de grands pas en avant au cours de la dernière année. C’est amusant de jouer avec. C’est un peu bizarre. Cela peut produire des résultats époustouflants – et souvent risibles.

Mais est-ce utile dans un contexte marketing ?

Nous avons décidé de le découvrir, et notre vaillant robot SEO, Roger, s’est porté volontaire pour être notre premier sujet de test. Ne vous inquiétez pas, il était cool avec ça. Il était en fait très enthousiaste à l’idée d’avoir une intelligence artificielle avec laquelle s’engager, après avoir passé tant de temps à nous donner des connaissances en matière de référencement, nous, simples humains.

Former le modèle

Les outils d’imagerie IA tels que Midjourney, Stable Diffusion et DALL-E 2 sont assez étonnants pour créer des images d’à peu près tout ce que vous pouvez créer, mais ils ont leur propre méthode algorithmique et aléatoire pour y parvenir. Ainsi, bien que vous puissiez obtenir des résultats intéressants, il peut être difficile de trouver un spécifique résultat.

Pour arriver à tout ce qui ressemblait réellement à notre amical SEO Mozbot, nous devions former un modèle de diffusion stable pour commencer. Il existe de nombreuses façons de procéder, certaines qui deviennent assez techniques et un certain nombre d’autres qui utilisent des interfaces d’application pour faciliter le processus pour quelqu’un avec un peu moins d’expertise technique.

Nous avons choisi de commencer par Astrie, une solution qui vous permet de personnaliser (ils appellent cela le réglage) un modèle qui vous est propre. De nombreux utilisateurs l’entraînent sur leur propre image pour créer des avatars sympas (comme l’application populaire Lensa), mais nous avons ajouté un tas de variantes de Roger là-dedans, l’avons fait faire la fête avec le modèle AI et avons regardé quel genre de manigances ils ont obtenu jusqu’à.

Une galerie Rogues de Rogers

Ces outils génèrent des images basées sur une invite de texte, donc notre invite initiale était de voir s’il pouvait produire une version dans un style 3D amusant et coloré.

Pas mal des premiers résultats ! Il était clair que cette génération s’inspirait beaucoup de photos d’un jouet Roger tenu dans une main, ainsi que d’une photo de notre mascotte Roger grandeur nature lors de l’un de nos événements Mozcon (ainsi, les personnes en arrière-plan de certaines des images) . Ceux-ci sont tous reconnaissables en tant que Roger, ce qui m’a impressionné, bien qu’aucun d’entre eux ne soit tout à fait « correct ».

Il est temps d’essayer quelque chose dans un style complètement différent. Que diriez-vous de « Roger Mozbot avec un jetpack de fusée et un casque fishbowl, peinture à l’aquarelle. »

Des résultats super amusants ! Et d’autres qui ressemblent à Roger passe un très mauvais moment. De plus, apparemment, la partie « fusée » de notre invite a donné à Roger du matériel dans certains des résultats qui donnaient l’impression que son commutateur avait été accidentellement réglé de Hugs à Destroy.

D’autres itérations ont produit des résultats tout aussi intéressants, amusants, terribles et loufoques alors que nous nous amusions avec d’autres styles, y compris plus de 3D, de schémas, d’illustrations de livres pour enfants et même d’Anime !

Ils continuent juste à venir…

Vous voulez encore plus de mashups Roger ? Nous avons ensuite expérimenté un outil appelé Scénario.gg, qui est un outil destiné à la création d’actifs de jeu, mais qui propose également un moyen astucieux de former un générateur. Un bonus de celui-ci est que vous pouvez utiliser une image existante comme point de départ pour une génération, permettant un peu de contrôle supplémentaire sur la distance à laquelle vous vous rapprochez de ce point de départ. Voici quelques-uns de ces résultats :

Si vous suivez l’IA générative, vous savez que c’est un domaine qui évolue incroyablement rapidement en ce moment, avec de nouveaux outils, fonctionnalités et techniques qui sortent constamment. Quelques semaines après la génération initiale sur Astria, nous nous sommes replongés et ils ont maintenant une fonction de génération de vidéo. Un peu d’essais et d’erreurs plus tard, nous avons eu une petite vidéo super cool de Roger pour accompagner toutes ces photos :

Qu’avons-nous fait?

Nous avons soumis Roger à la sonnerie de l’IA, mais à quelle fin ? Désolé Roger, c’était au nom de… LA SCIENCE ! Et apprendre. Les premiers résultats expérimentaux sont sortis avec une tonne de quantité, mais la qualité n’était pas assez là. Au moins pour reproduire une mascotte de marque avec un look spécifique mais qui n’a peut-être pas été suffisamment diffusé pour avoir fait l’objet d’une formation sur les modèles. Si vous êtes un peu moins précis avec les résultats que vous essayez d’obtenir, l’imagerie par IA donne déjà des résultats à couper le souffle. Assez bien que nous trouvions d’autres façons d’utiliser ces images dans notre matériel marketing, et vous avez sans aucun doute vu des choses vraiment intéressantes dans vos différents flux. Pour obtenir une version de qualité de Roger dans un nouveau style ou une nouvelle pose, il serait plus efficace de demander à une personne réelle d’illustrer ou de rendre l’œuvre dans le style traditionnel.

Comme mentionné en haut de l’article, cette technologie se développe rapidement et il semble que le jeu change chaque semaine avec de nouveaux modèles et de nouvelles implémentations qui peuvent améliorer les résultats. Au moment de la publication de cet article, nous travaillons déjà sur un nouveau lot de Rogers en utilisant d’autres outils, alors attendez-vous à un suivi dans un proche avenir.

Roger est représentatif d’un outil logiciel avec lequel les humains peuvent s’interfacer pour réaliser de plus grandes choses. L’IA générative est un outil nouveau et potentiellement très puissant dans l’art et, pour nos besoins, dans le design de marque. Des personnes créatives et talentueuses sont toujours nécessaires pour guider le processus, prendre des décisions et organiser ou nettoyer les résultats. Alors, merci aux humains et aux robots de travailler ensemble pour réaliser des choses intéressantes ! Nous devrons juste voir où Moz et Roger vont avec cela ensuite.