novembre 29, 2023

Les meilleures sonneries, jeux et applications pour ton mobile

Image d'un caméléon dans le désert qui représente CM3Leon

La saisie d'un simple prompt ("Un petit cactus portant un chapeau de paille et des lunettes de soleil fluo dans le désert du Sahara") a été tout ce qu'il a fallu pour créer cette image inédite. - Photographie Courtesy of Meta©

CM3Léon : Meta prend le défi de l’IA générative d’images

Meta, la société derrière Facebook, continue d’élargir son arsenal d’intelligences artificielles créatives. Après le succès de MusicGen qui génère de la musique à partir d’un texte, de LLaMA et du studio Voicebox qui transforme les textes en audio, voici CM3Léon, une nouvelle IA générative d’images.

Meta révolutionne la création d’images avec CM3Léon

Meta, le géant américain, vient d’annoncer la création de sa propre technologie d’intelligence artificielle, baptisée CM3Léon. Cette IA générative d’images est capable de produire des illustrations de haute qualité en réponse à de simples requêtes écrites. Le modèle multimodal de CM3Léon permet d’obtenir des images à partir de textes et vice versa. Malgré une base d’apprentissage encore restreinte et une puissance de calcul inférieure à la concurrence, Meta se vante de sa capacité à générer des images cohérentes, mettant en évidence les détails, tout en répondant parfaitement aux prompts lancés. Cette initiative de Meta fait suite à l’émergence de phénomènes similaires tels que Dall-E, Midjourney et Adobe Firefly ces derniers mois. Après le lancement de Threads, son alternative à Twitter, Meta continue de marquer sa présence dans le domaine de l’innovation technologique.

Comment fonctionne cette IA générative d’images ?

Meta a dévoilé CM3Léon, son puissant modèle multimodal d’intelligence artificielle, capable de produire des images à partir de textes et vice versa. Malgré une base d’apprentissage encore en développement et une puissance de calcul relativement inférieure à la concurrence, cette IA générative d’images se distingue par sa capacité à générer des images cohérentes, riches en détails, répondant parfaitement aux requêtes émises. Pour démontrer ses incroyables compétences, Meta a publié des images générées à partir de prompts originaux, tels qu’un cactus portant chapeau de paille et lunettes de soleil fluo dans le désert du Sahara, un raton laveur animé se préparant pour une bataille épique avec un sabre de samouraï, ou encore un panneau d’arrêt fantastique affichant le texte ‘1991’. L’IA offre également la possibilité d’affiner les images par de simples correctifs, tels que l’ajout de lunettes de soleil, de peinture sur le visage, ou de faire ressembler un portrait à une personne de 100 ans. »

La sortie de LLaMA2 en accès libre vient en parallèle

L’année dernière, OpenAI a lancé ChatGPT avec un succès fulgurant, ouvrant ainsi la voie à une compétition acharnée dans le domaine de l’IA générative, capable de répondre à des questions en langage naturel et de produire divers types de textes. Microsoft, principal investisseur d’OpenAI, et Google sont en tête de ce secteur, mais de nombreux géants technologiques investissent massivement dans cette nouvelle génération d’IA, malgré les controverses concernant ses erreurs et ses dangers potentiels. Meta a donc lui aussi été très actif dans le domaine de l’intelligence artificielle ces derniers mois, dévoilant LLaMA, un modèle réservé aux chercheurs universitaires. Le 18 juillet 2023, la société mère de Facebook et Instagram a rendu public Llama 2, un modèle de traitement du langage en libre accès, rivalisant ainsi avec les modèles payants tels que GPT-4 et PaLM.

MusicGen et MusicLM : des outils concurrents pour composer de la musique

MusicGen et MusicLM sont deux outils concurrents d’intelligence artificielle (IA) développés par Google. MusicLM a été dévoilé en janvier 2023 et propose une fonctionnalité qui permet de composer un morceau en réponse à un prompt ou une mélodie fredonnée par l’utilisateur. Concrètement, l’utilisateur décrit le style musical souhaité, et le modèle génère automatiquement un extrait original de 12 secondes correspondant à la demande. De plus, pour affiner la requête, il est possible de télécharger une mélodie existante qui sera prise en compte par l’IA dans la composition du morceau. MusicGen, quant à lui, est un autre outil IA développé par une autre entité et présente des caractéristiques similaires à MusicLM dans le domaine de la composition musicale automatisée.

Le studio VoiceBox pour la génération de voix

Intitulée « VoiceBox », cette intelligence artificielle dédiée à la génération de voix se positionne comme l’équivalent de ChatGPT et DALL-E pour la génération de texte et d’images. Elle repose sur un modèle d’apprentissage qui intègre la parole dans un contexte textuel et audio. L’IA est nourrie par 50 000 heures d’enregistrements de livres audio en français, anglais, espagnol, allemand, polonais et portugais. En voilà plusieurs outils déployés avant CM3 par Méta pour être dans les rangs de cette course dans le domaine de l’intelligence artificielle.

 Avec ETX/DailyUp