Stable Diffusion est un modèle d'apprentissage automatique permettant de générer des images numériques photoréalistes à partir de descriptions en langage naturel. Le modèle peut également être utilisé pour d'autres tâches, comme la génération d'une image améliorée à partir d'une esquisse et d'une description textuelle.
Il peut fonctionner sur la plupart des matériels grand public équipés d'une carte graphique même de moyenne gamme et est salué par PC World comme « la prochaine application phare pour votre ordinateur ».
Contrairement aux modèles concurrents comme DALL-E, le code source de Stable Diffusion est public. Ceci a suscité deux types de critiques : celles qui auraient préféré l'usage d'une licence authentiquement libre, et celles déplorant purement et simplement qu'une telle publication ait lieu.
Malgré la publication de son code source, Stable Diffusion n'est pas un logiciel libre, car sa licence, dite CreativeML Open RAIL M License, interdit certains cas d'utilisation, ce qui est contraire à un principe de base de la fondation pour le logiciel libre.
Les critiques déplorant la publication du code source peuvent en général être liées aux inquiétudes concernant l'éthique de l'intelligence artificielle. Elles s'appuient sur l'hypothèse que le modèle peut être utilisé pour créer des deepfakes et remettent également en question la légalité de la génération d'images avec un modèle formé sur un ensemble de données incluant du contenu protégé par le droit d'auteur sans le consentement des artistes originaux.
Stable Diffusion est formé sur un sous-ensemble de l'ensemble de données . Il est construit sur pour un coût de .
En janvier 2023, trois artistes - Sarah Andersen, Kelly McKernan et Karla Ortiz - intentent une action en justice contre Stability AI, Midjourney et DeviantArt, créateurs des générateurs d'art Stable Diffusion, Midjourney et DreamUp, affirmant que ces sociétés ont violé les droits de « millions d'artistes » en entraînant leurs outils d'intelligence artificielle sur cinq milliards d'images extraites du web .
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Midjourney est un laboratoire de recherche indépendant qui produit un programme d'intelligence artificielle sous le même nom et qui permet de créer des images à partir de descriptions textuelles, suivant un fonctionnement similaire à celui de DALL-E d'OpenAI. Midjourney a été fondée par David Holz, cofondateur de Leap Motion. Il est entré pour la première fois en version bêta ouverte le 12 juillet 2022, et est utilisable au travers d’un bot Discord. La société a travaillé sur l'amélioration de ses algorithmes.
DALL-E (ou DALL·E, à prononcer Dali, en référence à Salvador Dali) est un programme d'intelligence artificielle générative, capable de créer des images à partir de descriptions textuelles. Son nom est un mot-valise évoquant à la fois le robot de Pixar WALL-E et le peintre Salvador Dalí. DALL-E utilise une version à de paramètres du modèle de langage GPT-3 pour interpréter les entrées (commandes) en langage naturel (telles que par exemple : « un sac à main en cuir vert en forme de pentagone » ou « une vue isométrique d'un capybara triste »), et générer les images demandées.
vignette|Portrait d'Edmond de Belamy, œuvre créée grâce à une intelligence artificielle par le collectif français Obvious en 2018. L'art créé par intelligence artificielle (en Artificial intelligence art ou AI art) est toute œuvre d'art créée par une personne avec l'interventionnisme d'une intelligence artificielle. Il existe de nombreux mécanismes pour créer de l'art IA, notamment la génération procédurale d'images basée sur des règles à l'aide de modèles mathématiques, des algorithmes qui simulent des coups de pinceau et d'autres effets de peinture, et des algorithmes d'intelligence artificielle ou d'apprentissage profond tels que les réseaux antagonistes génératifs et les transformateurs.
Deep Learning (DL) is the subset of Machine learning reshaping the future of transportation and mobility. In this class, we will show how DL can be used to teach autonomous vehicles to detect objects,
The Deep Learning for NLP course provides an overview of neural network based methods applied to text. The focus is on models particularly suited to the properties of human language, such as categori
This course aims to introduce the basic principles of machine learning in the context of the digital humanities. We will cover both supervised and unsupervised learning techniques, and study and imple
Couvre les techniques de réduction de dimensionnalité non linéaire à l'aide d'autoencodeurs, d'autoencodeurs profonds et d'autoencodeurs convolutifs pour diverses applications.
Explore Transformers dans la vision informatique, se concentrant sur l'architecture 'Attention est tout ce dont vous avez besoin' et ses applications dans les tâches visuelles.
Current transformer-based skeletal action recognition models tend to focus on a limited set of joints and low-level motion patterns to predict action classes. This results in significant performance degradation under small skeleton perturbations or changin ...
2024
, ,
Mapping behavioural actions to neural activity is a fundamental goal of neuroscience. As our ability to record large neural and behavioural data increases, there is growing interest in modelling neural dynamics during adaptive behaviours to probe neural re ...
NATURE PORTFOLIO2023
, ,
Recently, it has been exposed that some modern facial recognition systems could discriminate specific demographic groups and may lead to unfair attention with respect to various facial attributes such as gender and origin. The main reason are the biases in ...