Direkt zum Inhalt

Zitierfähige Version

Unter dieser URL finden Sie dauerhaft die unten aufgeführte Version Ihrer Definition:
Revision von Bildgenerator vom 12.03.2024 - 11:10

Bildgenerator

Definition: Was ist "Bildgenerator"?

Bildgeneratoren sind Anwendungen, die auf künstlicher Intelligenz (KI) beruhen und nach einem Input des Benutzers (einem Prompt) alle möglichen digitalen Bilder hervorbringen bzw. verändern, etwa fotorealistische Darstellungen, Zeichnungen, Gemälde oder Logos. Dabei kann man oft Stile und Formate vorgeben und im Dialog – in dem der Bildgenerator zum Chatbot wird – die Ergebnisse verbessern. Es handelt sich um Ausprägungen des maschinellen Lernens, wobei neuronale Netzwerke eine grundlegende Rolle spielen. Man spricht auch von KI-basierten Bildgeneratoren oder KI-Bildgeneratoren.

Geprüftes Wissen

GEPRÜFTES WISSEN
Über 200 Experten aus Wissenschaft und Praxis.
Mehr als 25.000 Stichwörter kostenlos Online.
Das Original: Gabler Wirtschaftslexikon

zuletzt besuchte Definitionen...

    Ausführliche Definition im Online-Lexikon

    Inhaltsverzeichnis

    1. Allgemein
    2. Entwicklung und Beispiele
    3. Anwendungsbereiche
    4. Zurückweisung und Zensur
    5. Kritik und Ausblick

    Allgemein

    Bildgeneratoren sind Anwendungen, die auf künstlicher Intelligenz (KI) beruhen und nach einem Input des Benutzers (einem Prompt) alle möglichen digitalen Bilder hervorbringen bzw. verändern, etwa fotorealistische Darstellungen, Zeichnungen, Gemälde oder Logos. Dabei kann man oft Stile und Formate vorgeben und im Dialog – in dem der Bildgenerator zum Chatbot wird – die Ergebnisse verbessern. Es handelt sich um Ausprägungen des maschinellen Lernens, wobei neuronale Netzwerke eine grundlegende Rolle spielen. Man spricht auch von KI-basierten Bildgeneratoren oder KI-Bildgeneratoren. Der Vorgang ist die Bildgenerierung oder Bildsynthese (engl. "image synthesis"), wobei diese Begriffe wiederum mit dem Verweis auf KI präzisiert werden können. Bildgeneratoren gehören wie Textgeneratoren und Audiogeneratoren (darunter Musikgeneratoren) zur generativen KI (Generative AI). Nahe Verwandte sind Videogeneratoren.

    Entwicklung und Beispiele

    Für Bildgeneratoren werden ganz unterschiedliche Algorithmen verwendet, unter ihnen Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs) und Diffusionsmodelle. Große Aufmerksamkeit erregte ab Januar 2021 DALL-E, das wie ChatGPT auf dem Generative Pre-trained Transformer (GPT) beruht und von OpenAI stammt. DALL-E 2 wurde im April 2022 freigeschaltet, DALL-E 3 mit seinen herausragenden Fähigkeiten im Oktober 2023. Konkurrenten sind Midjourney und Stable Diffusion. Ideogram ist spezialisiert darauf, Textelemente ins Bild zu integrieren, etwa ein Schild oder eine Tafel mit einer Aufschrift. Klassische Bildbearbeitungsprogramme wie Adobe Photoshop wurden mit generativer KI erweitert.

    Anwendungsbereiche

    Bildgeneratoren können dazu dienen, Illustrationen von Broschüren, Zeitschriften, Zeitungen und Büchern sowie Abbildungen für E-Learning-Kurse und für Marketingmaßnahmen zu erstellen. Sie können zur Visualisierung genutzt werden, etwa in der Architektur, indem sie Modelle von Gebäuden hervorbringen und die geplanten Objekte in der gewünschten Umgebung zeigen, oder in der Geomatik, indem sie zu vermessende Objekte zueinander in Beziehung setzen. Sie erlauben Kunstprojekte, bei denen entweder nur Bilder veröffentlicht oder diese mit Texten ergänzt werden. Die Ergebnisse von Bildgeneratoren überschwemmen traditionelle Bildplattformen, von denen manche selbst generative KI einbeziehen.

    Zurückweisung und Zensur

    Einige Bildgeneratoren lehnen Prompts ab, wenn sie gegen die eigenen Richtlinien oder gegen anerkannte Leitlinien und bestehende Gesetze verstoßen. Bei DALL-E 3 nimmt ChatGPT die Prompts des Benutzers entgegen und formuliert daraus eigene Prompts, die dann weitergereicht werden. Widersprechen diese den Richtlinien, werden sie nicht ausgeführt. Ideogram geht in diesem Kontext anders vor. Zunächst beginnt es mit dem Generieren, wobei es den "generation progress" in Prozent anzeigt. Sobald es erkennt, dass unerwünschte Elemente auf dem Bild vorkommen, wird dieses vor der Fertigstellung – also bevor 100 Prozent erreicht sind – durch eine Kachel mit einer Katze ersetzt, die ein Schild mit der Aufschrift "MAYBE NOT SAFE" trägt. Dies kann wohlgemerkt auch passieren, wenn die Eingabe des Benutzers völlig unproblematisch ist. Bei amerikanischen Plattformen sind i.d.R. nackte Körper und insbesondere Geschlechtsteile und Brustwarzen verboten. Die eine oder andere Zurückweisung kann als Zensur aufgefasst werden.

    Kritik und Ausblick

    Bildgeneratoren eröffnen Laien wie Experten neue Perspektiven. Sie tragen zu einer Professionalisierung von Anwendungsbereichen bei und erhöhen Effizienz und Effektivität. Zugleich etablieren einige Bildgeneratoren eine bestimmte Bildsprache mit einer gewissen Einförmigkeit und Künstlichkeit und einer Neigung zu Kitsch. Schnittstellen wie ChatGPT machen Prompt Design ein Stück weit überflüssig, was für Laien eine Erleichterung, für Experten eine Einschränkung bedeuten und insgesamt eine Unwägbarkeit mit sich bringen kann. Informationsethik und Medienethik behandeln die moralischen Aspekte der Bildgenerierung, etwa im Hinblick auf Zensur, Manipulation, Suggestion, Propaganda und Hypermoral. Die Wirtschaftsethik untersucht, wie Bildgeneratoren die Arbeit unterstützen und ersetzen und wie Anwender von Konzernen abhängig werden.

    GEPRÜFTES WISSEN
    Über 200 Experten aus Wissenschaft und Praxis.
    Mehr als 25.000 Stichwörter kostenlos Online.
    Das Original: Gabler Wirtschaftslexikon

    zuletzt besuchte Definitionen...

      Literaturhinweise SpringerProfessional.de

      Bücher auf springer.com