„KI“, die geheime Zutat, die aktuell allerhand Produkte und Dienste auf magische Art und Weise verbessert und Lösungen für noch nie dagewesene Probleme bereitstellt. Es ist ein sehr interessantes Thema, welches jedoch an vielen Stellen nicht so richtig greifbar ist. Oftmals ist es auch nur ein Marketing-Werkzeug, wie bei der KI-Cola…
Ich habe mir in letzter Zeit ein paar Open-Source Projekte angeschaut, welche künstliche Intelligenz bzw. trainierte Datenmodelle nutzen, um beispielweise Bilder zu generieren oder natürlich auf Fragen zu antworten. Mein persönlicher Fokus lag dabei auf Lösungen, welche lokal auf dem PC laufen, also keine aktive Internetverbindung benötigen. Entsprechend potente Hardware wird jedoch vorausgesetzt.
Vorab sei gesagt, dass die Installation bzw. die Konfiguration vieler Tools noch nicht sonderlich einsteigerfreundlich ist und mit einigen Tücken daherkommen kann. Arbeiten mit der Kommandozeile, Einlesen in Dokumentationen/Wikis, sowie Kämpfen mit Python Abhängigkeiten kann erforderlich sein. Zum Glück gibt es mittlerweile gefühlt für alles entsprechende Anleitungen auf Youtube.
Bilder generieren
Stable Diffusion kann vereinfacht gesagt aus Text Bilder generieren oder bestehende Bilder verändern. So wird beispielweise aus dem Prompt „the legend of zelda and halo crossover link armor and big triforce logo on chest“ folgendes Bild:
Hierbei gilt: je genauer die Beschreibung, desto besser das Ergebnis. Du musst jedoch ein wenig mit den Eingaben und den Parametern herumspielen. Ein Zufallsmechanismus sorgt dafür, dass der gleiche Befehl jedes Mal ein unterschiedliches Resultat ausgespuckt. Es lohnt sich also, mehrere Vorschläge gleichzeitig generieren zu lassen. Manchmal erhältst du jedoch unfreiwillig auch Albtraum-Material.