Mit FLUX.2 hat das weltweit beliebte Bild-KI-Modell von Black Forest Labs mit Sitz in Freiburg jetzt einen Nachfolger erhalten. Wie sein Vorgänger folgt auch FLUX.2 dem „Open Core“-Ansatz. Das Modell kann also lokal betrieben werden und Nutzer können es für ihre Bedürfnisse anpassen. FLUX.1 gilt als eines der populärsten offenen Bildmodelle. Das KI-Start-up wurde erst vor einem Jahr gegründet.

Weiterlesen nach der Anzeige

Die neue Version rüstet Fähigkeiten nach, die FLUX.1 noch vermissen ließ. Dazu zählt zum Beispiel eine bessere Textdarstellung. Das Modell soll Typografie, Infografiken, Memes und Entwürfe für Benutzeroberflächen mit gut lesbarem Text ausgeben. Wer aufbauend auf früheren Bildern etwas generieren möchte, kann jetzt bis zu zehn Referenzbilder gleichzeitig einbinden. Vorher war nur ein einzelnes möglich. Damit sollen Charaktere, Produkte und Stile bei Folge-Bilderzeugnissen gleichbleibend aussehen.

Erweitertes Weltwissen und höhere Auflösung

Die Entwickler versprechen außerdem schärfere Texturen, präzisere Details und stabiles Licht. Damit soll FLUX.2 besser für Produktbilder geeignet sein. In diesem Zusammenhang dürfte auch die bessere Befolgung von Prompts hilfreich sein. Komplexe, mehrteilige Anweisungen sollen zuverlässiger umgesetzt werden.

Das neue Modell verfügt außerdem über erweitertes Weltwissen. Ein besseres Verständnis von Physik, Beleuchtung und räumlichen Zusammenhängen soll die Erzeugnisse realistischer aussehen lassen. Zudem ist Bildbearbeitung bis zu einer Auflösung von 4 Megapixel möglich, die Seitenverhältnisse sind flexibler einstellbar.

Verschiedene Modellvarianten

FLUX.2 gibt es in verschiedenen Modellvarianten. FLUX.2 pro mit höchster Qualität steht über API und Partner zur Verfügung. FLUX.2 flex erlaubt Entwicklern volle Kontrolle über Parameter, ist aber auch nur per API und Partner nutzbar. FLUX.2 dev mit 32 Milliarden Parametern kann unter anderem bei Hugging Face als Open-Weight-Modell heruntergeladen werden. Black Forest Labs hat außerdem noch FLUX.2 klein angekündigt, ein Open-Source-Modell, das aktuell in einer geschlossenen Beta zur Verfügung steht. Und es gibt noch FLUX.2 VAE als Komponente, einen neuen Autoencoder als Basis aller FLUX.2-Modelle.

Weiterlesen nach der Anzeige

(mki)

Dieser Link ist leider nicht mehr gültig.

Links zu verschenkten Artikeln werden ungültig,
wenn diese älter als 7 Tage sind oder zu oft aufgerufen wurden.

Sie benötigen ein heise+ Paket, um diesen Artikel zu lesen. Jetzt eine Woche unverbindlich testen – ohne Verpflichtung!