DeepSeek hat Janus-Pro-7B veröffentlicht und übertrifft DALL-E 3 und Stable Diffusion in der Bildgenerierungsfähigkeit

Die chinesische Firma DeepSeek hat ihr neues multimodales neuronales Netzwerk Janus-Pro-7B vorgestellt, das für eine effiziente Bilderkennung und -generierung entwickelt wurde. Im Vergleich zu früheren Versionen wurde das neue Modell erheblich verbessert: Die Trainingsalgorithmen wurden optimiert, der Datensatz erweitert und die Modellgröße erhöht. Diese Änderungen haben es dem neuronalen Netzwerk ermöglicht, seine Leistung bei Aufgaben im Zusammenhang mit der Bilderzeugung aus textuellen Beschreibungen und der Bildanalyse erheblich zu steigern.

Janus-Pro-7B hat bekannte Modelle wie DALL-E 3 und Stable Diffusion in den GenEval- und DPG-Bench-Tests übertroffen. Dieses neuronale Netzwerk bietet hohe Detailgenauigkeit und Realismus bei der Bilderstellung, was es zu einem starken Konkurrenten gegenüber anderen Lösungen macht. Das Modell ist bereits auf der Hugging Face-Plattform verfügbar, und der Code kann kostenlos von GitHub heruntergeladen werden, was Forschern und Entwicklern ermöglicht, zu seiner Entwicklung beizutragen.

Der Beitrag wurde übersetzt. Original anzeigen (EN)
0
Kommentare 0