Die KI von Microsoft läuft auf Low-End-CPUs und spart 6x Speicher

18 April 2025, 18:27

Microsoft-Spezialisten haben das Sprachmodell BitNet b1.58 2B4T entwickelt, das trotz seiner kompakten Größe Ergebnisse liefert, die mit größeren Gegenstücken vergleichbar sind. Sein Hauptmerkmal ist die Fähigkeit, auf Standard-CPUs ohne die Notwendigkeit von grafischen Beschleunigern zu laufen. Dies eröffnet den Zugang zu KI-Technologien für Geräte mit begrenzten Ressourcen.

Statt standardmäßiger 16- oder 32-Bit-Berechnungen verwendet das Modell vereinfachte 1-Bit-Operationen mit drei Zuständen: -1, 0 und +1. Dieser Ansatz reduziert den Speicherbedarf auf 400 MB – im Vergleich dazu benötigt der nächstgelegene Konkurrent von Google (Gemma 3 1B) 1,4 GB. Die Einsparungen werden durch einen grundlegend anderen Ansatz zur Datenverarbeitung erzielt: Statt komplexer mathematischer Operationen verlässt sich das System auf optimierte binäre Algorithmen.

Während der Tests wurde BitNet mit Modellen von Meta (LLaMa 3.2 1B), Google (Gemma 3 1B) und Alibaba (Qwen 2.5 1.5B) verglichen. Trotz seiner kleineren Größe erzielte Microsofts Entwicklung einen Durchschnittswert von 54,19 in umfassenden Tests, übertraf LLaMa (44,90) und Gemma (43,74) und lag nur leicht hinter Qwen (55,23), das 6,5-mal mehr Speicher benötigt. In spezifischen Aufgaben im Zusammenhang mit der Textanalyse hatte BitNet die Nase vorn.

Für maximale Effizienz benötigt das Modell das spezielle Framework bitnet.cpp, verfügbar im offenen GitHub-Repository. Standardwerkzeuge wie die Transformers-Bibliothek schalten sein Potenzial nicht vollständig frei. Entwickler weisen darauf hin, dass die aktuelle Version für CPUs optimiert ist, zukünftige Updates jedoch Unterstützung für Neuroprozessoren und GPUs hinzufügen werden.

BitNet ist ein Beispiel für den Trend zu „leichten“ KI-Modellen. Solche Lösungen reduzieren den Energieverbrauch und ermöglichen es, komplexe Algorithmen auf Geräten ohne Zugang zu Cloud-Diensten auszuführen. Dies ist besonders relevant für Regionen mit langsamen Internetverbindungen oder beim Umgang mit vertraulichen Daten, bei denen die Übertragung von Informationen zu Rechenzentren unerwünscht ist. Laut den Entwicklern ist es ihr Ziel, KI-Technologien ohne Hardware-Upgrades zugänglich zu machen, was den Ansatz zur Entwicklung von KI-gestützten Anwendungen verändern könnte.

Der Beitrag wurde übersetzt. Original anzeigen (EN)

PC Nachrichten Hardware und Technologien Microsoft

Über den Autor

Arkadiy Andrienko

Autor von Artikeln und Nachrichten

Als technischer Journalist bei VGTimes diskutiere ich mit gleicher Freude über die neuesten Grafikkarten und vertiefe mich in die Feinheiten klassischer RPGs. Seit 2018 schreibe ich über Spiele und Hardware, meine Erfahrung im Bereich der Tontechnik hat es mir ermöglicht, die Nuancen der Audiotechnologien gut zu verstehen, und ich bin immer auf der Suche nach etwas Neuem im Bereich der Gaming-Hardware. Wenn ich nicht über Technologien schreibe, erkunde ich wahrscheinlich die post-apokalyptischen Ödlande in Fallout, leite eine Kolonie in RimWorld oder kommandiere Armeen in Hearts of Iron IV. Für mich sind Spiele mehr als nur ein Hobby – sie sind eine Leidenschaft, die mein kreatives Potenzial antreibt und die Verbindung zur sich ständig weiterentwickelnden Welt der Technologien aufrechterhält.

...Erweitern

Kommentare0