OpenAI stellt Operator vor — Ein neuer KI-Agent für ChatGPT, der in der Lage ist, Internetaktionen im Namen der Nutzer durchzuführen

Die amerikanische Forschungsorganisation OpenAI hat eine neue Funktion für ChatGPT mit dem Namen Operator vorgestellt. Dieser KI-Agent kann autonom Aktionen im Internet im Auftrag der Nutzer ausführen.

Operator wird von einem neuen Modell namens Computer-Using Agent (CUA) betrieben. Durch die Kombination der visuellen Fähigkeiten von GPT-4o mit fortgeschrittenem Denken durch verstärkendes Lernen wurde CUA trainiert, mit grafischen Benutzeroberflächen (GUIs) zu interagieren—den Schaltflächen, Menüs und Textfeldern, die Menschen auf einem Bildschirm sehen.

Operator kann „sehen“ (durch Screenshots) und „interagieren“ (unter Verwendung aller Aktionen, die eine Maus und eine Tastatur ermöglichen) mit einem Browser, was es ihm ermöglicht, im Web zu handeln, ohne benutzerdefinierte API-Integrationen zu benötigen.
— laut Beschreibung

Hier sind einige Funktionen, die von Operator unterstützt werden:

  • Zutaten für ein Gericht basierend auf Fotos und einem Rezept bestellen;
  • Reisen planen basierend auf dem Budget und den Interessen des Nutzers sowie Informationen aus Reddit-Foren;
  • Kryptowährungsinvestitionsmöglichkeiten erkunden, basierend auf Token, die in Zukunft populär werden könnten;
  • Flüge und Unterkünfte über Booking buchen;
  • Friseurtermine basierend auf einem Zeitplan in Google Kalender planen;
  • Geschenke für eine Mutter, Ehefrau oder eine andere geliebte Person finden;
  • Haushaltsreinigungen über die Integration mit dem Thumbtack-Service bestellen;
  • Nach erschwinglicher Krankenversicherung suchen;
  • Verschiedene Dienstleistungen finden, wie z.B. einen Hundespaziergang in verschiedenen Ländern zu organisieren.

Bemerkenswert ist, dass die Funktion sich weigern kann, bestimmte Aktionen auszuführen, die Schaden verursachen oder eine potenzielle Bedrohung darstellen könnten. Operator unterstützt fast alle HTTPS-Protokoll-Websites sowie einige Dienste und Anwendungen.

Bei der Verwendung der Operator-Funktion wird ein verschlüsselter Browser in der Cloud gestartet. Wenn gewünscht, kann der Nutzer die Kontrolle übernehmen und die Aufgabe anpassen. In bestimmten Situationen, wie z.B. beim Einkaufen auf Websites, muss der Nutzer die Anfrage bestätigen.

In den USA haben Besitzer des Premium-ChatGPT-Pro-Plans (zum Preis von 200 $ pro Monat) bereits frühzeitigen Zugang zu Operator erhalten. In naher Zukunft plant OpenAI, die Unterstützung für die Plus-, Team- und Enterprise-Pläne zu erweitern. Die Funktion ist derzeit in der EU nicht verfügbar.

Früher berichteten wir über eine neue KI-Funktion für das Reddit -Forum.

Der Beitrag wurde übersetzt. Original anzeigen (EN)
0
Author's Userpic
Автор новостей и статей
С 2003-го в теме. До безумия люблю Survival Horror и Sci-Fi.
Kommentare 0