OpenAI o1 – Die nächste Generation der KI-Modellierung

OpenAI o1

OpenAI o1, auch bekannt als Strawberry, hebt Künstliche Intelligenz auf ein neues Level. Mit einem tiefen Kontextverständnis übertrifft es seine Vorgänger deutlich. Erfahre, wie dieses Modell in Bereichen wie Programmierung und wissenschaftlicher Forschung neue Maßstäbe setzt und wie du das Verhalten mit einem Prompt auf andere Modelle übertragen kannst.

Rene, dein KI-Enthusiast und Blogger

Von: René

veröffentlicht:

zuletzt aktualisiert:

Künstliche Intelligenz (KI) und KI-Modelle sind nicht mehr aus unserem Alltag wegzudenken. Die Modelle werden regelmäßig weiterentwickelt und auch neue Modelle veröffentlicht. Das neueste Modell von OpenAI ist OpenAI o1 oder Strawberry. Doch was genau ist OpenAI o1? Was kann es besser als andere Modelle?

Inhaltsverzeichnis

Leistung und Benchmarking

Die Leistungsfähigkeit von KI-Modellen wird mittels Benchmarks verglichen. Inwieweit diese immer objektiv sind, musst du selbst einschätzen. Getrost dem Motto „Traue keinem Benchmark Ergebnis, dass du nicht selbst optimiert hast“.

Schon gewusst? OpenAI o1 beherrscht 50 % mehr Programmiersprachen als ChatGPT 4o.

Die nachfolgenden Daten stammen von OpenAI und unabhängigen Studien.

OpenAI o1 Vorgänger Genauigkeit bei komplexen Aufgaben OpenAI o1: Genauigkeit bei komplexen Aufgaben – 95% 95% Vorgänger: Genauigkeit bei komplexen Aufgaben – 82% 82% Kontextverständnis OpenAI o1: Kontextverständnis – 9,2 Vorgänger: Kontextverständnis – 7,5 9,2 7,5 Multitasking-Fähigkeit OpenAI o1: Vorgänger: OpenAI o1: Multitasking – 8 Aufgaben Vorgänger: Multitasking – 5 Aufgaben Codequalität in Wettbewerben OpenAI o1: Platz 95 in Wettbewerben Vorgänger: Platz 75 in Wettbewerben 95. 75. Mathematik Olympiade OpenAI o1: Mathematik Olympiade – 83% 83% Vorgänger: Mathematik Olympiade – 13% 13%

Daten basierend auf offiziellen OpenAI-Benchmarks und unabhängigen Studien, Stand: 15. September 2024

Was kann OpenAI o1 besser als frühere Modelle?

OpenAI o1 ist in den nachfolgenden Bereichen signifikant besser gegenüber den Vorgängern, hat aber auch Schwächen.

Vorteile

  • Genauigkeit: Die Präzision der Ergebnisse hat sich deutlich verbessert, insbesondere bei Aufgaben, die logisches Denken erfordern.
  • Kontextverständnis: o1 zeigt ein tieferes Verständnis für den Kontext einer Anfrage, was zu relevanteren Antworten führt.
  • Denkfähigkeit: o1 hat fortgeschrittene Fähigkeiten in den Bereichen Mathematik, Wissenschaft und Programmierung. Es beherrscht die „Chain of Thought-Technik”.
  • Schrittweise Problemlösung: o1 arbeitet schrittweise an komplexen Aufgaben, ein KI-Modell die Probleme in kleinere, lösbare Abschnitte zerlegt.

Nachteile

  • Verarbeitungsgeschwindigkeit: o1 ist auf das Lösen komplexe Aufgaben spezialisiert, indem es mehr Zeit für das Nachdenken nimmt. Das bedeutet eine geringere Verarbeitungsgeschwindigkeit.
  • Multitasking-Fähigkeit: Das Modell kann mehrere komplexe Aufgaben gleichzeitig bearbeiten, ohne an Leistung einzubüßen.
  • Multimodalität: o1 ist nicht multimodal, kann also nur Text, jedoch keine Bilder usw. verarbeiten.
  • Internetzugang: Es gibt keine Möglichkeit, das Internet zu durchsuchen.

Ergebnisse von Tests in Wettbewerben (z. B. Codeforces)

In Wettbewerben wie Codeforces hat OpenAI o1 beeindruckende Ergebnisse erzielt:

  • Ranglistenplatzierung: o1 erreichte Platzierungen im oberen Perzentil, oft sogar unter den Top 1 % der Teilnehmer.
  • Problemlösungsgeschwindigkeit: Das Modell konnte komplexe Algorithmen-Probleme in Rekordzeit lösen.
  • Codequalität: Die von o1 generierten Lösungen zeichneten sich durch hohe Effizienz und Lesbarkeit aus.

Ergebnisse bei der internationalen Mathematik-Olympiade

Das o1-Modell konnte 83 % der Aufgaben der internationalen Mathematik-Olympiade richtig lösen. Das bisherige Modell ChatGPT-4o löste nur 13 % der Aufgaben.

Wie nutzt man OpenAI o1?

OpenAI stellt o1 seit dem 12.09. zur Verfügung. Wichtig: Du benötigst ein ChatGPT Abo oder einen Teamzugang. Die dritte Möglichkeit ist die Auswahl des Modells in API. Schreib mir, falls du hier Hilfe brauchst.

Warnung für API Nutzer: OpenAI-o1 ist per API vergleichsweise teuer. Für 1 Million Output Token sind 60 USD fällig. Die unsichtbaren Schritte zur Problemlösung werden ebenfalls als Output Token abgerechnet. Das kann je nach Komplexität der Frage teuer werden.

Aufruf von OpenAI o1
Der Aufruf von o1 in ChatGPT (Quelle: OpenAI)

Du kannst als ChatGPT Plus- und Team-User das Chatmodell in ChatGPT auswählen.

Klicke hierzu die Modellauswahl an und selektiere das Modell.

Kostenlose Nutzer sollen demnächst Zugang zu o1-mini erhalten.

Da OpenAI-o1 deine Eingaben anders verarbeitet, solltest du deine Prompts anpassen. Formuliere deinen Prompt einfach und klar, verwende Überschriften, Anführungszeichen oder XML-Tags zur Strukturierung des Inhalts und stelle nur wesentliche Daten für die Problemlösung zur Verfügung. Agiere als … usw. sind nicht mehr notwendig.

Eine ausführliche Anleitung von OpenAI zur richtigen Prompterstellung findest du hier.

Welches Modell eignet sich, wofür am besten?

ChatGPT-4o-mini eignet sich für alltägliche, nicht komplexe Aufgaben und punktet mit einer höheren Geschwindigkeit.

Die Vorteile von ChatGPT-4o haben wir hier dargestellt. Es wird in den meisten Fällen ausreichend sein. Sein Vorteil ist die Multimodalität, es kann Dateien als Upload verarbeiten, Bilder erstellen und arbeitet zügig.

Ein Spezialist für knifflige und komplexe Aufgaben ist OpenAI o1. Ich verwende das Modell in allen Fällen, in denen ich eine tiefgehende Recherche benötige oder schwierige Fragestellungen mit einer gründlichen, durchdachten Antwort benötige. OpenAI-o1-mini eignet sich für weniger komplexe Fragen und punktet mit einer höheren Geschwindigkeit.

Tipp: Du kannst deinen Chat mit wenig komplexen Fragen mit ChatGPT-4o beginnen. Später kannst du innerhalb des Chats zu OpenAI-o1 wechseln, wenn deine Fragestellung komplexer wird. Achte in diesem Fall darauf, dass du keine Dateien einbindest. Der Wechsel des Modells klappt sonst nicht.

Lässt sich die Eigenschaft des Nachdenkens auf andere Modelle wie Claude und Gemini übertragen?

OpenAI o1 hat zweifelsohne besondere Fähigkeiten, durch die Fähigkeiten der schrittweisen Problemlösung sowie Denkfähigkeit. Das Verhalten kann man mit den anderen Modellen (ChatGPT 4o, Claude 3.5 Sonnet oder auf Gemini) nachahmen. Probiere die einfache Aufgabe mit dem Modell deiner Wahl.

Wieviele r sind in "strategische Nachhaltigkeitsrisikoinventur" enthalten?

Ich bekomme mit ChatGPT 4o die falsche Antwort:

Es sind insgesamt 4 Buchstaben "r" in dem Wort "strategische Nachhaltigkeitsrisikoinventur" enthalten.

KI-Modelle haben bekanntlich Schwierigkeiten mit Rechtschreibung (warum, erfährst du hier). Für einen Menschen ist die Aufgabe nicht schwer. Wir zählen die Buchstaben einfach durch. Das kann die KI nicht, da sie keine Wörter, sondern Wahrscheinlichkeiten sieht.

Du bist ein erstklassiges KI-System, fähig zu komplexem Denken und Reflexion. Bitte nimm dir einen Moment Zeit, um gründlich über dies folgende Frage nachzudenken. Ich möchte eine wohlüberlegte und durchdachte Antwort erhalten. Denke über die Anfrage in -Tags nach und gib deine endgültige Antwort in -Tags. Falls du einen Fehler in deinem Denken erkennst, korrigiere dich in -Tags. Wieviele r sind in "strategische Nachhaltigkeitsrisikoinventur" enthalten?

Die Antwort lautet nun wie folgt:

Ich werde das Wort "strategische Nachhaltigkeitsrisikoinventur" Buchstabe für Buchstabe durchgehen und die Anzahl der Buchstaben "r" zählen.
<Zählen>

s
t
r (1)
a
t
e
g
i
s
c
h
e
N
a
c
h
h
a
l
t
s
k
e
i
t
s
r (2)
i
s
i
k
o
i
n
v
e
n
t
u
r (3) </Zählen>
Das Wort "strategische Nachhaltigkeitsrisikoinventur" enthält 3 Buchstaben "r".

Die Antwort ist jetzt richtig. Welchen Unterschied die Anpassung im Prompt macht. Probiere den Prompt gern selbst aus.

Die mit einem * Symbol gekennzeichneten Links sind Affiliate-Links. Erfolgt darüber ein Einkauf, erhalten wir eine Provision ohne Mehrkosten für dich. Die redaktionelle Auswahl und Bewertung der Produkte bleibt davon unbeeinflusst. Dein Klick hilft bei der Finanzierung unseres kostenfreien Angebots. Erfahre mehr.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Mehr…!