OpenAI führt über seine API ein neues Feature für GPT-3.5 Turbo ein, das die kostenlose Version von ChatGPT antreibt.

Dieses neue Feature ermöglicht es, das Modell mit benutzerdefinierten Daten zu trainieren, z.B. mit Firmendokumenten oder Projektunterlagen. OpenAI behauptet, dass ein fein abgestimmtes Modell in bestimmten Szenarien die gleiche Leistung wie GPT-4 erbringen kann, jedoch zu geringeren Kosten.

Feinabstimmung bezieht sich in der KI auf den Prozess, ein vortrainiertes neuronales Netzwerk (wie GPT-3.5 Turbo) weiter auf einem anderen Datensatz (wie Ihren benutzerdefinierten Daten) zu trainieren, der in der Regel kleiner ist und möglicherweise mit einer bestimmten Aufgabe zusammenhängt. Dieser Prozess baut auf dem Wissen auf, das das Modell während seiner anfänglichen Trainingsphase erlangt hat, und verfeinert es für eine spezifische Anwendung.

Kurz gesagt, ermöglicht die Feinabstimmung GPT-3.5 Turbo, benutzerdefinierte Inhalte wie Projektunterlagen oder andere schriftliche Referenzen zu verstehen. Das kann nützlich sein, wenn Sie einen KI-Assistenten auf Basis von GPT-3.5 erstellen möchten, der mit Ihrem Produkt oder Ihrer Dienstleistung vertraut ist, aber keine Kenntnisse darüber in seinen Trainingsdaten hat (die, zur Erinnerung, vor September 2021 aus dem Web gesammelt wurden).

ChatGPT KI AI
“Seit der Veröffentlichung von GPT-3.5 Turbo haben Entwickler und Unternehmen nach der Möglichkeit gefragt, das Modell anzupassen, um einzigartige und differenzierte Erlebnisse für ihre Nutzer zu schaffen”, schreibt OpenAI in ihrem Werbeblog. “Mit dieser Einführung können Entwickler nun überwachte Feinabstimmungen durchführen, um dieses Modell besser für ihre Anwendungsfälle geeignet zu machen.”

Während GPT-4, der leistungsstärkere Verwandte von GPT-3.5, als Generalist bekannt ist und sich vielen Themen anpassen kann, ist er langsamer und teurer im Betrieb. OpenAI bewirbt die Feinabstimmung von 3.5 als Möglichkeit, eine GPT-4-ähnliche Leistung in einem bestimmten Wissensbereich zu einem geringeren Preis und schnellerer Ausführungszeit zu erhalten. “Erste Tests haben gezeigt, dass eine feinabgestimmte Version von GPT-3.5 Turbo bestimmte schmale Aufgaben auf GPT-4-Niveau erreichen oder sogar übertreffen kann”, schreibt OpenAI.

Außerdem gibt OpenAI an, dass feinabgestimmte Modelle eine “verbesserte Steuerbarkeit” bieten, was bedeutet, dass sie Anweisungen besser befolgen; “zuverlässige Ausgabenausrichtung”, was die Fähigkeit des Modells verbessert, Text konsistent in einem Format wie API-Aufrufen oder JSON auszugeben; und “benutzerdefinierte Stimmung”, mit der ein individueller Geschmack oder eine Persönlichkeit in einen Chatbot integriert werden kann.

OpenAI sagt, dass die Feinabstimmung es den Benutzern ermöglicht, ihre Eingabeaufforderungen zu verkürzen und bei OpenAI API-Aufrufen Geld zu sparen, die pro Token abgerechnet werden. “Erste Tester haben die Größe der Eingabeaufforderung durch die Feinabstimmung in das Modell selbst um bis zu 90% reduziert”, sagt OpenAI. Derzeit ist die Kontextlänge für die Feinabstimmung auf 4.000 Tokens festgelegt, aber OpenAI sagt, dass die Feinabstimmung später in diesem Herbst auf das 16.000-Token-Modell ausgeweitet wird.

Die Verwendung eigener Daten hat ihren Preis

Inzwischen fragen Sie sich vielleicht, wie die Verwendung eigener Daten zur Schulung von GPT-3.5 funktioniert – und was es kostet. OpenAI skizziert auf ihrem Blog einen vereinfachten Prozess, der das Einrichten einer Systemaufforderung mit der API zeigt, das Hochladen von Dateien an OpenAI zum Training und das Erstellen einer Feinabstimmungs-Aufgabe mithilfe des Befehlszeilenwerkzeugs “curl” zum Abfragen einer API-Webadresse. Sobald der Feinabstimmungsprozess abgeschlossen ist, steht das angepasste Modell sofort zur Verwendung zur Verfügung, mit denselben Ratenbegrenzungen wie das Basismodell. Weitere Details finden Sie in der offiziellen Dokumentation von OpenAI.