KI-Modelle im Einsatz

Zuletzt geprüft: 5. Juni 2026. Quartalsweise überprüft.

Diese Seite nennt jeden KI-Anbieter und jede Modellfamilie, an die Corial Produktionsanfragen weiterleitet: wo die Inferenz je nach Stufe stattfindet, die Trainingsdaten-Richtlinie des Anbieters, seinen veröffentlichten Sicherheitsrahmen und die unabhängigen Drittbewertungen, die ihre Modelle erhalten haben.

Wir legen nicht offen, welches konkrete Modell welche konkrete Aufgabe innerhalb von Corial übernimmt. Dieses Routing ist Teil der Funktionsweise des Produkts und ändert sich mit der Zeit, wenn die Anbieter neue Versionen veröffentlichen. Die Menge der Anbieter und die von uns genutzten Modellfamilien sind stabil und öffentlich.

Wir zitieren Drittbewertungen, anstatt eigene zu erfinden. Konkret: den Stanford Foundation Model Transparency Index (FMTI) für Entwicklertransparenz und das MLCommons AILuminate Safety-Benchmark für das Sicherheitsverhalten von Modellen. Beide sind unabhängig. Beide sind unvollkommen. Beide sind besser als eine Selbstbewertung des Anbieters.

Wofür Corial KI einsetzt

Im gesamten Produkt übernimmt KI das Verstehen natürlicher Sprache, die Extraktion aus unstrukturierten Eingaben (Sprachnotizen, E-Mails, Dokumente), Zusammenfassung, Klassifizierung, Entwurf, Reasoning über Kundenbeziehungskontext und verankerte Web-Recherchen. Bild- und PDF-Verständnis für eingespeiste Dokumente. Keine autonome kundenseitige Kommunikation — jede externe Nachricht wird von der KI entworfen und von einem Menschen versandt.

Anthropic

Genutzte Modellfamilien	Claude Opus, Claude Sonnet, Claude Haiku
Inferenzregion	Standard-Stufe: Vereinigte Staaten, über die API von Anthropic. EU-Residenz-Stufe: Europäische Union, betrieben auf Google Cloud Vertex AI unter Lizenz.
Training mit Kundendaten	Vertraglich ausgeschlossen — Kundendaten werden nicht zum Training von Anthropic-Modellen genutzt, gemäß deren kommerziellen Bedingungen.
Veröffentlichter Sicherheitsrahmen	Responsible Scaling Policy (versioniert, öffentlich)
Stanford FMTI 2025	36 / 100. Mittlere Gruppe der Branche, zusammen mit Google, OpenAI, Meta. Stanford CRFM
MLCommons AILuminate v1.0	Very Good (Claude 3.5 Sonnet und Claude 3.5 Haiku). Neuere Claude 4.x-Versionen wurden noch nicht in das öffentliche v1.0-Benchmark aufgenommen. AILuminate

Google

Genutzte Modellfamilien	Gemini Flash, Gemini Flash-Lite
Inferenzregion	Standard-Stufe: Vereinigte Staaten, über Google AI Studio. EU-Residenz-Stufe: Europäische Union Multi-Region, über Google Cloud Vertex AI.
Training mit Kundendaten	Bezahlte API und Vertex AI: vertraglich ausgeschlossen — Daten werden nicht zum Training von Google-Modellen verwendet. Siehe Google Cloud Data Processing Addendum.
Veröffentlichter Sicherheitsrahmen	Google DeepMind Frontier Safety Framework (versioniert, öffentlich)
Stanford FMTI 2025	36 / 100. Mittlere Gruppe der Branche. Stanford CRFM
MLCommons AILuminate v1.0	Good (Gemini 1.5 Pro, Gemini 2.0 Flash, Gemini 2.0 Flash Lite). Gemini 3.x-Versionen wurden noch nicht in das öffentliche v1.0-Benchmark aufgenommen. AILuminate

Mistral AI

Genutzte Modellfamilien	Mistral Large, Mistral Medium, Mistral Small
Inferenzregion	Frankreich (Europäische Union), über Mistral La Plateforme.
Training mit Kundendaten	Vertraglich ausgeschlossen — Kundendaten werden nicht zum Training von Mistral-Modellen genutzt, gemäß deren kommerziellen Bedingungen.
Veröffentlichter Sicherheitsrahmen	Mistral AI Sicherheitsposition (öffentlich; weniger detailliert als Anthropic oder Google)
Stanford FMTI 2025	15 / 100. Untere Gruppe der Branche. Mistral ist deutlich weniger transparent bezüglich Trainingsdaten und Evaluierung als US-Wettbewerber — ein echter Kompromiss für den EU-souveränen Vorteil, den sie bieten. Stanford CRFM
MLCommons AILuminate v1.0	Gemischt je nach Version. Mistral Large 2402 mit Output-Moderation: Very Good. Mistral Large 24.11 und Ministral 8B (API, ohne Moderation): Fair. AILuminate

Ehrliche Anmerkungen zu den Bewertungen

Der FMTI-Branchendurchschnitt 2025 sank auf 40 von 100, gegenüber 58 im Jahr 2024. Stanfords Einschätzung: Die Transparenz in der KI-Branche hat sich verschlechtert. Anthropic, Google und Mistral erzielten 2025 alle niedrigere Werte als im Vorjahr. Wir nutzen diese Bewertungen trotzdem, weil sie das beste verfügbare unabhängige Maß sind — nicht weil sie durchgängig gut sind.
AILuminate v1.0 wurde Anfang 2025 veröffentlicht. Frontier-Modelle, die später erschienen (Claude 4.x, Gemini 3.x, Mistral Large 3), wurden noch nicht in das öffentliche Benchmark aufgenommen. Wir erwarten, dass spätere Versionen mit der Zeit ergänzt werden, und aktualisieren diese Seite entsprechend.
Der FMTI misst die Entwicklertransparenz, nicht die Modellsicherheit. AILuminate misst das Sicherheitsverhalten von Modellen, nicht die Entwicklertransparenz. Sie beantworten unterschiedliche Fragen, und wir veröffentlichen beide.

Überprüfungsrhythmus

Die Modellauswahl wird quartalsweise gegen die in der Charta für verantwortungsvollen KI-Einsatz veröffentlichten Kriterien geprüft: Leistungsfähigkeit, Region, Trainingsdaten-Richtlinie, veröffentlichter Sicherheitsrahmen, unabhängige Transparenzbewertung, Kosten und Latenz. Die auf dieser Seite aufgeführten Anbieter und Modellfamilien spiegeln den Produktionsstand zum Zeitpunkt der letzten Überprüfung wider.

Änderungen bei Auftragsverarbeitern (Hinzufügen oder Entfernen eines Anbieters) werden Kunden mindestens 30 Tage im Voraus mitgeteilt.

Siehe auch: Vertrauen · Charta für verantwortungsvollen KI-Einsatz · Auftragsverarbeiter · Datenschutzerklärung