Versionen

Verfügbare Modellvarianten im Überblick

Modell	Release	Stärken	Schwächen	Status
Jamba2 Mini Empfohlen	Januar 2026	52B Parameter (12B aktiv) 256k Kontextfenster Apache 2.0	—	Aktuell
Jamba2 3B	Januar 2026	Sehr effizient Apache 2.0	Kleinere Kapazität	Aktuell
Jamba 1.5 Large	2024	Open Weights Self-Hosting möglich	—	Aktuell
Jamba 1.5 Mini	2024	Open Weights Kompakt	—	Aktuell

Technische Details

API, Features und Capabilities

API & Verfügbarkeit

Verfügbarkeit Public

Requests/Min 1000

Latenz (TTFT) ~300ms

Durchsatz ~200 Tokens/Sek

Features & Capabilities

Tool Use Function Calling Structured Output Datei-Upload

Training & Wissen

Wissensstand 2024-03

Fine-Tuning Verfügbar (Fine-tuning API, LoRA (Open Models))

Sprachunterstützung

Beste Qualität Englisch, Spanisch, Französisch, Portugiesisch, Italienisch, Deutsch, Arabisch, Hebraeisch

Unterstützt 10+ Sprachen

Stark in Englisch, gut in westlichen Sprachen, nativ in Hebraeisch

Hosting & Compliance

DSGVO-konforme Hosting-Optionen und Lizenzierung

DSGVO-konforme Hosting-Optionen

Lizenz & Hosting

Lizenz Apache 2.0 (Jamba2), Jamba Open Model License (Jamba 1.5)

Sicherheitsfilter Anpassbar

Enterprise Support Ja

SLA verfügbar Ja

On-Premise

Als KI-Beratung aus Rosenheim empfehlen wir AI21 Jamba für Unternehmen, die extrem lange Dokumente verarbeiten müssen. Mit 256k Tokens Kontextfenster können Sie ganze Bücher auf einmal analysieren.

Innovative Architektur

AI21 Labs ist ein isrälisches KI-Unternehmen, das mit Jamba eine einzigartige Hybrid-Architektur entwickelt hat: die Kombination aus Mamba (State Space Model) und Transformer.

Warum Jamba für Unternehmen?

256k Kontext: Einer der längsten Kontexte am Markt
Effizient: Mö-Architektur reduziert Ressourcenbedarf
Open Models: Jamba 1.5 unter Jamba Open Model License, Jamba2 unter Apache 2.0
Mehrsprachig: Starke Unterstützung für viele Sprachen
EU-verfügbar: Über AWS Bedrock Frankfurt

Besondere Stärken

Mamba-Transformer-Hybrid

Jamba kombiniert zwei Architekturen:

Mamba Layers: Effiziente Verarbeitung langer Sequenzen
Transformer Layers: Präzises Attention für Details
MoE: Mixture-of-Experts für Effizienz

Diese Kombination ermöglicht:

3x schnellere Inferenz bei langen Kontexten
2x weniger Speicherbedarf
Lineare statt quadratische Skalierung

Extrem langer Kontext

256.000 Tokens bedeuten:

~640 Seiten Text auf einmal
Ganze Bücher analysieren
Komplette Codebases verstehen
Umfangreiche Rechtsverträge prüfen

Open-Source-Option

Jamba 1.5 ist als Open-Source verfügbar:

Jamba Open Model License
Self-Hosting möglich
Volle Kontrolle über Daten
Community-getrieben

Hardware-Anforderungen (Self-Hosted)

Modell	VRAM	Empfohlene GPU
Jamba2 Mini	48 GB	A100 80GB
Jamba 1.5 Large	160 GB	Multi-A100
Jamba 1.5 Mini	24 GB	RTX 4090

Vergleich zu anderen Modellen

Feature	Jamba2	GPT-4	Claude 3
Kontext	256k	128k	200k
Architektur	Hybrid	Transformer	Transformer
Open Source	Ja (1.5)	Nein	Nein
Mö	Ja	Nein	Nein

Integration mit CompanyGPT

AI21 Jamba kann in CompanyGPT integriert werden - ideal für Unternehmen mit umfangreichen Dokumentenbeständen.

Unsere Empfehlung

AI21 Jamba2 Mini ist unsere Top-Empfehlung für Dokumentenanalyse und lange Texte. Wenn Sie regelmässig mit sehr langen Dokumenten arbeiten (Rechtsverträge, Buchmanuskripte, Code-Reviews), ist Jamba die beste Wahl.

Für allgemeine Anwendungen ohne besonderen Fokus auf lange Kontexte empfehlen wir Google Gemini (bis zu 1M Kontext) oder OpenAI GPT.

AI21 Jamba

Versionen

Einsatzbereiche