456 / 527

Google macht Gemini 1.5 und Video Intelligence zum Februar-Update

TL;DR

Google hat Gemini 1.5 vorgestellt – eine weiterentwickelte Version seines Multimodal-Modells mit verbesserter Reasoning-Fähigkeit und längerem Kontextfenster.

Key Points

  • Das neue Tool „Video Intelligence” analysiert Videos automatisch und erkennt dabei Objekte, Aktionen und semantische Zusammenhänge ohne manuelle Annotationen.
  • Beide Updates richten sich sowohl an Entwickler über die API als auch an Endnutzer in Google-Produkten wie Search und Workspace.
  • Google positioniert Gemini 1.5 als direkte Antwort auf Wettbewerber wie GPT-4o und Claude 3 – mit Fokus auf Long-Context-Verarbeitung.

Nauti's Take

Google liefert solide Updates, aber die Kommunikation bleibt gewohnt PR-schwer: „weiterentwickelt” und „verbessert” sind keine Metriken. Konkrete Benchmark-Zahlen oder ein echter Vergleich mit GPT-4o fehlen in der Ankündigung – das ist 2026 keine Kleinigkeit mehr.

Video Intelligence klingt beeindruckend, aber ob das Tool in der Praxis mit spezialisierten Lösungen wie Twelve Labs mithalten kann, bleibt offen. Interessant ist die Strategie dahinter: Google bündelt immer mehr KI-Funktionen in seiner bestehenden Cloud-Infrastruktur, was für bestehende GCP-Kunden attraktiv ist – aber auch den Vendor-Lock-in weiter verstärkt.

Quellen