Gemini
Was ist Gemini?
Gemini ist ein multimodaler KI-Assistent von Google, der auf leistungsstarken Large Language Models basiert.
Er wurde als Nachfolger von Google Bard entwickelt und kann Text, Bilder, Audio und Code verarbeiten sowie generieren.
Gemini ist in verschiedenen Varianten verfügbar und wird kontinuierlich weiterentwickelt.
Wie funktioniert Gemini?
Gemini funktioniert ähnlich wie andere Chatbots, kann jedoch in einer gesprächsähnlichen Art vielfältige Fragen beantworten und multimodal arbeiten.
Das bedeutet, dass sowohl diverse Medien wie Sprache oder Fotos eingegeben als auch unterschiedliche Formate wie Code oder Sprache ausgegeben werden können.
Gemini basiert auf fortschrittlichen KI-Modellen, die von Google DeepMind entwickelt wurden und auf der Transformer-Architektur mit einem stark erweiterten Kontexterfassungsfenster aufbauen.
Welche Gemini-Varianten gibt es?
Gemini wird in verschiedenen Varianten angeboten:
- Gemini 2.0 Flash: Die kostenlose Standardversion
- Gemini 2.5 Flash und Gemini 2.5 Pro: Neuere experimentelle Modelle
- Gemini Nano: Für lokale Nutzung auf Smartphones optimiert
- Gemini Ultra: Für komplexe Aufgaben, verfügbar in Gemini Advanced
- Gemini für Google Workspace: Business-Version für Gmail, Docs und andere Google-Dienste
Zusätzlich gibt es kostenpflichtige Versionen wie Google One AI Premium, Gemini Business und Gemini Enterprise.
Welche Funktionen bietet Gemini?
Gemini bietet zahlreiche Funktionen:
- Beantwortung komplexer Fragen mit Unterstützung durch Google Search
- Bildgenerierung mit dem Imagen 3-Modell
- Sprachinteraktion durch Gemini Live
- Unterstützung beim Schreiben und Textzusammenfassung
- Lernhilfen wie Studienpläne und Themenübersichten
- Integration mit Google-Diensten wie Gmail, Kalender, Maps und Fotos
- Deep Research für umfassende Recherchen
- Erstellung benutzerdefinierter KI-Experten (Gems)
- Analyse großer Dateien und Code-Repositories
Wie hat sich Gemini entwickelt?
Gemini wurde als direkte Reaktion auf den Erfolg von ChatGPT entwickelt und im März 2023 zunächst als Google Bard in eingeschränkter Kapazität veröffentlicht.
Der Chatbot basierte anfangs auf LaMDA, einem von Google AI entwickelten Large Language Model, bevor dieses durch das leistungsstärkere PaLM ersetzt wurde.
Seit Dezember 2023 greift Gemini auf das von DeepMind entwickelte gleichnamige LLM Gemini zurück. Im Jahr 2025 wurde das Modell durch Gemini 2.0 Flash und später durch Gemini 2.5 erweitert.
Wo ist Gemini verfügbar?
Gemini ist mittlerweile in über 40 Sprachen und mehr als 230 Ländern und Regionen verfügbar. Die Android-App ist in über 150 Ländern nutzbar und kann den Google Assistant ersetzen, der in reduzierter Form als Plug-In integriert ist.
Seit Juni 2024 ist die Gemini App auch in deutscher Sprache verfügbar.
Welche technischen Besonderheiten hat Gemini?
Gemini wurde von Anfang an multimodal konzipiert und kann verschiedene Arten von Informationen wie Text, Code, Audio, Bilder und Video nahtlos verstehen, verarbeiten und kombinieren.
Im Gegensatz zu früheren Ansätzen, bei denen separate Komponenten für verschiedene Modalitäten trainiert und dann zusammengefügt wurden, wurde Gemini von Grund auf für die gleichzeitige Verarbeitung verschiedener Modalitäten entwickelt.
Dies ermöglicht fortschrittliche Analysefähigkeiten und die Erkennung von Zusammenhängen in großen Datenmengen.
Wie wird Gemini für Entwickler angeboten?
Gemini steht Entwicklern über die Google AI Developer-Plattform zur Verfügung. Entwickler können mit einem API-Schlüssel auf Gemini-Modelle zugreifen und diese in ihre Anwendungen integrieren.
Zusätzlich bietet Google mit Gemma offene Modelle an, die auf derselben Technologie wie Gemini basieren, aber von Entwicklern mit eigenen Daten angepasst werden können.
Gemini unterstützt Entwickler auch als Coding-Agent, der bei der Codeanalyse, Codegenerierung und Problemlösung hilft.
Häufige Fragen (FAQ)
Was kostet die Nutzung von Gemini?
Die Basisversion von Gemini ist kostenlos nutzbar, während erweiterte Funktionen über kostenpflichtige Abonnements wie Google One AI Premium erhältlich sind.
Kann Gemini Bilder erstellen?
Ja, Gemini kann mit dem integrierten Imagen 3-Modell Bilder in verschiedenen Stilen generieren.
Wie unterscheidet sich Gemini von ChatGPT?
Gemini ist tief in das Google-Ökosystem integriert und kann direkt auf Google-Dienste wie Gmail und Maps zugreifen.
Welche Kontextgröße unterstützt Gemini?
Gemini Advanced kann mit einem Kontextfenster von bis zu 1 Million Tokens arbeiten und Dateien mit bis zu 1.500 Seiten verarbeiten.
Ist Gemini in allen Sprachen verfügbar?
Gemini unterstützt über 40 Sprachen, darunter Deutsch, Englisch, Spanisch, Französisch, Portugiesisch, Chinesisch, Japanisch und Koreanisch.
Verwandte Begriffe
- Large Language Model (LLM)
- Künstliche Intelligenz (KI)
- ChatGPT
- Google DeepMind
- Multimodale KI
- Transformer-Architektur
- Google Bard
- Natural Language Processing
- Prompt Engineering
- KI-Assistent