Sprache
Discovery Call buchen
KI-Glossar · 27 Begriffe · Mai 2026

KI-Begriffeehrlich erklärt.

Was Agentic AI, MCP, RAG, GEO und AEO wirklich bedeuten — aus operativer Sicht eines KI-Operateurs, der 54 Agenten täglich produktiv betreibt. Keine Marketing-Buzzword-Übersetzung, sondern Praxis-Erklärungen für den Mittelstand.

A

AEO (Answer Engine Optimization)

AEO bezeichnet die Optimierung von Inhalten, sodass KI-Antwort-Systeme wie ChatGPT, Perplexity oder Google AI Overviews diese als direkte Antwort auf Nutzerfragen ausspielen.

AEO ergänzt klassische SEO um Formate, die KI-Systeme gut parsen können: FAQ-Schema, klare Definitionen, prägnante Antworten in den ersten 80 Wörtern, strukturierte Listen.

Praxis: Wer in AI Overviews zitiert werden will, muss Antwort-Sätze früh und klar formulieren — nicht erst nach drei narrativen Absätzen.

Agentic AI

Agentic AI bezeichnet KI-Systeme, die nicht nur antworten, sondern eigenständig handeln — Werkzeuge nutzen, mehrere Schritte hintereinander ausführen und sich selbst korrigieren.

Unterschied zur klassischen Chat-KI: Agentic AI führt Aufgaben aus statt nur Informationen zurückzugeben. Beispiel: nicht „schreibe mir eine E-Mail", sondern „beantworte alle Kunden-Anfragen von heute, eskaliere kritische Fälle an mich".

Praxis im Mittelstand: gute Agentic-Systeme haben Mensch-Loops an kritischen Stellen — KI bereitet vor, Mensch gibt frei.

AI Mode (Google)

AI Mode ist Googles vollständige KI-Sucherfahrung, die seit Mai 2026 standardmäßig in der Google-Suche angeboten wird — Queries werden konversationell beantwortet statt mit 10 blauen Links.

Powered by Gemini 3.5 Flash. Eine Milliarde monatliche Nutzer (Stand Mai 2026), Queries verdoppeln sich pro Quartal seit Launch.

Folge für Websites: 93 % der AI-Mode-Suchen enden ohne Klick. Sichtbarkeit verschiebt sich von Ranking zu Citation.

AI Overview

AI Overviews sind KI-generierte Zusammenfassungen am oberen Rand der Google-Suchergebnisse, die Antworten direkt synthetisieren und Quellen als Citation-Links angeben.

2,5 Milliarden monatliche Nutzer (Mai 2026). Senken die Click-Through-Rate auf Position 1 von 31,7 % auf 19,8 %.

Wer in AI Overviews zitiert wird, gewinnt — auch ohne Klick. Citation in der KI-Antwort ist die neue Hauptwährung der Sichtbarkeit.

AVV (Auftragsverarbeitungsvertrag)

Ein AVV regelt nach Art. 28 DSGVO die Datenverarbeitung zwischen einem Unternehmen und einem externen Dienstleister, der personenbezogene Daten im Auftrag verarbeitet.

Für KI-Anwendungen kritisch: wer Kundendaten an Claude API, OpenAI oder Vector-Stores schickt, braucht einen geeigneten AVV mit dem Anbieter — sonst ist die Verarbeitung nicht DSGVO-konform.

Anthropic und OpenAI bieten standardisierte AVVs mit EU-Datenresidenz. No-Code-Anbieter mit US-Daten-Routing oft nicht.

Autonomous Workflow

Autonomous Workflows sind automatisierte Abläufe, die ohne menschliche Auslösung laufen und über mehrere Systeme hinweg eigenständige Entscheidungen treffen.

Beispiel: ein Bestellprozess, der von Eingang über Lagerprüfung bis Versand-Bestätigung selbständig läuft. Oder eine Marketing-Kampagne, die sich tageweise selbst anpasst.

Falle im Mittelstand: „set-it-and-forget-it" funktioniert nicht. Echte autonome Workflows brauchen Monitoring, sonst läuft irgendwann etwas schief, ohne dass es jemand merkt.

C

Claude (Anthropic)

Claude ist eine Familie von Foundation Models von Anthropic, mit besonderem Fokus auf Reasoning, Coding-Aufgaben und sichere KI für Unternehmensanwendungen.

Drei Modell-Familien: Opus (höchste Qualität), Sonnet (Standard für Produktiv-Einsatz), Haiku (schnell und günstig). 2026 Industrieführer für Agentic-AI- und Coding-Aufgaben.

EU-Datenresidenz verfügbar. Bei Digital Maker primäres LLM für alle 54 produktiven Agenten.

Code-first

Code-first bezeichnet einen Ansatz, bei dem Automatisierungen und KI-Agenten direkt in Programmiersprachen wie Python geschrieben werden, statt über Klick-Interfaces (No-Code) konfiguriert.

Vorteile gegenüber No-Code (Zapier, n8n, Make.com): versioniert (Git), testbar, vollständig im Kundenbesitz, beliebig integrierbar, keine Vendor-Lock-in-Falle.

Bei Digital Maker baut jedes System diesen Weg — der Code gehört dem Kunden, ist dokumentiert und jederzeit übergebbar.

Context Window

Das Context Window ist die maximale Anzahl von Tokens, die ein LLM bei einer Anfrage gleichzeitig verarbeiten kann — also „wie viel Text die KI in einem Atemzug lesen und beantworten kann".

Stand 2026: typische Modelle haben 200.000 bis 1.000.000 Tokens (≈ 600 bis 3.000 Seiten Text). Mehr Context = bessere Antworten bei langen Dokumenten, aber höhere Kosten und Latenz.

Praxis: Für Unternehmenswissen wird häufig RAG eingesetzt, statt das ganze Dokument im Context Window zu halten.

D

DSGVO (bei KI)

Die DSGVO regelt seit 2018 europaweit die Verarbeitung personenbezogener Daten — bei KI-Anwendungen sind besonders Datenresidenz, Zweckbindung, Auskunftsrecht und automatisierte Entscheidungen (Art. 22) relevant.

Praxis: KI-Systeme müssen dokumentieren, welche personenbezogenen Daten sie verarbeiten und an welche Sub-Auftragsverarbeiter (z. B. Claude API). EU-Datenresidenz und ein AVV mit dem KI-Anbieter sind Pflicht.

Automatisierte Entscheidungen mit rechtlicher Wirkung dürfen ohne menschliche Freigabe nicht erfolgen — wichtig für Kreditentscheidungen, Bewerbungsauswahl, Versicherungstarife.

E

Embedded Operations

Embedded Operations bezeichnet ein Modell, bei dem ein externer Partner dauerhaft in den operativen Betrieb eines Unternehmens integriert ist, statt einzelne Projekte projektbasiert zu liefern.

Unterschied zur klassischen Berater-Mandanten-Beziehung: kein Anfang und Ende, kein „Konzept abgeben und verschwinden". Der Partner wird Teil des operativen Tagesgeschäfts und wächst mit dem Unternehmen.

Bei Digital Maker das Standard-Modell: zum Beispiel Dr. Bargello in Frankfurt seit über zwei Jahren, mit allen vier Ebenen (Brand, Buchung, Marketing, KI-Kommunikation) eingebettet.

Embedding

Ein Embedding ist eine numerische Repräsentation von Text (oder Bildern), die semantisch ähnliche Inhalte als geometrisch nahe Punkte in einem Vektorraum abbildet.

Embeddings sind die Grundlage für RAG: ein Vector Store speichert Embeddings von Dokumenten, bei einer Frage werden die ähnlichsten Embeddings gefunden und dem LLM als Kontext gegeben.

Praxis: 1.000 Dokumente einmalig embedden kostet wenige Cent. Danach sind semantische Suchen in Millisekunden möglich.

EU AI Act

Der EU AI Act ist die seit 2024 in Kraft getretene EU-Verordnung zur Regulierung von KI-Systemen, gegliedert nach Risikoklassen — mit konkreten Pflichten für Anbieter und Betreiber.

Vier Risikoklassen: minimal, limited, high und unacceptable. Hochrisiko-Systeme (z. B. Kreditvergabe, HR-Auswahl, Medizin) erfordern Risikomanagement, technische Dokumentation und menschliche Aufsicht.

Praxis für Mittelstand: die meisten KI-Anwendungen (Content, Reporting, Lead-Recherche) sind „limited risk". Wichtig ist Transparenz — Nutzer müssen wissen, wann sie mit KI interagieren.

F

Fine-Tuning

Fine-Tuning ist das Nachtrainieren eines vorhandenen Foundation Models auf eine spezifische Aufgabe oder einen Stil — mit eigenen Beispielen, die das Verhalten des Modells anpassen.

Wann es sich lohnt: nur wenn das Standardmodell konsistent dieselben Fehler macht und mindestens 1.000 hochwertige Beispiele für die Zielaufgabe vorliegen.

Realität im Mittelstand: für 95 % der Anwendungsfälle ist Prompt-Engineering plus RAG günstiger und ergebnisstärker als Fine-Tuning. Wer Fine-Tuning verkauft bekommt, sollte sehr genau nachfragen, warum nicht RAG.

Foundation Model

Ein Foundation Model ist ein großes, vortrainiertes KI-Modell, das auf breiten Daten basiert und als Basis für viele spezifische Anwendungen dient — typischerweise ein Large Language Model.

Beispiele: Claude (Anthropic), GPT (OpenAI), Gemini (Google), Llama (Meta), Mistral. Sie werden nicht für jeden Use-Case neu trainiert, sondern via Prompt oder Fine-Tuning angepasst.

Praxis: für Unternehmensanwendungen kommt es weniger auf das „beste" Modell an, sondern auf den passenden Mix aus Qualität, Kosten, Latenz und Compliance-Eigenschaften.

G

GEO (Generative Engine Optimization)

GEO ist die Optimierung von Inhalten dafür, in KI-generierten Antworten von ChatGPT, Google AI Overviews oder Perplexity als Quelle zitiert zu werden.

Wichtigste GEO-Hebel 2026: strukturierte Daten (Seiten mit Schema werden 60 % häufiger zitiert), Topical Authority via Content-Cluster, eigene Daten und Studien, Brand-Mentions auf autoritativen Quellen.

GEO ersetzt SEO nicht — es ergänzt es. 76 % der in AI Overviews zitierten URLs ranken bereits in den klassischen Top-10. Klassische SEO ist die Qualifikationsbedingung für KI-Citation.

H

Halluzination

Als Halluzination bezeichnet man falsche, erfundene oder nicht überprüfbare Aussagen, die ein LLM mit hoher Plausibilität ausgibt — typische Schwäche generativer KI.

Halluzinationen sind kein „Bug", sondern eine Folge der Funktionsweise: LLMs vervollständigen Wortwahrscheinlichkeiten, sie wissen nichts. Gegenmittel: RAG mit verifizierten Quellen, Mensch-Loops, Faktencheck-Schritte.

Praxis im Mittelstand: KI-Agenten sollten überall dort, wo Halluzinationen geschäftskritisch wären (Rechnungen, Compliance, Patientenkommunikation), nur vorbereitend arbeiten — Mensch gibt frei.

K

KI-Agent

Ein KI-Agent ist ein spezialisiertes KI-System, das eigenständig Werkzeuge nutzt, mehrere Schritte ausführen kann und auf ein definiertes Ziel hin arbeitet — wie ein digitaler Mitarbeiter mit klarem Auftrag.

Unterschied zum einfachen Chatbot: KI-Agenten greifen auf Tools (E-Mail, CRM, Datenbanken, MCP-Server) zu, treffen Zwischenentscheidungen und korrigieren sich selbst. Spezialisierung übersteigt Generalist-Modelle in der Praxis.

Bei Digital Maker laufen 54 spezialisierte KI-Agenten täglich produktiv (Stand Mai 2026) — in Akquise, Projektarbeit, Marketing, Coding und Reporting.

L

LLM (Large Language Model)

Ein Large Language Model ist ein neuronales Netz, das auf großen Textmengen trainiert wurde und Sprache verstehen, generieren und logisch verknüpfen kann.

Bekannteste Vertreter 2026: Claude, GPT, Gemini, Llama, Mistral. Gemessen werden sie üblicherweise an Reasoning-Benchmarks (MMLU, HumanEval, SWE-bench), Kosten pro Million Tokens und Latenz.

Praxis: in Unternehmensanwendungen ist das LLM nur eine Komponente — entscheidend sind RAG, Prompts, Tools und Workflow-Architektur.

M

MCP (Model Context Protocol)

MCP ist ein 2024 von Anthropic eingeführtes offenes Protokoll, das KI-Modelle standardisiert mit externen Datenquellen und Werkzeugen verbindet — wie ein „USB-Anschluss für KI".

2026 Industriestandard. Unterstützt von OpenAI, Google, Microsoft. Bereits verfügbare MCP-Server: Notion, Gmail, Slack, Asana, HubSpot, Stripe, GitHub, Google Ads, Meta Ads.

Praxis für Mittelstand: vor MCP war jede Integration zwischen KI und Geschäftssystem ein Custom-Projekt (Wochen Aufwand, fünfstellige Kosten). Mit MCP ist Plug-and-Play möglich — Integration in Tagen, nicht Monaten.

Multi-Modal AI

Multi-Modal AI bezeichnet KI-Systeme, die Text, Bilder, Audio und Video gleichzeitig verarbeiten und verknüpfen können — statt nur einen Eingabetyp zu unterstützen.

Beispiele aus der Praxis 2026: Foto vom Whiteboard wird zu strukturiertem Protokoll. Audio-Datei eines Meetings wird zur Action-Item-Liste. Produkt-Foto wird zu Produktbeschreibung.

Realität: funktioniert gut bei klaren Inputs, scheitert bei chaotischen Daten. Für regulierte Branchen (Medizin, Recht) Vorsicht — Multi-Modal-Antworten sind nicht so verlässlich wie Text-only.

N

No-Code

No-Code bezeichnet Plattformen wie Zapier, n8n oder Make.com, mit denen Workflows ohne Programmierung via Klick-Interface gebaut werden.

Vorteile: schneller Start, niedrige Einstiegshürde. Nachteile: nicht versionierbar, schwer testbar, Anbieter-Lock-in, oft instabil bei komplexeren Logiken, monatliche Preise können schnell skalieren.

Praxis-Empfehlung: für Prototypen und einfache Automatisierungen sinnvoll. Für geschäftskritische Workflows ist Code-first nachhaltiger.

P

Prompt Engineering

Prompt Engineering ist die Praxis, Anfragen an LLMs so zu formulieren und zu strukturieren, dass die Antworten qualitativ besser, konsistenter und für den Use-Case verwendbarer werden.

Techniken: Rollenangabe („Du bist ein erfahrener Steuerberater…"), Beispiele (Few-Shot), explizite Strukturvorgaben, Trennung von Anweisung und Daten.

Realität: gutes Prompt Engineering erreicht oft, was Anwender mit Fine-Tuning lösen wollten — zu einem Bruchteil der Kosten.

R

RAG (Retrieval-Augmented Generation)

RAG ist eine Technik, bei der ein LLM vor der Antwort gezielt auf eigene Unternehmensdaten zugreift, statt sich nur auf das Trainings-Wissen zu verlassen.

Funktionsweise: relevante Dokumente werden via Vector Store gefunden, dem LLM als Kontext mitgegeben, dann generiert das LLM eine fundierte Antwort. Reduziert Halluzinationen drastisch.

Wichtigste Technik der letzten zwei Jahre für Unternehmens-KI. Funktioniert sehr gut für strukturierte Wissensbasen (Notion, Confluence, PDFs), schwieriger bei chaotischen Datenquellen.

S

SEO (Search Engine Optimization)

SEO ist die Optimierung von Websites für die organischen Suchergebnisse klassischer Suchmaschinen wie Google — über Technik, Content, Schema und Backlinks.

2026 hat sich SEO verschoben: 76 % der in AI Overviews zitierten URLs ranken bereits in den klassischen Top-10. SEO bleibt also Vorbedingung, wird aber durch GEO und AEO ergänzt.

Praxis: weniger Fokus auf Keyword-Density, mehr auf Entitäten, Topical Authority und strukturierte Daten.

T

Token

Ein Token ist die Grundeinheit, in der LLMs Sprache verarbeiten — typischerweise ein Wortteil von 3 bis 4 Zeichen Länge. Anbieter rechnen Kosten pro Million Tokens ab.

Faustregel: 1 Token ≈ 0,75 Wörter im Deutschen. 1.000 Wörter ≈ 1.300 Tokens. Eine A4-Seite ≈ 500 Tokens.

Preise 2026 (Beispiel Claude Sonnet 4.5): $3 pro Million Input-Tokens, $15 pro Million Output-Tokens. Für einen typischen Mittelstand-Use-Case oft im einstelligen bis niedrigen zweistelligen Euro-Bereich pro Tag.

V

Vector Store

Ein Vector Store ist eine spezialisierte Datenbank für Embeddings — er ermöglicht semantische Suchen, bei denen Inhalte nach Bedeutung statt nach Schlagwörtern gefunden werden.

Bekannte Lösungen 2026: Qdrant (Open-Source, oft selbst gehostet), Pinecone (Cloud), Weaviate, ChromaDB. Bei Digital Maker primär Qdrant.

Praxis: für ein mittelständisches Unternehmen mit 10.000 Dokumenten ist ein Vector Store günstig zu betreiben — wenige Euro pro Monat. Performance: Suchen in Millisekunden.