RAG (Retrieval Augmented Generation) – RAG je moderní technologie v oblasti umělé inteligence a zpracování přirozeného jazyka, která kombinuje schopnosti velkých jazykových modelů (LLM) s vyhledáváním relevantních informací v externích databázích nebo zdrojích. Na rozdíl od tradičních jazykových modelů, které generují odpovědi pouze na základě svých tréninkových dat, RAG umožňuje modelům před generováním odpovědi vyhledat a začlenit aktuální a přesné informace z předem definovaných zdrojů. Díky tomu jsou odpovědi přesnější, spolehlivější a lépe reflektují aktuální znalosti.
RAG funguje ve čtyřech hlavních krocích:
- Indexace: Externí data jsou převedena do vektorových reprezentací a uložena v databázi, což umožňuje efektivní vyhledávání.
- Vyhledávání (Retrieval): Na základě uživatelského dotazu systém vyhledá relevantní dokumenty či informace z databáze.
- Rozšíření dotazu (Augmentation): Vyhledané informace jsou přidány do vstupu pro jazykový model, aby mohl generovat odpověď s využitím těchto dat.
- Generování odpovědi: Model vytvoří odpověď kombinující své znalosti a získané externí informace.
Tato technologie pomáhá snižovat chyby a tzv. „halucinace“ AI, zvyšuje transparentnost tím, že umožňuje uvádět zdroje informací, a eliminuje potřebu častého přeškolování modelů, protože nové informace lze jednoduše přidávat do externí databáze.
RAG nachází uplatnění například v chatbotích systémech, které potřebují přístup k interním firemním datům, v expertních systémech nebo v aplikacích vyžadujících aktuální a přesné informace.
Zdroje
- Wikipedia. (2025). Retrieval-augmented generation. Retrieved from https://cs.wikipedia.org/wiki/Retrieval-augmented_generation
- Unite.AI. (2024). Co je Retrieval Augmented Generation? Retrieved from https://www.unite.ai/cs/what-is-retrieval-augmented-generation/
- Moravio. (2024). Retrieval Augmented Generation (RAG) – Vývoj a aplikace. Retrieved from https://www.moravio.com/cs/technologie/rag
- Amazon Web Services (AWS). (2025). What is Retrieval-Augmented Generation? Retrieved from https://aws.amazon.com/what-is/retrieval-augmented-generation/
- NVIDIA Blog. (2024). What Is Retrieval-Augmented Generation aka RAG. Retrieved from https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/