Preskočiť na hlavný obsahPreskočiť na hlavný obsah
Apertia.ai
Čo je RAG (Retrieval-Augmented Generation) vysvetlené ľudsky
AI vývoj & integrace20. apríla 2026|8 min

Čo je RAG (Retrieval-Augmented Generation) vysvetlené ľudsky

RAG je technológia, ktorá bráni AI v halucinovaní nad firemnými dátami. Zrozumiteľné vysvetlenie bez technického žargónu, porovnanie s alternatívami a praktické príklady, kedy ju potrebujete.

D
David Strejc
Apertia.ai
Zdieľať:
Čo je RAG Retrieval-Augmented Generation

Keď sa ChatGPT spýtate „koľko máme aktuálne skladom položky XYZ?“, dostanete buď ospravedlnenie, alebo si AI niečo vymyslí. Nie je to jej vina. Nemá prístup k vašim dátam. Presne tento problém rieši RAG (Retrieval-Augmented Generation), technológia, ktorá dnes stojí za väčšinou serióznych B2B AI projektov. A je to oveľa jednoduchší princíp, než naznačuje akademický názov.

V tomto článku vysvetlíme, čo RAG robí, kedy ho potrebujete, ako sa líši od fine-tuningu a ako vyzerá v praxi nad firemnými dátami. Bez technického žargónu, tak aby bolo jasné, prečo o ňom hovorí takmer každý dodávateľ B2B AI a kedy ho v projekte naozaj chcete.

1. Prečo AI bez RAG „halucinuje“

Veľké jazykové modely (LLM) ako GPT, Claude alebo Gemini vedia výborne generovať text a pôsobiť sebavedomo. Problém je, že keď sa ich spýtate na niečo, čo nevedia, často to nepriznajú. Namiesto toho vytvoria vierohodne znejúcu odpoveď. Tomu sa hovorí halucinácia.

Praktický príklad: spýtate sa ChatGPT „kedy nám končí zmluva s dodávateľom ABC?“. ChatGPT vašu zmluvu nevidel. Tú informáciu nemôže poznať. Napriek tomu môže vrátiť konkrétny dátum, číslo zmluvy aj paragraf. Všetko vymyslené, ale napísané presvedčivo.

Pri súkromnom použití je to nepríjemné. V biznise je to katastrofa. AI agent, ktorý halucinuje, je horší než žiadny AI agent, pretože podľa jeho odpovede môže niekto urobiť zlé rozhodnutie.

2. RAG vysvetlený cez analógiu: knihovník

Predstavte si AI bez RAG ako študenta, ktorý má urobiť skúšku z dejín vašej firmy. Pozná všeobecné dejiny sveta, ale o vašej firme nevie nič. Keď sa ho spýtate na konkrétny detail, buď prizná, že nevie, alebo začne fabulovať.

AI s RAG je ten istý študent, ale má pri sebe knihovníka. Keď položíte otázku, knihovník najprv nájde v archíve relevantné dokumenty, podá ich študentovi a študent na ich základe zostaví odpoveď. Ak knihovník nič relevantné nenájde, študent povie: „v dostupných materiáloch to nie je“.

To je RAG. Knihovník je vyhľadávacia vrstva. Archív sú vaše firemné dáta. Študent je LLM. Namiesto toho, aby si AI vymýšľala, číta vo vašich dokumentoch a odpovedá na základe nich. Preto tento typ riešenia v Apertii voláme AI knihovník.

3. Ako RAG funguje technicky, stručne a zrozumiteľne

Bez programátorských detailov, ale dosť na to, aby ste vedeli, o čom hovoríte na stretnutí s dodávateľom.

Krok 1: Príprava dát

Vaše dokumenty, napríklad zmluvy, manuály, e-maily, cenníky alebo znalostná báza, sa rozdelia na menšie časti. Typicky ide o odseky alebo bloky s 200 až 500 slovami. Každá časť sa pomocou embedding modelu prevedie na číselný vektor, teda matematické vyjadrenie významu textu. Vektory sa uložia do vektorovej databázy, napríklad Pinecone, Weaviate, Qdrant alebo pgvector.

Krok 2: Vyhľadanie

Keď používateľ položí otázku, rovnaký embedding model ju prevedie na vektor. Vektorová databáza nájde najpodobnejšie vektory, teda úryvky textu, ktoré sú významovo najbližšie k otázke. Typicky sa vráti tri až desať najrelevantnejších úryvkov.

Krok 3: Generovanie odpovede

LLM dostane inštrukciu: tu je otázka používateľa, tu sú relevantné úryvky z našich dokumentov, odpovedz podľa nich a ak informácia v úryvkoch nie je, povedz to. Model potom vygeneruje odpoveď.

Celý proces trvá zvyčajne jednu až tri sekundy. Pre používateľa to vyzerá jednoducho: AI pozná detaily jeho firmy.

4. RAG vs. fine-tuning: kedy použiť čo

Druhá metóda, ako dostať firemné znalosti do AI, je fine-tuning, teda dotrénovanie modelu na vašich dátach. Ľudia si tieto pojmy často mýlia. Rozdiely sú zásadné:

FaktorRAGFine-tuning
Aktualizácia dátOkamžitá, nový dokument sa môže používať hneďPomalá, model treba znovu trénovať
CenaNižšia, platíte databázu a prevádzkuVysoká, tréning, GPU a opakovaná práca
Vhodné preFakty, znalostné bázy, dokumentyŠtýl odpovedí, doménový jazyk, formát výstupu
HalucinácieVýrazne obmedzenéStále možné
AuditovateľnosťVysoká, vidíte zdroje odpovedeNízka

V 90 % B2B prípadov chcete RAG. Fine-tuning má zmysel vtedy, keď potrebujete veľmi špecifický štýl, jazyk alebo formát výstupu, ktorý sa nedá spoľahlivo dosiahnuť promptom. Často sa kombinujú: fine-tuning pre štýl, RAG pre fakty.

5. Reálne B2B scenáre, kde RAG mení výsledok

Interný AI knihovník

Zamestnanec sa spýta: „aký máme proces schvaľovania investícií nad 500 000 Kč?“ AI prehľadá interné smernice, nájde relevantný odsek a odpovie aj s odkazom na dokument. Človek nemusí pol hodiny prehľadávať SharePoint.

Chcete AI riešenie na mieru?

Pomáhame firmám automatizovať procesy pomocou AI. Napíšte nám a zistite, ako môžeme pomôcť práve vám.

  • Odpoveď do 24 hodín
  • Nezáväzná konzultácia
  • Riešenia na mieru vašej firme
Viac kontaktov

Zákaznícka podpora

Zákazník napíše, že mu nefunguje konkrétna funkcia. AI prehľadá manuály, FAQ, históriu ticketov aj predchádzajúce konverzácie tohto zákazníka a odpovie podľa konkrétneho postupu.

Právny asistent

Právnik hľadá, ako firma riešila podobný prípad minulý rok. AI prehľadá históriu zmlúv, e-maily a právnu dokumentáciu a vráti relevantné precedensy. Ručné hľadanie by trvalo hodiny. Podobne funguje právny bot.

HR onboarding

Nový zamestnanec sa pýta na benefity, dovolenku alebo parkovanie. AI odpovie zo smerníc. HR agent tak šetrí personalistom desiatky hodín mesačne na opakovaných otázkach.

AML compliance

Compliance officer sa pýta, ako firma riešila podobný rizikový profil klienta naposledy. AI prehľadá históriu AML rozhodnutí a odporučí ďalší postup. To je doménový scenár pre riešenie ako AML agent.

6. Čo robí RAG kvalitným

RAG nie je zázračná pilulka. Zle postavený RAG môže halucinovať takmer rovnako ako LLM bez RAG. Rozhoduje päť vecí:

1. Kvalita dokumentov

Ak máte desať rokov staré, duplicitné a neaktualizované dokumenty, RAG bude vracať chaos. Čistenie dát tvorí často 30 až 40 % úspechu projektu.

2. Stratégia delenia textu

Dokumenty treba rozdeliť tak, aby sa nestratil kontext. Zmluva rozdelená uprostred vety spôsobí, že dôležitá informácia bude chýbať. Dobrý chunking rešpektuje kapitoly, paragrafy, tabuľky a významové bloky.

3. Voľba embedding modelu

Pri slovenčine a češtine sú rozdiely medzi modelmi zásadné. Modely trénované prevažne na angličtine dosahujú v našich jazykoch slabšie výsledky. V praxi dávajú zmysel multilingválne modely typu OpenAI text-embedding-3-large alebo Cohere multilingual.

4. Reranking

Po prvom vyhľadaní sa výsledky znovu zoradia presnejším modelom. Je to drahšie, ale zvyšuje presnosť približne o 10 až 20 %. Pri kvalitných RAG systémoch je to štandard.

5. Meranie kvality

RAG treba merať. Koľko otázok malo dobrú odpoveď? Koľkokrát systém povedal „neviem“? Koľkokrát halucinoval? Bez metrík sa nedá spoľahlivo ladiť.

7. Pasce pri zavádzaní RAG

  • Natlačenie všetkých dokumentov naraz. Menej, ale relevantných dokumentov často znamená lepší výsledok.
  • Chýbajúca správa znalostnej bázy. Musí byť jasné, kto schvaľuje nové dokumenty a kto ich udržiava aktuálne.
  • Ignorovanie oprávnení. RAG musí rešpektovať prístupové práva. Finančný riaditeľ vidí iné dáta ako brigádnik.
  • Žiadna spätná väzba. Používateľ musí vedieť označiť zlú odpoveď, aby sa systém dal zlepšovať.
  • Lacný embedding model bez testovania. Slabé vyhľadávanie znamená slabé odpovede.

8. Cena RAG projektu pre českú firmu

Realistické čísla pre RAG postavený na mieru:

  • Malá firma do 1 000 dokumentov a jeden scenár: 220 000 – 400 000 Kč implementácia, 5 000 – 12 000 Kč mesačne
  • Stredne veľká firma s 1 000 až 50 000 dokumentmi a dvoma až tromi scenármi: 400 000 – 800 000 Kč implementácia, 12 000 – 35 000 Kč mesačne
  • Enterprise s 50 000+ dokumentmi, multi-tenant režimom a role-based access: 800 000 – 2 000 000 Kč implementácia, 35 000 – 120 000 Kč mesačne

Mesačná prevádzka rastie s objemom otázok, pretože každá otázka znamená vyhľadávanie vo vektorovej databáze a jedno volanie LLM.

9. RAG je dnes štandard, nie novinka

V roku 2023 bol RAG nová technológia. V roku 2026 je to štandard, ktorý používa každý vážny B2B AI projekt. Ak vám dodávateľ ponúka AI agenta nad firemnými dátami bez RAG, kupujete si potenciálny zdroj zlých informácií. Pýtajte sa, akú technológiu používa, akú vektorovú databázu volí a ako meria kvalitu odpovedí.

Záver: RAG je most medzi všeobecnou AI a vašou firmou

RAG robí zo všeobecného LLM užitočný nástroj pre váš konkrétny biznis. Namiesto vymýšľania číta vaše dokumenty a odpovedá podľa nich. Je to základ väčšiny B2B AI nasadení v roku 2026. Ak uvažujete o vlastnom AI agentovi, RAG je pravdepodobne technológia, ktorú potrebujete.

V Apertii staviame RAG systémy pre české firmy od základov: od čistenia dát cez architektúru až po monitoring kvality. Ak chcete pochopiť, čo je AI agent a ako by mohol fungovať vo vašej firme, alebo potrebujete posúdiť existujúci RAG projekt, napíšte nám cez kontakt a dohodneme konzultáciu.

Ak riešite AI špecificky pre automotive, napríklad katalógy náhradných dielov, servisné príručky alebo garančné podmienky, pozrite si sesterský projekt AutoERP, ktorý RAG aplikuje na automotive doménu.

Často kladené otázky (FAQ)

Nahradí RAG fine-tuning?

Nie. Dopĺňajú sa. RAG rieši znalosť faktov, fine-tuning štýl a doménový jazyk. Vo väčšine B2B prípadov stačí samotný RAG. Fine-tuning pridávajte až vtedy, keď máte konkrétny dôvod.

Akú veľkú znalostnú bázu RAG zvládne?

Súčasné vektorové databázy zvládajú milióny dokumentov. Limit zvyčajne nie je technológia, ale kvalita dát. Odporúčame začať s 500 až 2 000 najdôležitejšími dokumentmi, vyladiť kvalitu a potom rozsah postupne rozširovať.

Kde dáta fyzicky ležia? Nie je to bezpečnostné riziko?

Závisí od architektúry. Vektorová databáza môže byť v EU cloude, v českom dátovom centre alebo on-premise. Volania LLM môžete smerovať cez Azure OpenAI v EU regióne alebo cez vlastný self-hosted model ako Llama či Mistral. Pri citlivých dátach odporúčame on-premise alebo private cloud.

Pripravení začať?

Zaujal vás tento článok?

Poďme spolu preskúmať, ako AI môže transformovať vaše podnikanie.

Kontaktujte nás