Čo je RAG (Retrieval-Augmented Generation) vysvetlené ľudsky
RAG je technológia, ktorá bráni AI v halucinovaní nad firemnými dátami. Zrozumiteľné vysvetlenie bez technického žargónu, porovnanie s alternatívami a praktické príklady, kedy ju potrebujete.
D
David Strejc
Apertia.ai
Zdieľať:
Keď sa ChatGPT spýtate „koľko máme aktuálne skladom položky XYZ?“, dostanete buď ospravedlnenie, alebo si AI niečo vymyslí. Nie je to jej vina. Nemá prístup k vašim dátam. Presne tento problém rieši RAG (Retrieval-Augmented Generation), technológia, ktorá dnes stojí za väčšinou serióznych B2BAI projektov. A je to oveľa jednoduchší princíp, než naznačuje akademický názov.
V tomto článku vysvetlíme, čo RAG robí, kedy ho potrebujete, ako sa líši od fine-tuningu a ako vyzerá v praxi nad firemnými dátami. Bez technického žargónu, tak aby bolo jasné, prečo o ňom hovorí takmer každý dodávateľ B2BAI a kedy ho v projekte naozaj chcete.
Veľké jazykové modely (LLM) ako GPT, Claude alebo Gemini vedia výborne generovať text a pôsobiť sebavedomo. Problém je, že keď sa ich spýtate na niečo, čo nevedia, často to nepriznajú. Namiesto toho vytvoria vierohodne znejúcu odpoveď. Tomu sa hovorí halucinácia.
Praktický príklad: spýtate sa ChatGPT „kedy nám končí zmluva s dodávateľom ABC?“. ChatGPT vašu zmluvu nevidel. Tú informáciu nemôže poznať. Napriek tomu môže vrátiť konkrétny dátum, číslo zmluvy aj paragraf. Všetko vymyslené, ale napísané presvedčivo.
Pri súkromnom použití je to nepríjemné. V biznise je to katastrofa. AIagent, ktorý halucinuje, je horší než žiadny AIagent, pretože podľa jeho odpovede môže niekto urobiť zlé rozhodnutie.
2. RAG vysvetlený cez analógiu: knihovník
Predstavte si AI bez RAG ako študenta, ktorý má urobiť skúšku z dejín vašej firmy. Pozná všeobecné dejiny sveta, ale o vašej firme nevie nič. Keď sa ho spýtate na konkrétny detail, buď prizná, že nevie, alebo začne fabulovať.
AI s RAG je ten istý študent, ale má pri sebe knihovníka. Keď položíte otázku, knihovník najprv nájde v archíve relevantné dokumenty, podá ich študentovi a študent na ich základe zostaví odpoveď. Ak knihovník nič relevantné nenájde, študent povie: „v dostupných materiáloch to nie je“.
To je RAG. Knihovník je vyhľadávacia vrstva. Archív sú vaše firemné dáta. Študent je LLM. Namiesto toho, aby si AI vymýšľala, číta vo vašich dokumentoch a odpovedá na základe nich. Preto tento typ riešenia v Apertii voláme AI knihovník.
3. Ako RAG funguje technicky, stručne a zrozumiteľne
Bez programátorských detailov, ale dosť na to, aby ste vedeli, o čom hovoríte na stretnutí s dodávateľom.
Krok 1: Príprava dát
Vaše dokumenty, napríklad zmluvy, manuály, e-maily, cenníky alebo znalostná báza, sa rozdelia na menšie časti. Typicky ide o odseky alebo bloky s 200 až 500 slovami. Každá časť sa pomocou embedding modelu prevedie na číselný vektor, teda matematické vyjadrenie významu textu. Vektory sa uložia do vektorovej databázy, napríklad Pinecone, Weaviate, Qdrant alebo pgvector.
Krok 2: Vyhľadanie
Keď používateľ položí otázku, rovnaký embedding model ju prevedie na vektor. Vektorová databáza nájde najpodobnejšie vektory, teda úryvky textu, ktoré sú významovo najbližšie k otázke. Typicky sa vráti tri až desať najrelevantnejších úryvkov.
Krok 3: Generovanie odpovede
LLM dostane inštrukciu: tu je otázka používateľa, tu sú relevantné úryvky z našich dokumentov, odpovedz podľa nich a ak informácia v úryvkoch nie je, povedz to. Model potom vygeneruje odpoveď.
Celý proces trvá zvyčajne jednu až tri sekundy. Pre používateľa to vyzerá jednoducho: AI pozná detaily jeho firmy.
4. RAG vs. fine-tuning: kedy použiť čo
Druhá metóda, ako dostať firemné znalosti do AI, je fine-tuning, teda dotrénovanie modelu na vašich dátach. Ľudia si tieto pojmy často mýlia. Rozdiely sú zásadné:
V 90 % B2B prípadov chcete RAG. Fine-tuning má zmysel vtedy, keď potrebujete veľmi špecifický štýl, jazyk alebo formát výstupu, ktorý sa nedá spoľahlivo dosiahnuť promptom. Často sa kombinujú: fine-tuning pre štýl, RAG pre fakty.
Zamestnanec sa spýta: „aký máme proces schvaľovania investícií nad 500 000 Kč?“ AI prehľadá interné smernice, nájde relevantný odsek a odpovie aj s odkazom na dokument. Človek nemusí pol hodiny prehľadávať SharePoint.
Chcete AI riešenie na mieru?
Pomáhame firmám automatizovať procesy pomocou AI. Napíšte nám a zistite, ako môžeme pomôcť práve vám.
Odpoveď do 24 hodín
Nezáväzná konzultácia
Riešenia na mieru vašej firme
Zákaznícka podpora
Zákazník napíše, že mu nefunguje konkrétna funkcia. AI prehľadá manuály, FAQ, históriu ticketov aj predchádzajúce konverzácie tohto zákazníka a odpovie podľa konkrétneho postupu.
Právny asistent
Právnik hľadá, ako firma riešila podobný prípad minulý rok. AI prehľadá históriu zmlúv, e-maily a právnu dokumentáciu a vráti relevantné precedensy. Ručné hľadanie by trvalo hodiny. Podobne funguje právny bot.
HR onboarding
Nový zamestnanec sa pýta na benefity, dovolenku alebo parkovanie. AI odpovie zo smerníc. HR agent tak šetrí personalistom desiatky hodín mesačne na opakovaných otázkach.
AML compliance
Compliance officer sa pýta, ako firma riešila podobný rizikový profil klienta naposledy. AI prehľadá históriu AML rozhodnutí a odporučí ďalší postup. To je doménový scenár pre riešenie ako AML agent.
6. Čo robí RAG kvalitným
RAG nie je zázračná pilulka. Zle postavený RAG môže halucinovať takmer rovnako ako LLM bez RAG. Rozhoduje päť vecí:
1. Kvalita dokumentov
Ak máte desať rokov staré, duplicitné a neaktualizované dokumenty, RAG bude vracať chaos. Čistenie dát tvorí často 30 až 40 % úspechu projektu.
2. Stratégia delenia textu
Dokumenty treba rozdeliť tak, aby sa nestratil kontext. Zmluva rozdelená uprostred vety spôsobí, že dôležitá informácia bude chýbať. Dobrý chunking rešpektuje kapitoly, paragrafy, tabuľky a významové bloky.
3. Voľba embedding modelu
Pri slovenčine a češtine sú rozdiely medzi modelmi zásadné. Modely trénované prevažne na angličtine dosahujú v našich jazykoch slabšie výsledky. V praxi dávajú zmysel multilingválne modely typu OpenAI text-embedding-3-large alebo Cohere multilingual.
4. Reranking
Po prvom vyhľadaní sa výsledky znovu zoradia presnejším modelom. Je to drahšie, ale zvyšuje presnosť približne o 10 až 20 %. Pri kvalitných RAG systémoch je to štandard.
5. Meranie kvality
RAG treba merať. Koľko otázok malo dobrú odpoveď? Koľkokrát systém povedal „neviem“? Koľkokrát halucinoval? Bez metrík sa nedá spoľahlivo ladiť.
7. Pasce pri zavádzaní RAG
Natlačenie všetkých dokumentov naraz. Menej, ale relevantných dokumentov často znamená lepší výsledok.
Chýbajúca správa znalostnej bázy. Musí byť jasné, kto schvaľuje nové dokumenty a kto ich udržiava aktuálne.
Ignorovanie oprávnení. RAG musí rešpektovať prístupové práva. Finančný riaditeľ vidí iné dáta ako brigádnik.
Žiadna spätná väzba. Používateľ musí vedieť označiť zlú odpoveď, aby sa systém dal zlepšovať.
Lacný embedding model bez testovania. Slabé vyhľadávanie znamená slabé odpovede.
Mesačná prevádzka rastie s objemom otázok, pretože každá otázka znamená vyhľadávanie vo vektorovej databáze a jedno volanie LLM.
9. RAG je dnes štandard, nie novinka
V roku 2023 bol RAG nová technológia. V roku 2026 je to štandard, ktorý používa každý vážny B2B AI projekt. Ak vám dodávateľ ponúka AI agenta nad firemnými dátami bez RAG, kupujete si potenciálny zdroj zlých informácií. Pýtajte sa, akú technológiu používa, akú vektorovú databázu volí a ako meria kvalitu odpovedí.
Záver: RAG je most medzi všeobecnou AI a vašou firmou
RAG robí zo všeobecného LLM užitočný nástroj pre váš konkrétny biznis. Namiesto vymýšľania číta vaše dokumenty a odpovedá podľa nich. Je to základ väčšiny B2B AI nasadení v roku 2026. Ak uvažujete o vlastnom AI agentovi, RAG je pravdepodobne technológia, ktorú potrebujete.
V Apertii staviame RAG systémy pre české firmy od základov: od čistenia dát cez architektúru až po monitoring kvality. Ak chcete pochopiť, čo je AI agent a ako by mohol fungovať vo vašej firme, alebo potrebujete posúdiť existujúci RAG projekt, napíšte nám cez kontakt a dohodneme konzultáciu.
Ak riešite AI špecificky pre automotive, napríklad katalógy náhradných dielov, servisné príručky alebo garančné podmienky, pozrite si sesterský projekt AutoERP, ktorý RAG aplikuje na automotive doménu.
Často kladené otázky (FAQ)
Nahradí RAG fine-tuning?
Nie. Dopĺňajú sa. RAG rieši znalosť faktov, fine-tuning štýl a doménový jazyk. Vo väčšine B2B prípadov stačí samotný RAG. Fine-tuning pridávajte až vtedy, keď máte konkrétny dôvod.
Akú veľkú znalostnú bázu RAG zvládne?
Súčasné vektorové databázy zvládajú milióny dokumentov. Limit zvyčajne nie je technológia, ale kvalita dát. Odporúčame začať s 500 až 2 000 najdôležitejšími dokumentmi, vyladiť kvalitu a potom rozsah postupne rozširovať.
Kde dáta fyzicky ležia? Nie je to bezpečnostné riziko?
Závisí od architektúry. Vektorová databáza môže byť v EU cloude, v českom dátovom centre alebo on-premise. Volania LLM môžete smerovať cez Azure OpenAI v EU regióne alebo cez vlastný self-hosted model ako Llama či Mistral. Pri citlivých dátach odporúčame on-premise alebo private cloud.