Slovník
Fine-Tuning
Fine-tuning (doladění) je proces přizpůsobení předtrénovaného AI modelu pro konkrétní úkol nebo doménu pomocí trénování na specializované datové sadě. Místo tréninku modelu od nuly – což by vyžadovalo obrovské výpočetní prostředky a data – fine-tuning využívá znalosti, které model již získal, a dále je rozvíjí směrem k požadovanému chování.
Princip spočívá v tom, že předtrénovaný model (například GPT nebo BERT) byl naučen na miliardách tokenů obecného textu a pochopil strukturu jazyka, gramatiku i faktické znalosti. Fine-tuning pak tento základ dále doučí na tisících příkladů specifických pro danou oblast – třeba zákaznické dotazy a odpovědi konkrétní firmy, právní dokumenty nebo medicínské záznamy. Výsledkem je model, který zachovává obecné schopnosti, ale vyniká v cílové oblasti.
Existují různé techniky fine-tuningu. Full fine-tuning aktualizuje všechny parametry modelu, je nejefektivnější, ale výpočetně nejnáročnější. LoRA (Low-Rank Adaptation) a QLoRA jsou populární přístupy, které trénují jen malou sadu adaptérových vrstev, čímž dramaticky snižují nároky na hardware. Instruction fine-tuning učí model sledovat pokyny v přirozeném jazyce.
Pro firmy je fine-tuning zajímavý tehdy, když obecný model nedosahuje potřebné přesnosti v jejich specifickém kontextu, nebo kdy je žádoucí, aby model konzistentně dodržoval firemní terminologii a tón komunikace. Oproti prompt engineeringu nabízí trvalejší a konzistentnější výsledky, vyžaduje ale přípravu kvalitní trénovací sady.