Bridging The Language Gap: Evaluating And Enhancing Slovak Language Support in Large Language Models

Táto štúdia skúma súčasnú úroveň podpory slovenčiny vo veľkých jazykových modeloch (LLM) a navrhuje praktické cesty k vysokokvalitnému a zdrojovo efektívnemu nasadeniu. Porovnal som niekoľko najmodernejších open-source a komerčných LLM na novovytvorenej sade 100 slovenských otázok pokrývajúcich gram...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Skovajsa, Patrik
Format: Buchkapitel
Sprache:Englisch
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie das erste Tag hinzu!

MARC

LEADER 00000naa a2200000 4500
001 0315570
005 20260325120619.5
041 0 |a eng 
044 |a SK 
245 1 0 |a Bridging The Language Gap: Evaluating And Enhancing Slovak Language Support in Large Language Models  |c Patrik Skovajsa 
520 |a Táto štúdia skúma súčasnú úroveň podpory slovenčiny vo veľkých jazykových modeloch (LLM) a navrhuje praktické cesty k vysokokvalitnému a zdrojovo efektívnemu nasadeniu. Porovnal som niekoľko najmodernejších open-source a komerčných LLM na novovytvorenej sade 100 slovenských otázok pokrývajúcich gramatiku, sémantiku, štýl, slang, preklad a zložité konštrukcie. Odpovede som automaticky vyhodnotil pomocou OpenAI GPT-4o-mini. Výsledky ukazujú, že Google Gemma 3 27 B dosahuje takmer paritu s GPT-4o pri spustení na jednom špičkovom GPU, pričom prekonáva LLaMA 3.1 70 B o 27 percentuálnych bodov v celkovej kvalite a štvornásobne znižuje latenciu. Moje zistenia zdôrazňujú Gemma 3 27 B ako najlepší súčasný kompromis pre slovenčinu a zároveň zdôrazňujú strategickú potrebu špecializovaného slovenského LLM postaveného na otvorených zdrojoch. 
610 2 0 |a jazyky cudzie 
610 2 0 |a slovenčina 
610 2 0 |a prekladateľstvo 
610 2 0 |a modely 
100 1 |a Skovajsa, Patrik