Bridging The Language Gap: Evaluating And Enhancing Slovak Language Support in Large Language Models
Táto štúdia skúma súčasnú úroveň podpory slovenčiny vo veľkých jazykových modeloch (LLM) a navrhuje praktické cesty k vysokokvalitnému a zdrojovo efektívnemu nasadeniu. Porovnal som niekoľko najmodernejších open-source a komerčných LLM na novovytvorenej sade 100 slovenských otázok pokrývajúcich gram...
Gespeichert in:
| 1. Verfasser: | |
|---|---|
| Format: | Buchkapitel |
| Sprache: | Englisch |
| Schlagworte: | |
| Tags: |
Keine Tags, Fügen Sie das erste Tag hinzu!
|
MARC
| LEADER | 00000naa a2200000 4500 | ||
|---|---|---|---|
| 001 | 0315570 | ||
| 005 | 20260325120619.5 | ||
| 041 | 0 | |a eng | |
| 044 | |a SK | ||
| 245 | 1 | 0 | |a Bridging The Language Gap: Evaluating And Enhancing Slovak Language Support in Large Language Models |c Patrik Skovajsa |
| 520 | |a Táto štúdia skúma súčasnú úroveň podpory slovenčiny vo veľkých jazykových modeloch (LLM) a navrhuje praktické cesty k vysokokvalitnému a zdrojovo efektívnemu nasadeniu. Porovnal som niekoľko najmodernejších open-source a komerčných LLM na novovytvorenej sade 100 slovenských otázok pokrývajúcich gramatiku, sémantiku, štýl, slang, preklad a zložité konštrukcie. Odpovede som automaticky vyhodnotil pomocou OpenAI GPT-4o-mini. Výsledky ukazujú, že Google Gemma 3 27 B dosahuje takmer paritu s GPT-4o pri spustení na jednom špičkovom GPU, pričom prekonáva LLaMA 3.1 70 B o 27 percentuálnych bodov v celkovej kvalite a štvornásobne znižuje latenciu. Moje zistenia zdôrazňujú Gemma 3 27 B ako najlepší súčasný kompromis pre slovenčinu a zároveň zdôrazňujú strategickú potrebu špecializovaného slovenského LLM postaveného na otvorených zdrojoch. | ||
| 610 | 2 | 0 | |a jazyky cudzie |
| 610 | 2 | 0 | |a slovenčina |
| 610 | 2 | 0 | |a prekladateľstvo |
| 610 | 2 | 0 | |a modely |
| 100 | 1 | |a Skovajsa, Patrik | |