Analysis of Semantic Relationships in Ukrainian Text Content Based on Word2Vec and Machine Learning
Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕ...
Salvato in:
| Autore principale: | |
|---|---|
| Altri autori: | , , , , |
| Natura: | Capitolo di libro |
| Lingua: | inglese |
| Soggetti: | |
| Tags: |
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
| Riassunto: | Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕňajú prípravu dát, trénovanie modelu, analýzu získaných vektorov a porovnanie výsledkov s existujúcimi metódami. Hlavnými výzvami projektu sú veľké množstvá vysokokvalitných súborov údajov v ukrajinskom jazyku na trénovanie modelu, vytvorenie efektívneho algoritmu učenia Word2vec a vývoj používateľského rozhrania. Pomocou Pythonu a TensorFlow sa dosiahne efektívna aplikácia metódy Word2vec, ktorá vykazuje vysoký výkon. Beží približne 2,8 sekundy a využíva obmedzené množstvo pamäte v rozsahu od 140 do 200 megabajtov. |
|---|