Analysis of Semantic Relationships in Ukrainian Text Content Based on Word2Vec and Machine Learning

Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕ...

Descrizione completa

Salvato in:
Dettagli Bibliografici
Autore principale: Kryndach, Pavlo
Altri autori: Vysotska, Victoria, Chyrun, Sofia, Chyrun, Lyubomyr, Goloshchuk, Svitlana, 1976-, Holoshchuk, Roman
Natura: Capitolo di libro
Lingua:inglese
Soggetti:
Tags: Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
Descrizione
Riassunto:Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕňajú prípravu dát, trénovanie modelu, analýzu získaných vektorov a porovnanie výsledkov s existujúcimi metódami. Hlavnými výzvami projektu sú veľké množstvá vysokokvalitných súborov údajov v ukrajinskom jazyku na trénovanie modelu, vytvorenie efektívneho algoritmu učenia Word2vec a vývoj používateľského rozhrania. Pomocou Pythonu a TensorFlow sa dosiahne efektívna aplikácia metódy Word2vec, ktorá vykazuje vysoký výkon. Beží približne 2,8 sekundy a využíva obmedzené množstvo pamäte v rozsahu od 140 do 200 megabajtov.