Statistical Methods for Extracting Collocations from a Text Corpus

Štatistické metódy extrakcie kolokácií na príklade anglického korpusu Web 2020 (enTenTen20), pričom sa uvažuje o troch typoch asociačných mier: t-skóre, MI-skóre a Log Dice, určujúce silu asociácie medzi kolokáciami na základe frekvencií ich vlastného a spoločného výskytu v korpuse. Význam technológ...

Full description

Saved in:
Bibliographic Details
Main Author: Matytsina, Marina Stanislavovna
Other Authors: Grigorjanová, Tatjana, 1960-
Format: Book Chapter
Language:English
Subjects:
Tags: Add Tag
No Tags, Be the first to tag this record!