Максим КРЫГИН, Владимир ШИРОКОВ, Киев, Украина
Украинский языково-информационный фонд НАН Украины
Аннотация. Статья посвящена применению корпусов текстов к прове- дению различных лингвистических экспертиз. Предложен подход к парамет- ризации текста для проведения лингвистических исследований. Рассмотрены примеры проведения лингвистических экспертиз.
Ключевые слова: корпус текстов, статистический портрет, цепь Маркова, вероятность перехода.
Abstract. The article deals with text corpus applications to the different linguistic examinations.
Approach of the text parametrization for linguistic re- search was proposed. Examples of linguistic examinations are given.
Keywords: text corpus, statistic portrait, Markov chain, transition probability.
Создатели лингвистических корпусов всегда ставят перед собой вопрос о тех фундаментальных и прикладных задачах, которые бу- дут решаться на создаваемых ими корпусах. Одной из таких задач является задача проведения лингвистических экспертиз, то есть определение тех или иных характеристик либо свойств текстов, которые следуют из целевых установок и задач экспертизы. При этом, разумеется, стандартный инструментарий корпуса (как пра- вило, это те или иные виды разметки составляющих его текстов) должен быть расширен введением некоторых отношений, структур и процедур, позволяющими осуществлять некие дополнительные операции над корпусными текстами.






