(лингвостатистика) — 1) в широком смысле: область применения статистических методов в языкознании (см. Количественные методы в языкознании); 2) в узком смысле: изучение некоторых математических проблем, связанных с лингвистическим материалом, главным образом с типами статистических распределений языковых единиц в тексте. Наиболее распространён метод анализа, основанный на так называемом законе Ципфа, сводящемся к уравнению вида: F × i = const, где F — частота слова в частотном словаре, а i — ранг этого слова, т. е. номер в списке слов, упорядоченном по уменьшающейся частоте. С поправочными коэффициентами Б. Мандельброта закон подтверждается на многих и разнообразных текстах. Таким образом, закон Ципфа выступает как модель описания распределения слов по частоте, однако вводимые на каждый случай поправочные коэффициенты в значительной мере лишают его предсказательной силы. Существуют и другие подобные модели (работы Г. Хердана, Дж. Б. Кэрролла). Проблема связи частоты слова и его ранга смыкается с проблемой оценки лексического богатства текста или совокупности текстов. Обычно Л. с. рассматривается как лингвистическая дисциплина, однако, будучи связанной с языкознанием по материалу, она ещё не наполнилась собственно лингвистическим содержанием. В частности, лингвистическая интерпретация закона Ципфа остаётся предметом дискуссий.
А. Я. Шайкевич.