Григорий Волчков
апрель 2016.
4816

Какова средняя длина слова в русском языке?

Ответить
Ответить
Комментировать
0
Подписаться
0
2 ответа
Поделиться

Средняя длина слова составляет около 6 букв, но зависит от корпуса (набора) текстов. Для корпуса русской разговорной речи средняя длина слова обычно составит от 3.9 до 4.9 букв. Для корпуса русской художественной литературы - от 4.9 до 5.9. Для газетно-новостного-корпуса - от 5.9 до 6.9. И наконец, для корпуса научной и деловой литературы - от 6.9 до 7.9 букв. Если вы составите корпус так, чтобы каждый из четырёх указанных видов (функциональных стилей) входил поровну (например, по миллиону слов), то получите, что в среднем слове 6 букв (точнее, 5,9). Но можно возразить, скажем, что научная и деловая речь встречается реже, и уменьшить её долю. Например, если заявить, что такой речи у нас больше нет, и  уменьшить её долю до нуля, то средняя длина слова тоже  уменьшится до 5.5 букв.   Важное о скидочных картах Как воспользоваться скидочной картой в любом магазине, если забыл ее дома или потерял?Как предпринимателю сделать так, чтобы покупатели пользовались его картами?Дают ли скидочные карты какую-то выгоду? Или это просто видимость скидок?Задавайте вопросы экспертам

Можно воспользоваться скриптом "худломер", который я написал в конце 90-х, и вычислить среднюю длину слова в интересующем вас тексте, кроме того, худломер определит функциональный стиль текста (используя те цифры, что я привёл выше). См. тут:  http://anti.teneta.ru/hudlomer/

3

Спасибо большое! Писал курсовую, стал выбирать в ней случайные "тысячи" слов, и всякий раз число символов без пробелов было около 5,6 на слово. По всей видимости, до научного текста ещё далеко))

+1
Ответить

Если эта курсовая по одной из обществоведческих дисциплин, то в них длины слов, как правило, немного короче и ближе к публицистике. Научный и деловой стиль изобилуют специальными терминами, которые, как правило - весьма длинные, поэтому и средняя длина слова - увеличивается.

0
Ответить
Прокомментировать

Если взять корпус слов русского языка из почти 100 тысяч слов (взято отсюда http://www.dictionnaire.narod.ru/reverse.htm), то средняя длина слова получается около 9,69 буквы. Если убрать слова с дефисами (типа "иван-да-марья"), то получим немного меньшую длину - около 9,66 буквы. Хотя, конечно, вряд ли такое знание вообще имеет смысл, так как количество слов и их длина в разных языках существенно варьируется (скажем, словарь технических терминов содержит гораздо более длинные слова, нежели орфографический словарь для школьников).

0
Прокомментировать
Ответить