Григорий Волчков
апрель 2016.
3788

Какова средняя длина слова в русском языке?

Русский языкЯзыкСловаЗачем я это узнал?Наука
Ответить
Ответить
Комментировать
0
Подписаться
0
2 ответа
Поделиться

Средняя длина слова составляет около 6 букв, но зависит от корпуса (набора) текстов. Для корпуса русской разговорной речи средняя длина слова обычно составит от 3.9 до 4.9 букв. Для корпуса русской художественной литературы - от 4.9 до 5.9. Для газетно-новостного-корпуса - от 5.9 до 6.9. И наконец, для корпуса научной и деловой литературы - от 6.9 до 7.9 букв. Если вы составите корпус так, чтобы каждый из четырёх указанных видов (функциональных стилей) входил поровну (например, по миллиону слов), то получите, что в среднем слове 6 букв (точнее, 5,9). Но можно возразить, скажем, что научная и деловая речь встречается реже, и уменьшить её долю. Например, если заявить, что такой речи у нас больше нет, и  уменьшить её долю до нуля, то средняя длина слова тоже  уменьшится до 5.5 букв.   How many language do you speak? Получить совет по изучению иностранного языкаКак выучить английский, если есть всего 10 минут в день?Про самый легкий для изучения язык в мире Про мотивацию для изучения, когда её нет

Можно воспользоваться скриптом "худломер", который я написал в конце 90-х, и вычислить среднюю длину слова в интересующем вас тексте, кроме того, худломер определит функциональный стиль текста (используя те цифры, что я привёл выше). См. тут:  http://anti.teneta.ru/hudlomer/

Если взять корпус слов русского языка из почти 100 тысяч слов (взято отсюда http://www.dictionnaire.narod.ru/reverse.htm), то средняя длина слова получается около 9,69 буквы. Если убрать слова с дефисами (типа "иван-да-марья"), то получим немного меньшую длину - около 9,66 буквы. Хотя, конечно, вряд ли такое знание вообще имеет смысл, так как количество слов и их длина в разных языках существенно варьируется (скажем, словарь технических терминов содержит гораздо более длинные слова, нежели орфографический словарь для школьников).

Ответить