Как составляются словари (неужели их авторы, например, Ожегов, просто сидели и вспоминали все слова на каждую букву)?

14753
2
0
25 июля
13:01
июль
2015

Первые словари возникали как комментарии к древним текстам, которые становились непонятными новым поколениям и требовали разъяснения. Таким был и древнейший известный человечеству китайский словарь, авторство которого иногда приписывают Конфуцию. В этом словаре объяснялись значения около 4000 слов — немного, но у таких словарей и нет задачи описать все слова, существующие в языке.

Есть три основных способа составлять словари: интроспекция, работа с источниками и опросы носителей. Интроспекция — это буквально «взгляд внутрь»: автор словаря описывает значения слов родного языка. Если ограничиваться этим методом, словарь может не отражать объективную картину, потому что язык каждого из нас в некоторой степени индивидуален. Поэтому абсолютное большинство авторов словарей опираются на предшествующий опыт. Например, С.И. Ожегов в 1930-е годы был одним из ведущих авторов знаменитого словаря под редакцией Д.Н. Ушакова. Опросы носителей особенно важны там, где еще не развита письменная традиция. Составлением таких словарей для редких языков занимаются полевые лингвисты, регулярно отправляющиеся в экспедиции.

В последнее время мировая лексикография сделала важный шаг вперед: появились электронные корпуса текстов огромного объема (скажем, в Британском национальном корпусе словосочетание «the question» встречается 7000 раз, а в Национальном корпусе русского языка слово «вопрос» встречается 160 тысяч раз). В корпус такого объема с большой вероятностью попадают почти все слова данного языка, даже самые редкие. Это позволяет авторам словарей не пропустить никаких новых слов: ведь упорядочить даже самый огромный корпус текстов по алфавиту или по частоте употребления слов — теперь минутное дело. Наконец, есть и новые компьютерно-лингвистические технологии, позволяющие оперативно отслеживать появление новых слов, например, в Твиттере.

56
2
июль
2015

Одним из наиболее масштабных проектов по созданию словарей была работа над Оксфордским (толковым) словарём английского языка - OED. Проект отличился привлечением к работе сообщества энтузиастов (то, что теперь называется crowdsourcing). Наиболее известным аналогом такой совместной работы в наше время является Википедия. Работа над словарём началась в 1857 году, но первые выпуски начали только издаваться только в 1884-м в виде отдельных статей и книжек по алфавиту. В 1928-м году статьи дошли до буквы Z, и словарь был впервые издан в полной и компактнтой 10-томной форме. OED продолжал уточняться и дополняться и после этого, отражая развитие языка. Второе издание вышло в 1989 году. Текст словаря (первого издания) был впервые оцифрован в конце 1980-х.

Crowdsourcing: В 1870-х рабочая группа под руководством Фернивалла наняла около 800 добровольцев для чтения классической литературы и выписывания слов с толкованиями на карточки. Специалисты филологи затем сортировали и обрабатывали эти описания для печатного текста. Всего группа произвела около двух тонн карточек, многие из которых дублировали друг друга либо не годились для словаря, поскольку были составлены не вполне квалифицированными помощниками. Позднее Джеймс Маррэй, который стал руководителем после Фернивалла и затем главным редактором первого издания, распространил через газеты призыв к читателям в Британии и Америке присылать в редакцию свои толкования обычных и редких слов. Эта идея была успешной: группа получала до 1000 карточек в день и к 1880 году собрала около 2,5 миллионов карточек, которые внесли значительный вклад в содержание словаря.

25
0
Если вы знаете ответ на этот вопрос и можете аргументированно его обосновать, не стесняйтесь высказаться
Ответить самому
Выбрать эксперта