Ответить
Ответить
Комментировать
0
Подписаться
11
2 ответа
Поделиться

Компьютерные лингвисты занимаются разработкой алгоритмов распознавания текста и звучащей речи, синтезом искусственной речи, созданием систем семантического перевода и самим развитием искусственного интеллекта (в классическом смысле слова — как замена человеческому — он вряд ли когда-нибудь появится, но зато возникнут различные экспертные системы, основанные на анализе данных).

Алгоритмы распознавания речи будут все больше использоваться в быту — у «умных домов» и электронных приборов не будет пультов и кнопок, а вместо них будет использоваться голосовой интерфейс. Эта технология оттачивается, но вызовов еще много: компьютеру сложно распознать человеческую речь, потому что разные люди говорят очень по-разному. Поэтому, как правило, системы распознавания работают хорошо либо когда они натренированы на одного диктора и уже подстроены под его особенности произношения, либо когда количество фраз, которые может распознать система, ограничено (как, к примеру, в голосовых командах для телевизора).

У специалистов по созданию программ семантического перевода впереди еще много работы: на данный момент неплохие алгоритмы разработаны только для перевода на английский и с английского. Тут много проблем — разные языки по-разному устроены в семантическом плане, это различается даже на уровне построения фраз, и не все смыслы одного языка можно передать с помощью семантического аппарата другого. Кроме того, программа должна различать омонимы, правильно распознавать части речи, выбрать правильное значение многозначного слова, подходящее к контексту.

Синтез искусственной речи (например, для домашних роботов) — тоже кропотливая работа. Сложно сделать так, чтобы искусственно созданная речь звучала естественно для человеческого уха, ведь есть миллионы нюансов, на которые мы не обращаем внимания, но без которых все уже не «то» — фальстарты, паузы, заминки и т.д. Речевой поток непрерывен и одновременно дискретен: мы говорим, не делая паузы между словами, но нам нетрудно понять, где заканчивается одно слово и начинается другое, а для машины это будет большая проблема. ЕГЭ ближе, чем кажется... Что мне с сегодняшнего дня делать, чтобы через 9 месяцев я успешно сдал ЕГЭ?Возможно ли сдать ЕГЭ на 100 баллов, готовясь самостоятельно (без репетиторов)? Почему экзамены ОГЭ/ЕГЭ длятся 3 часа 55 минут, а не просто 4 часа?Правда ли, что варианты на экзаменах (ЕГЭ/ОГЭ) легче тех, что дают при написании пробников?Какие самые простые и сложные ЕГЭ сейчас существуют?

Самое большое направление в компьютерной лингвистике связано с Big Data. Ведь существуют огромные корпуса текстов типа новостных лент, из которых нужно вычленять определенную информацию — например, выделять инфоповоды или затачивать RSS под вкусы определенного пользователя. Такие технологии есть уже cейчас и будет развиваться дальше, потому что вычислительные мощности стремительно растут. Лингвистический анализ текстов используется и при обеспечении безопасности в интернете, поиске необходимой информации для спецслужб.

Где учиться на компьютерного лингвиста? У нас, к сожалению, довольно сильно разделены специальности, связанные с классической лингвистикой, и программирование, статистика, анализ данных. А для того, чтобы стать цифровым лингвистом, нужно разбираться и в том, и в другом. В зарубежных вузах есть программы высшего образования по компьютерной лингвистике, а у нас пока оптимальный вариант — получить базовое лингвистическое образование, а потом освоить основы IT. Хорошо, что сейчас есть много разных онлайн-курсов, к сожалению, в мои студенческие годы такого не было. Я училась на факультете прикладной лингвистике в МГЛУ, где у нас были курсы по искусственному интеллекту и распознаванию устной речи — но все-таки в недостаточном объеме. Сейчас IT-компании активно пытаются взаимодействовать с институтами. Мы с коллегами из «Лаборатории Касперского» тоже стараемся участвовать в образовательном процессе: читаем лекции, проводим студенческие конференции, даем гранты аспирантам. Но пока инициатива больше исходит от работодателей, чем от университетов.

25

В ВШЭ есть факультет "Фундаментальная и компьютерная лингвистика", в МГУ просто ОТиПЛ, и там и там изучают и математику, и статистику, и проганье, и лингвистику естественно

+2
Ответить

А применяется ли теория формальных языков в компьютерной лингвистике?

0
Ответить

> он [искусственный интеллект] вряд ли когда-нибудь появится, но

> зато возникнут различные экспертные системы, основанные на

> анализе данных

Очень интересное мнение. Даже слишком интересное от человека вашей профессии.

0
Ответить
Ещё 1 комментарий

Дарья, здравствуйте и спасибо вам за ответ!

А вы не расскажете, где можно узнать о проводимых ЛК лекциях и конференциях?

0
Ответить
Прокомментировать

Чтобы узнать ответ на этот вопрос, хорошо бы прочитать роман А. Солженицына "В круге первом". Там подробно описана эта наука, правда, в тот период, когда компьютеров ещё не было, вместо них было огромное количество расчетов. Науку двигали филологи и математики. Одна из задач - формализация речи, в частности, определить по записи телефонного разговора, кто говорил.

0
Прокомментировать
Ответить