С чего социологу начать самообразование в Data Science и прикладном программировании?

Ответить
Ответить
Комментировать
0
Подписаться
4
2 ответа
Поделиться
АВТОР ВОПРОСА ОДОБРИЛ ЭТОТ ОТВЕТ

Тут много зависит от точки, в которой социолог находится сейчас. Что это за социолог, каким опытом анализа данных он обладает. Если это социолог из исследовательской компании или маркетингового агентства, и у него установлен SPSS, то, в общем, задача несложная. Все популярные алгоритмы там есть,  есть несколько учебников на русском языке (учебники Наследова, Бююля, для социологов - Крыштановского), и есть много примеров использования. Проблема только в дороговизне SPSS.

Альтернативой является свободно распространяемый язык R. Он хорош тем, что в нём много готовых наборов данных, и очень много рецептов. На английском языке издано более 400 книжек, посвящённых его применениям, и многие можно найти онлайн. На русском языке книжки тоже появились, но не знаю, насколько они хороши. Начать можно с обучающего пакета swirl (http://swirlstats.com/ ) и чтения сообщений на R-bloggers.com Я пробовал проходить курс университета Джона Хопкинса на Курсере, хотя не окончил. Там тоже всё начинается со swirl.

Наконец, надо иметь в виду, что Data Science - это просто красивая обёртка для скучной дисциплины, известной как статистика. Учебники по статистике, как правило, чрезвычайно скучны, но опять-таки в сети можно найти учебник,которыйнаписал Dalgaard (на английском, 2008 год, Springer), тоже скучный, где всё иллюстрируется при помощи R. Название - Introductory statistics with R. Дальгаард входит в группу разработчиков языка R, так что в его знаниях этого языка можно не сомневаться.

Существует множество способов развития, а также множество хороших онлайн курсов.

Могу порекомендовать следующие курсы

1) Analytic Edge MIT платформа EDX, бесплатный онлайн курс для начинающих на R, множество интересных примеров мало теории много практики, студенты курса участвуют в конкурсе на Kaggle

2) Statistical Learning, Stanford неплохой курс, где практика балансирует с теорией. Примеры кода на R. Также у авторов курса есть очень хороший бесплатный учебник на английском

3) Learning from Data Caltech это замечательный но тяжелый курс, знакомит с теоретическими основами машинного обучения

4) Machine Learning Coursera professor Ng, неплохой курс для начинающих программирование на МАТЛАБ

5) Курс теории вероятностей MIT EDX тоже очень основательный и сложный, много полезной информации

6) Probabilistic Models Coursera тоже неплохой курс

Курсы яндекса от ШАД я не рекомендую

Ответить