„Анализ на данни с помощта на IBM SPSS Statistics“ - курс 42 000 RUB. от МГУ, обучение (2 месеца), дата 03.12.2023г.
разни / / December 06, 2023
В много съкратена форма този курс е част от популярния курс за дистанционно обучение „Как да правим научни изследвания: методология, инструменти, методи“ на Open University на E. Foundation. Гайдар (около 2 хил. слушатели на година). Икономическият факултет на Московския държавен университет предоставя на студентите възможност да използват оборудван компютърен клас с инсталиран SPSS изучавайте подробно методите за работа с данни лице в лице с учител, работете с програмата със собствените си „ръце“ SPSS. Възможно е да се работи не само с бази данни, предложени от учителя, но и с данни на ученици; учителят ще ви посъветва какви методи и как да използвате, за да анализирате вашите данни.
Този курс е тестван в Open University of the E. Foundation. Гайдар.
Доктор по икономика, професор в Стопанския факултет на Московския държавен университет, специалист по количествени изследвания в социална сфера, ръководител на повече от 30 научни проекта, има опит в преподаването на аналитични курсове в Националния изследователски университет HSE, REU im. В. Г. Плеханов.
Електронна поща: [имейл защитен]
1 Същността и основните направления на извадковите изследвания на населението. Възможности за използване на специални ПЧП за обработка на данни от извадково изследване
Методи за събиране на количествена информация. Примерни изследвания. Примерни социално-демографски проучвания в Русия. Основни статистически софтуерни пакети за социални изследвания. Функции на специален софтуер (Statistica, SPSS) при обработка на данни от извадкови изследвания. Структура, SPSS модули. Области на обработка на данни. Подготовка на данни. Въвеждане и запазване на данни. Скали за измерване (количествени, ординални, номинални). Свойства на скалите и техните допустими трансформации. Видове категоризация на данни.
2 Подготовка на данните. Избор и модификация на данни
Избор на наблюдения. Сортиране на наблюдения. Разделяне на наблюденията на групи. Модификация на данни. Изчисляване на нови променливи. Изчисляване на нови променливи според определени условия. Формулиране на условия. Агрегиране на данни. Ранг трансформации. Тегла на касата. Причини и механизми за генериране на пропуски в данните. Възможност за игнориране на пропуски. Методи за попълване на липсващи стойности. Методи за идентифициране на аномални стойности. Прилагане на стабилни процедури за оценка. Анализ на множество отговори
3 Описателна статистика. Таблици за непредвидени обстоятелства
Ролята на статистиката при обработката на резултатите от извадковите изследвания. Микро и метаданни. Области на приложение и граници на приложимост на математически и статистически методи. Обобщение на наблюденията. Описателна статистика. Едномерни разпределения. Вариационни индикатори. Дисперсия, диапазон на вариация, средно абсолютно отклонение, квантилен диапазон. Изграждане на контингентни таблици. Графично представяне на таблици за непредвидени обстоятелства.
4 Параметрични и непараметрични тестове
Анализ на връзката между характеристиките. Независимост на променливите. Основни характеристики на комуникацията. Непараметрични и параметрични тестове. Тест за независимост (тест за съответствие χ2). Сравнение на две и няколко проби (зависими и независими). t-тест. Статистически тестове за таблици за непредвидени обстоятелства. Коефициенти на корелация (за номинална и рангова скали). Мерки за близостта на връзката между променливите. Най-простите мерки за близост на връзката (за дихотомични променливи). Мерки за връзка за таблици с редни данни. t-мерки Kendal и техните свойства. D-мерки на Somers. Мярката на Гудман-Крускал и нейните свойства. Дисперсионен анализ
5 Корелационен и регресионен анализ
Същност и цели на корелационния анализ. Точкови диаграми. Сдвоени коефициенти на корелация. Измерване на степента на близост на статистическа връзка, „изчистена“ от влиянието на външни характеристики с помощта на частични корелационни коефициенти. Проверка на значимостта на връзката между знаците. Доверителни интервали за коефициентите на корелация. Множествен коефициент на корелация. Коефициент на определяне. Модел на двумерен регресионен анализ: линейни и нелинейни регресионни модели. Криви на растеж в проблемите на прогнозирането, „думи” променливи и техните приложения. Множествен линеен регресионен модел. Нелинейна регресия (двоична логистична регресия, многочленна логистична регресия, ординална регресия, пробит анализ, напасване на кривата).
6 Методи за намаляване на размерността
Статистически подход в метода на главния компонент. Изчисляване на главни компоненти и тяхната графична интерпретация. Информационно съдържание на намаленото пространство за характеристики. Регресия на главните компоненти. Ролята и мястото на непараметричните методи в структурното моделиране. Йерархичен клъстерен анализ. Метрика на пространството на характеристиките. Принципи на измерване на разстояние между групи от обекти. Алгоритми за бърз клъстерен анализ, метод на k-средните. Двуетапен клъстерен анализ. Изграждане на дърво на целите