Линейна регресия - курс 4900 rub. от отворено образование, обучение 5 седмици, около 2 часа седмично, дата 29 ноември 2023 г.
разни / / November 29, 2023
Ако корелационният анализ дава възможност да се определи количествено силата и посоката на връзката между две величини, тогава изграждането на регресионни модели предоставя по-големи възможности. Използвайки регресионен анализ, е възможно да се опише количествено поведението на изследваните величини в зависимост от предикторните променливи и да се получат прогнози за нови данни. Ще научите как да изграждате прости и множествени линейни модели с помощта на езика R. Всеки метод има своите ограничения, така че ние ще ви помогнем да разберете в какви ситуации линейната регресия може и не може да се използва и ние ще ви научим на избрани методи за диагностика модели. Специално място в курса е отделено на задълбочената анатомия на регресионния анализ: ще овладеете операции с матрици, които са в основата на линейната регресия, за да могат да се разберат по-сложните разновидности на линейната модели.
Ако сте изправени пред необходимостта да търсите и описвате връзките между определени явления, които могат да бъдат измерени количествено, тогава този курс е добра възможност да разберете как работи простата и множествената линейна регресия, да научите за възможностите и ограниченията на тези методи.
Курсът е предназначен за тези, които вече са запознати с основните техники за анализ на данни с помощта на езика R и със създаването на прости .html документи с помощта на rmarkdown и knitr.
Научни интереси: структура и динамика на морски бентосни съобщества, пространствени мащаби, сукцесия, междувидови и вътревидови биотични взаимодействия, растеж и размножаване на морски безгръбначни, демографска структура на популациите, микроеволюция, биостатистика.
Курсът се състои от 5 модула:
1. Корелационен анализ. Проста линейна регресия
Ще започнем нашия разговор за методите за числено описание на връзките между количествените величини с ковариационни и корелационни коефициенти, които ни позволяват да оценим силата и посоката на връзката. След това ще научите каква допълнителна информация за връзките може да се получи чрез конструиране на линеен модел на връзката между количествата. Ще се научите да интерпретирате коефициентите на регресия и ще научите кога и как линейните модели могат да се използват за правене на прогнози за нови данни. До края на този модул ще научите как да напаснете уравнение на линеен модел и да го начертаете с област на достоверност.
2. Тестване на значимостта и валидността на линейните модели
Изграждането на линеен модел и записването на неговото уравнение е само самото начало на анализа. В този модул ще научите как да описвате резултатите от регресионния анализ: как да тествате статистическата значимост на цялостния модел или неговите коефициенти и да оценявате качеството на съответствието. Линейните модели (или по-скоро статистическите тестове, които се използват за тях), като всеки метод, имат своите ограничения. Ще научите какви са тези ограничения и откъде идват. Графичните диагностични методи, които ще използваме, са универсални за различни линейни модели - повече практика ще ви помогне да вземате решения по-уверено. След като разберете всичко това, можете да напишете пълен скрипт на R, за да напаснете, диагностицирате и представите резултатите от проста линейна регресия.
3. Кратко въведение в света на линейната алгебра
В този модул ще се потопим в сърцето на линейните модели. За да направите това, ще трябва да научите или запомните основите на линейната алгебра. Ще обсъдим различните типове матрици, как да ги създадем в R и основните операции с тях. Всичко това ще ни трябва, за да разберем как работи линейната регресия отвътре. Ще научите какво е моделна матрица, ще научите как да напишете уравнение на линейна регресия под формата на матрици и да намерите неговите коефициенти. Ще видите със собствените си очи матрицата на шапката, която ви позволява да получите прогнозирани стойности и дори ще можете да я изчислите ръчно. И накрая, ще се научите да изчислявате остатъчната дисперсия, дисперсионно-ковариационната матрица и да използвате всичко това, за да изградите регресионна доверителна зона. След това тези знания ще ви помогнат да разберете структурата на по-сложни модели: с дискретни предиктори, с различни разпределения на остатъците, с различна структура на вариационната ковариационна матрица.
4. Множествена линейна регресия
Най-често връзките между количествата са по-сложни, отколкото могат да бъдат описани с помощта на проста линейна регресия. Множествената линейна регресия се използва, за да се опише как дадена променлива на отговор зависи от множество предиктори. С появата на множество предиктори в модела, линейната регресия има ново условие за приложимост - изискването за липса на мултиколинеарност. В този модул ще научите как да идентифицирате и избягвате мултиколинеарността. И накрая, често има повече променливи в множество модели, отколкото могат да бъдат изобразени на равнина, Ето защо ще ви научим на прости техники, които ще ви помогнат да създадете информативна графика дори и в това случай.
5. Сравнение на линейни модели
Множеството линейни модели са като строителен комплект: по-сложните модели могат да бъдат разглобени и опростени. Ще научите как сравненията на вложени модели с помощта на частичен F тест се използват за тестване на значимостта на отделни предиктори или групи от предиктори. По-сложните модели описват по-добре оригиналните данни, но прекомерното усложняване е опасно, т.к такива модели започват да правят лоши прогнози за нови данни. Използвайки частични F тестове, можете да опростите моделите чрез постепенно елиминиране на незначими предиктори. Опростените модели са по-лесни за използване за тълкуване и представяне на резултати. Всичко, което сте научили досега за линейната регресия, може да се приложи чрез завършване на проект за анализ на данни, където трябва да правилно изграждане на оптимален множествен линеен модел и представяне на неговите резултати в отчет, написан с помощта на rmarkdown и knitr.