Anpassa en rät linje till värdena
Vad är regressionskoefficient
I detta avsnitt går vi igenom räta linjens ekvation och hur kan anvöndas för att beskriva samband mellan två punkter. Samt hur vi kan bestämma en rät linjes ekvaktion när vi känner till två punkter längs linjen eller när vi känner till k-värdet och en punk för en räta linjen. Därför måste du vara försiktig med att se till att ett orsakssamband hittades när du faktiskt kunde hitta en korrelation mellan de studerade variablerna.
Om vi har ett spridningsschema kan vi manuellt rita en sådan ungefärlig linje och sedan räkna ut värdet på K-linjen och värdet på m, precis som vi gjorde tidigare, baserat på kända punkter. Därför är en vertikal linje inte en funktion och kan inte beskrivas där med ekvationen för en rak linje. Vi kan dock inte bara dra slutsatsen att det var hög ålder som orsakade sjukdomen, eftersom det kan finnas andra faktorer som spelar in, såsom levnadsvanor, förekomsten av andra sjukdomar, dieter i början av livet etc.
Men det finns en. Vilket spelar, som sagt, oavsett hur lutningen på linjen är densamma för alla punkter på linjen. Definitionen av en funktion är att endast en uppgift är associerad för varje överträdelse. Detta kan definieras både grafiskt och algebraiskt. Som vi kan se verkar det finnas en positiv linjär korrelation mellan ålder och medellängd.
När du har hittat ekvationen och använder regressionsanalys, liksom den statistiska grunden som du har, kan du använda den här linjära modellen för att förutsäga vad du får för värden vid andra mätpunkter. Genom att läsa förändringen i diagrammet kan vi få värden som gör att vi kan beräkna linjens lutning. Så vi letar efter en linje som våra markerade punkter skiljer sig så lite som möjligt.
Med hjälp av två punkter på linjen kan vi algebraiskt beräkna linjens lutning.
Beräkna korrelationskoefficienten
Om vi till exempel genomför en studie där vi jämför ålder med närvaron av en specifik sjukdom, kan det hända att det finns en stark positiv korrelation mellan hur gammal och hur vanlig sjukdomen är. Om observationsvärdena som du har noterat å andra sidan är grupperade runt en antagen linje med en negativ lutning, kallas detta en negativ korrelation mellan den förklarande variabeln och svarvariabeln, som vi ser ett exempel i diagrammet nedan.
Vi vill äntligen kontrollera att det verkligen inte spelar någon roll vilken av punkterna vi indexerar som en och två för att få samma värde på riktningskoefficienten. Green Line-lösningen har en positiv bias.
Vi börjar med att överväga en grafisk lösning. Kontrollen utförs genom att beräkna exemplet ovan med den ändrade platsen i punkterna. Den röda linjen har en negativ lutning. Om observationsvärdena som markerades i utbredningsdiagrammet samlas runt den antagna linjen med en positiv lutning, sägs det att det finns en positiv korrelation mellan den förklarande variabeln och svarsvariabeln.
Till exempel, för att få den mest exakta anpassningen, använder du sådana inbyggda funktioner för att göra den linjära regressionen som finns i många grafräknare. Detta gäller för de serier som är markerade i diagrammet nedan. Därför kan vi försöka hitta en linjär modell för anslutningen med linjär regressionsanalys.
Korrelationskoefficient formel
Något som är viktigt att komma ihåg när vi gör korrelationsundersökningar är att bara för att det finns en korrelation mellan de variabler vi tittar på, finns det inget behov av att vara ett orsakssamband. Du kan definiera linjelinjen grafiskt och algebraiskt. Det sägs att det inte finns någon lutning i den vertikala linjen, vilket innebär att det är omöjligt att beskriva det med ekvationen för en rak linje.
I det här fallet, som vårt exempel i början av avsnittet, där det inte verkar finnas någon positiv eller negativ korrelation mellan variablerna, står det att det inte finns någon korrelation, och då kan vi dra slutsatsen att det inte finns någon koppling mellan vilken månad det är och och och hur många människor är på plattformen. Namnlösa: om du har en vertikal linje.
Med detta menar vi att även om det finns en korrelation mellan variablerna kan det finnas någon annan variabel som inte ingår i vår analys som förklarar varför våra variabler matchar. Den genomsnittliga längden på svenska barn i scatterdiagrammet nedan har vi markerat den genomsnittliga längden på svarsvariabeln; längs Y-axeln för svenska barn i åldern år av den förklarande variabeln; längs X-axeln.
Undantaget bland raka linjer är i princip att alla raka linjer kan beskrivas med hjälp av raklinjens ekvation.