Când folosim linia de regresie pentru a prezice un punct a cărui valoare x este în afara intervalului valorilor x ale datelor de antrenament, se numește extrapolare.
Pentru a extrapola (în mod deliberat) folosim linia de regresie pentru a prezice valori care sunt departe de datele de antrenament.
Rețineți că extrapolarea nu oferă previziuni fiabile deoarece linia de regresie poate să nu fie valabilă în afara gamei de date de antrenament.
Folosind deprecierea liniară, cum stabiliți valoarea unei mașini după 5 ani dacă costă 62310 dolari atunci când este nouă și are o valoare de 32985 $ după 7 ani?
Valoarea mașinii după 5 ani este de 41364 dolari SUA Costul inițial al mașinii este y_1 = 62310.00 dolari, x_1 = 0 Valoarea deprimați a mașinii după x_2 = 7 ani este y_2 = 32985.00 dolari. Pantă de deprivare liniară pe an este m = (y_2-y_1 ) / (x_2-x_1) sau m = (32985.00-62310.00) / (7-0) m = (32985.00-62310.00) / 7. Valoarea depreciată a mașinii după x = 5 ani este y-y_1 = m (x-x_1) sau y-62310 = (32985.00-62310.00) / 7 * (5-0) sau y = 62310+ (32985.00-62310.00) / 7 * 5 sau y = 62310-20946.43 sau y ~~ $ 41363.57 ~~ $ 41364 Valoarea mașinii după 5 ani este de $ 41364
De ce este folosită metoda obișnuită cu cele mai mici pătrate într-o regresie liniară?
Dacă ipotezele Gauss-Markof dețin atunci OLS furnizează cea mai mică eroare standard a oricărui estimator liniar, deci cel mai bun estimator linear imparțial. Având în vedere aceste ipoteze Co-eficenții parametrilor sunt liniare, aceasta înseamnă doar că beta_0 și beta_1 sunt liniare, dar variabila x nu are pentru a fi liniar poate fi x ^ 2 Datele au fost luate dintr-un eșantion aleatoriu Nu există o multi-colinearitate perfectă astfel încât două variabile nu sunt perfect corelate. E (u / x_j) = 0 presupune ipoteza condiționată este zero, ceea ce înseamnă că variabilele x_j nu oferă nicio info
Care este linia de regresie liniară? + Exemplu
Este linia care oferă cea mai apropiată potrivire între variabile dacă se presupune că există o corelație liniară. Exemplu: În profesia mea de profesor am avut sentimentul că studenții care au obținut un punctaj bun în matematică au obținut rezultate bune și în fizică și invers. Așa că am făcut un scatterplot pe o diagramă în Excel, unde x = Matematică și y = Fizică, unde fiecare student a fost reprezentat de un punct. Am observat că colecția de puncte arăta ca o formă sigara în loc să fie peste tot (acesta din urmă ar însemna nici o corelație deloc). Și apoi am făcut două lucruri: (1) Am