L’anàlisi de regressió és un dels mètodes més exigits d’investigació estadística. Amb ell, podeu establir el grau d’influència de les variables independents sobre la variable dependent. Microsoft Excel té eines per dur a terme aquest tipus d'anàlisi. Vegem què són i com utilitzar-los.
Paquet d’anàlisi de connexions
Però, per tal d’utilitzar una funció que permeti l’anàlisi de la regressió, primer haureu d’activar el paquet d’anàlisi. Només llavors les eines necessàries per a aquest procediment apareixeran a la cinta Excel.
- Aneu a la pestanya "Fitxer".
- Aneu a la secció "Opcions".
- S'obrirà la finestra d’opcions d’Excel. Vés a la subsecció Complements.
- A la part inferior de la finestra que s'obre, reorganitzeu l'interruptor al bloc "Gestió" en posició Complements d'Excelsi es troba en una posició diferent. Premeu el botó "Vés".
- S'obrirà la finestra de complements d'Excel. Poseu una marca al costat de l’ítem "Paquet d’anàlisi". Feu clic al botó "D'acord".
Ara quan anem a la pestanya "Dades", en una cinta d’un bloc d’eines "Anàlisi" veurem un nou botó - "Anàlisi de dades".
Tipus d’anàlisi de regressió
Hi ha diversos tipus de regressions:
- parabòlica;
- poder;
- logarítmic;
- exponencial;
- indicatiu;
- hiperbòlic;
- regressió lineal.
Parlarem més de l’implementació de l’últim tipus d’anàlisi de regressió a Excel.
Regressió lineal a Excel
A continuació, com a exemple, es presenta una taula que mostra la temperatura mitjana de l’aire a l’exterior i el nombre de compradors de botigues per al dia de treball corresponent. Esbrineu amb l’ajuda d’anàlisi de regressió, com poden afectar exactament les condicions meteorològiques en forma de temperatura de l’aire a l’assistència d’un establiment comercial.
L’equació de regressió general d’un tipus lineal és la següent:Y = a0 + a1x1 + ... + akhk
. En aquesta fórmula Y significa una variable, la influència dels factors sobre els quals estem intentant estudiar. En el nostre cas, aquest és el nombre de compradors. Significat x - Aquests són diversos factors que afecten la variable. Paràmetres a són coeficients de regressió. És a dir, determinen la importància d’un factor determinat. Índex k denota el nombre total d'aquests factors.
- Feu clic al botó "Anàlisi de dades". Es col·loca a la pestanya. "Inici" al bloc d’eines "Anàlisi".
- S'obre una petita finestra. En ell, seleccioneu l’element "Regressió". Premeu el botó "D'acord".
- S'obrirà la finestra de configuració de regressió. En ell, els camps obligatoris són "Interval d’entrada Y" i "Interval d’entrada X". Es poden deixar tots els altres paràmetres per defecte.
Al camp "Interval d’entrada Y" especifiquem l'adreça del rang de cel·les on es troben les dades de la variable, la influència dels factors sobre els quals estem intentant establir. En el nostre cas, aquestes seran cel·les a la columna "Nombre de compradors". L’adreça es pot introduir manualment des del teclat, o simplement podeu seleccionar la columna desitjada. Aquesta última opció és molt més fàcil i convenient.
Al camp "Interval d’entrada X" introduïu l’adreça de l’interval de cel·les on es troben les dades del factor, la influència de la qual a la variable que volem establir. Com es va esmentar anteriorment, cal determinar l’efecte de la temperatura sobre el nombre de clients de la botiga i, per tant, introduir l’adreça de les cel·les a la columna "Temperatura". Això es pot fer de la mateixa manera que al camp "Nombre de compradors".
Amb l’ajuda d’altres configuracions, podeu establir etiquetes, nivell de fiabilitat, constant-zero, mostrar un gràfic de la probabilitat normal i realitzar altres accions. Però, en la majoria dels casos, no cal canviar aquests paràmetres. L’única cosa que haureu de prestar atenció són els paràmetres de sortida. Per defecte, els resultats de l’anàlisi s’envien en un altre full, però reordenant el commutador, podeu establir la sortida al rang especificat en el mateix full on es troba la taula amb les dades originals o en un llibre separat, és a dir, en un fitxer nou.
Després de definir tots els paràmetres, feu clic al botó. "D'acord".
Anàlisi dels resultats de l’anàlisi
Els resultats de l’anàlisi de la regressió es mostren en forma d’una taula al lloc indicat a la configuració.
Un dels principals indicadors és R-quadrat. Indica la qualitat del model. En el nostre cas, aquesta proporció és de 0,705, o del 70,5%. Aquest és un nivell de qualitat acceptable. La dependència inferior a 0,5 és dolenta.
Un altre indicador important es troba a la cel·la a la intersecció de la línia. "Intersecció Y" i columna Probabilitats. Indica quin valor hi haurà a Y, i en el nostre cas, aquest és el nombre de compradors, amb tots els altres factors iguals a zero. En aquesta taula, aquest valor és 58,04.
Valor a la intersecció del gràfic "Variable X1" i Probabilitats mostra el nivell de dependència de Y a X. En el nostre cas, aquest és el nivell de dependència del nombre de clients de botigues a la temperatura. Un coeficient d’1,31 es considera un indicador d’influència bastant alt.
Com podeu veure, utilitzar Microsoft Excel és bastant fàcil de crear una taula d’anàlisi de regressió. Però només una persona preparada pot treballar amb les dades de sortida i entendre la seva essència.