Una de les eines per resoldre problemes econòmics és l’anàlisi de clústers. Amb ell, els clústers i altres objectes de la matriu de dades es classifiquen en grups. Aquesta tècnica es pot utilitzar a Excel. Vegem com es fa en la pràctica.
Ús d’anàlisi de clústers
Amb l’ajut de l’anàlisi de clústers, es pot realitzar un mostreig basat en la investigació. La seva tasca principal és dividir una matriu multidimensional en grups homogenis. Com a criteri d’agrupament, s’utilitza el coeficient de correlació de parells o la distància euclidiana entre objectes per un paràmetre donat. Els valors més propers s'agrupen.
Tot i que sovint aquest tipus d’anàlisi s’utilitza en economia, també es pot utilitzar en biologia (per a la classificació d’animals), psicologia, medicina i en moltes altres àrees de l’activitat humana. L’anàlisi de clústers es pot aplicar mitjançant el conjunt d’eines Excel per a aquest propòsit.
Exemple d’ús
Tenim cinc objectes, que es caracteritzen per dos paràmetres estudiats: x i y.
- Aplica a aquests valors la fórmula de distància euclidiana, que es calcula a partir de la plantilla:
= ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)
- Aquest valor es calcula entre cadascun dels cinc objectes. Els resultats del càlcul es col·loquen a la matriu de distància.
- Ens mirem, entre els valors que la distància és mínima. En el nostre exemple, aquests són objectes. 1 i 2. La distància entre ells és de 4,123106, que és menor que entre qualsevol altre element d’aquesta població.
- Combinem aquestes dades en un grup i formem una nova matriu en la qual els valors 1,2 s’és un element independent. En compilar la matriu, deixeu els valors més petits de la taula anterior per a l'element combinat. De nou mirem, entre quins elements la distància és mínima. Aquesta vegada és 4 i 5així com un objecte 5 i un grup d'objectes 1,2. La distància és de 6,708204.
- Afegim els elements especificats al clúster comú. Formem una nova matriu amb el mateix principi que el temps anterior. És a dir, busquem els valors més petits. Per tant, veiem que el nostre conjunt de dades es pot dividir en dos grups. Al primer clúster hi ha els elements més propers - 1,2,4,5. En el segon clúster, en el nostre cas, només hi ha un element - 3. Està relativament lluny dels altres objectes. La distància entre els clústers és de 9,84.
Això completa el procediment per dividir la població en grups.
Com podeu veure, tot i que en general l’anàlisi de clúster pot semblar complicada, però, de fet, no és tan difícil entendre els matisos d’aquest mètode. El més important és entendre el patró bàsic d’associació en grups.