Relevanta continutului - Elementele Valorii Vectoriale a unui termen
Elementele Valorii Vectoriale a unui termen
Am dezbatut ipoteza si ecuatiile teoriei vectoriale privind valoarea termenilor si, pentru intelegerea profunda a teoriei, vom realiza urmatorul exemplu:
Sa consideram un termen index, care contine urmatoarele cuvinte: "pagini", "web" si"design". Baza de date este formata din 3 documente. Vom calcula frecventa de aparitie a termenilor in fiecare document, de unde reiese:Documentul 1: pagini (de 4 ori) ; web (de 3 ori) ; design (de 5 ori)
Documentul 2: pagini (de 1 ori) ; web (de 4 ori) ; design (de 2 ori)
Documentul 3: pagini (de 3 ori) ; web (de 0 ori) ; design (de 1 ori)
Luam un sistem si vom efectua o cautare pe termenul"web". in urma cautarii vom obtine 0 pentru termenul "pagini", 0 pentru termenul "design" si 1 pentru termenul "web", 0 = fals, 1 = adevarat.
|
Termenul index |
Date |
Cautare="Web" |
|||
| Contor aparitie, tf | Contor cautare | ||||
| Termeni |
DOC 1 |
DOC 2 |
DOC 3 |
Q | |
| pagini |
4 |
1 |
3 |
0 | |
| web |
3 |
4 |
0 |
1 | |
| design |
5 |
2 |
1 |
0 | |
| Coordonate | (4,3,5) | (1,4,2) | (3,0,1) | (0,1,0) | |
| Magnitudine | |D1| | |D2| | |D3| | |Q| | |
Daca analizam tabelul, coloana cu coloana :
- prima coloana contine termenii specifici din cele trei documente - coloana 2, 3 si 4 contine date privind aparitia termenilor in fiecare document. Aparitia acestora fiind reprezentata prin coordinate specifice aparitiei acestora in spatiul vectorial. Coordinatele fiecarui document fiind: (4,3,5), (1,4,2) si (3,0,1). in cazul in care coordinatele de pornire sunt (0,0,0), distanta punctelor de la locul de origine-pornire poate fi reprezentata printr-un vector. Lungimea magnitudinii acestor vectori poate fi calculat cu ajutorul teoremei lui Pithagora. - coloana 4 arata coordinatele privind termenul cautat de catre noi, care in cazul nostru este (0,1,0)
Calculul Magnitudinii
Prin definitie, un Vector are o magnitudine si o directie. in vederea calcularii magnitudinii vectorilor, vom folosi teorema lui Pithagora, de unde pentru n dimensiuni:|
|Di| = (a1(2) +a2 +a3 +a4+.....an) (1/2) |
In exemplul nostru n = 3 , deci in cazul acesta magnitudinile vor arata in felul urmator:
|D1| = (16 + 9+ 25)(1/2)= 50(1/2) =7.333
|D2| = 1+16 + 4 =4.733
|D3| = 9+0 +1 =3.333
|Q| = 0 + 1 +0 =1
Inainte de a calcula directia vectorilor (valoare cosinus), avem nevoie de marimea scalara, acesta fiind calculat din valorea coordinatelor, iar in cazul documentului 1 vom obtine urmatoarele rezultate:
Coordinate:
Vectorul DOC 1 (4,3,5)
de unde rezulta:
Q * D1 = 0*4 +1*3 + 0*5 = 0 + 3 + 0 = 3
Nota: Scalarul este reprezentat prin suma dintre contor cautare si contor termeni. in cazul acesta obtinem urmatoarele rezultate :
pentru DOC 1 : Q*D1 =3 pentru DOC 2 : Q*D2 =4 pentru DOC 3 : Q*D3 =0
Dupa ce am obtinut rezultatele marimii scalarului sa calculam si valoare cosinus ~ directia vectorilor.
Cos D1 = Q*D1/ (|Q|*|D1|) = 3/(1*7.333) =0.409
Cos D2 = Q*D2/ (|Q|*|D2|) = 4/(1*4.733) =0.8451
Cos D3 = Q*D3/ (|Q|*|D3|) = 0/(1*3.333) =0
Dupa cum putem vedea :
| DOC 2 |
|
||
| DOC 1 |
|
||
| DOC 3 |
|