Relevanta continutului - Elementele Valorii Vectoriale a unui termen

Elementele Valorii Vectoriale a unui termen

Am dezbatut ipoteza si ecuatiile teoriei vectoriale privind valoarea termenilor si, pentru intelegerea profunda a teoriei, vom realiza urmatorul exemplu:

Sa consideram un termen index, care contine urmatoarele cuvinte: "pagini", "web" si"design". Baza de date este formata din 3 documente. Vom calcula frecventa de aparitie a termenilor in fiecare document, de unde reiese:

Documentul 1: pagini (de 4 ori) ; web (de 3 ori) ; design (de 5 ori)
Documentul 2: pagini (de 1 ori) ; web (de 4 ori) ; design (de 2 ori)
Documentul 3: pagini (de 3 ori) ; web (de 0 ori) ; design (de 1 ori)


Luam un sistem si vom efectua o cautare pe termenul"web". in urma cautarii vom obtine 0 pentru termenul "pagini", 0 pentru termenul "design" si 1 pentru termenul "web", 0 = fals, 1 = adevarat.


Termenul index

Date

Cautare="Web"

Contor aparitie, tf Contor cautare
Termeni

DOC 1

DOC 2

DOC 3

Q
pagini

4

1

3

0
web

3

4

0

1
design

5

2

1

0
Coordonate (4,3,5) (1,4,2) (3,0,1) (0,1,0)
Magnitudine |D1| |D2| |D3| |Q|

Daca analizam tabelul, coloana cu coloana :

- prima coloana contine termenii specifici din cele trei documente - coloana 2, 3 si 4 contine date privind aparitia termenilor in fiecare document. Aparitia acestora fiind reprezentata prin coordinate specifice aparitiei acestora in spatiul vectorial. Coordinatele fiecarui document fiind: (4,3,5), (1,4,2) si (3,0,1). in cazul in care coordinatele de pornire sunt (0,0,0), distanta punctelor de la locul de origine-pornire poate fi reprezentata printr-un vector. Lungimea magnitudinii acestor vectori poate fi calculat cu ajutorul teoremei lui Pithagora. - coloana 4 arata coordinatele privind termenul cautat de catre noi, care in cazul nostru este (0,1,0)

Calculul Magnitudinii

Prin definitie, un Vector are o magnitudine si o directie. in vederea calcularii magnitudinii vectorilor, vom folosi teorema lui Pithagora, de unde pentru n dimensiuni:

|Di| = (a1(2) +a2 +a3 +a4+.....an) (1/2)


In exemplul nostru n = 3 , deci in cazul acesta magnitudinile vor arata in felul urmator:

|D1| = (16 + 9+ 25)(1/2)= 50(1/2) =7.333
|D2| = 1+16 + 4 =
4.733
|D3| = 9+0 +1 =
3.333
|Q| = 0 + 1 +0 =
1

Inainte de a calcula directia vectorilor (valoare cosinus), avem nevoie de marimea scalara, acesta fiind calculat din valorea coordinatelor, iar in cazul documentului 1 vom obtine urmatoarele rezultate:
Coordinate:

Vectorul cautarii (0,1,0)
Vectorul DOC 1 (4,3,5)
de unde rezulta:
Q * D1 = 0*4 +1*3 + 0*5 = 0 + 3 + 0 = 3
Nota: Scalarul este reprezentat prin suma dintre contor cautare si contor termeni. in cazul acesta obtinem urmatoarele rezultate :

pentru DOC 1 : Q*D1 =3 pentru DOC 2 : Q*D2 =4 pentru DOC 3 : Q*D3 =0

Dupa ce am obtinut rezultatele marimii scalarului sa calculam si valoare cosinus ~ directia vectorilor.

Cos D1 = Q*D1/ (|Q|*|D1|) = 3/(1*7.333) =0.409
Cos D2 = Q*D2/ (|Q|*|D2|) = 4/(1*4.733) =
0.8451
Cos D3 = Q*D3/ (|Q|*|D3|) = 0/(1*3.333) =
0


Dupa cum putem vedea :

DOC 2
este foarte relevant !!!
DOC 1
este mai putin relevant !!!
DOC 3
este cel mai putin relevant !!!