Importanţa Co-ocurenţei & Semantismului
Pe scurt, termenii, conceptele, care apar frecvent împreună, tind să fie considerate ca şi asociate, cum ar fi de exemplu, când auzim termenul "Dracula" ne gândim la "Transilvania" şi nu la Germania sau Italia. Acesta reprezintă de fapt, o asociere semantică dintre doi termeni.
De ce este important cunoaşterea semantismului din punctul de vedere al Marketingului Online?
Iată câteva exemple:
- Asociere de cuvinte cheie
- Informaţii utile privind un "Brand " în cadrul motoarelor de căutare
- Poziţionarea documentelor în cadrul listărilor motoarelor de căutare
- Cercetarea cuvintelor cheie
Manfred Wettler şi Reinhard Rapp, de la Universitatea din Paderbon, au efectat studii importante în ceea ce priveşte folosirea semantismului şi co-ocurenţei în cadrul motoarelor de căutare, şi au ajuns la concluzia, că asociaţiile normale, bazate pe co-ocurenţa cuvintelor pot fi folosite pentru:
- generarea de cuvinte cheie pentru documente
- efectul cuvintelor asupra publicului larg în cadrul unei campanii publicitare
Înţelegerea co-ocurenţei
În funcţie de sursă, co-ocurenţa poate fi:
1. Globală: extrasă dintr-o bază de date
2. Locală: extrasă dintr-un document individual
3. Fractală: extrasă din sine
Partea de calcul teoretic este diferit în cadrul fiecarui tip de co-ocurenţă. Datele obţinute de pe urma co-ocurenţei pot fi folosite pentru a extrage o listă de termeni asociaţi, sau o listă de sinonime. Este evident că înţelegerea fenomenului de co-ocurenţă este foarte importantă pentru înţelegerea semantismului în cadrul motoarelor de căutare.
Pentru a ilustra relaţiile de semantism dintre doi termeni, care nu sunt sinonime, putem folosi statisticile de apariţie, sau frecvenţa cuvintelor în cadrul unor documente. Apariţia frecventă a două cuvinte non-sinonime poate atrage după sine o co-ocurenţă relativă, totuşi, descoperirea de sinonime, sau generarea unei liste cu sinonime, necesită statistici de ordinul doi. Există cazuri când, pentru determinarea sinonimităţii, sunt necesare statistici de ordinul trei sau statistici superioare pentru a putea rezolva fenomenul de "tranziţie" dintre doi termeni.
Pentru a înţelege mai bine, în cazul cuvintelor sinonime, avem nevoie de statistici de ordinul doi, deoarece termenii sinonimi rareori apar împreună, de obicei apar în acelaşi context.
Termeni "graniţă" sau "limită"
Extragerea datelor de co-ocurenţă, fără o înţelegere adecvată a teoriei acesteia, poate induce pe unii la concluzii greşite. Următorul exemplu ilustrează foarte bine punctul de mai sus.
Să presupunem că dorim să efectuăm o căutare de sinonimitate pentru substantivul "câine", folosind doi alţi termeni: "Canin" şi "Animal de casă" . Pentru identificarea termenilor cheie să folosim litera "R", şi să realizăm două scenarii de co-ocurenţă. În vederea obţinerii unor date cât mai exacte, să ignorăm toate celelalte scenarii posibile, combinaţii de termeni sau anumite secvente ale acestora:
1. scenariul 1: R1= câine R2= canin
2. scenariul 2: R1= câine R2= animal de casă
În urma unor căutari efectuate în Google.ro pentru aceşti termeni, vom obţine următoarele rezultate:
1. Rezultate 1 - 10 din aproximativ 143.000 română pagini pentru câine. = 143.000
2. Rezultate 1 - 10 din aproximativ 30.500 română pagini pentru canin. = 30.500
3. Rezultate 1 - 10 din aproximativ 183.000 română pagini pentru animal de casă. = 183.000
Pentru cuvintele "câine" şi "animal de casă" obţinem un număr mult mai ridicat de rezultate decât în cazul cuvântului "canin". Aceste rezultate nu sunt surprinzătoare, şi au de-a face cu scopul termenilor. Spre deosebire de "canin", cuvintele "câine" şi "animal de casă" sunt foarte apropiate în ceea ce priveşte scopul acestora, din această cauză sunt numite şi termeni de "flanc" . De menţionat este faptul că termenii, care sunt limitate în relaţie cu alţi termeni, prin scopul lor, cum ar fi "canin", sunt aşa numitele "Termeni de apropiere", sau "Termeni de vecinătate".
Notă:
- există o relaţie de sinonimitate între termenii "canin" şi "câine" , dar nu între termenii "canin" şi "animale de casă" sau " animale de casă" şi "câine"
- "canin" are diferite însemnări (polisemie)
- "canin" face parte dintre acele cuvinte care posedă un înţeles în cadrul unui înţeles. Pentru a înţelege despre ce vorbim, iată un exemplu descriptiv : "Caninul unui canin". Folosind termenul în acest fel, acesta la rândul sau se va comporta ca având un scop în cadrul scopului.
Să examinăm cum afectează natura acestor termeni co-ocurenţa globală a acestora în cadrul motoarelor de căutare (Google).