Ngjashmëria e kosinusit përdoret përgjithësisht si një metrikë për matjen e distancës kur madhësia e vektorëve nuk ka rëndësi. Kjo ndodh për shembull kur punoni me të dhëna teksti të përfaqësuara nga numërimi i fjalëve.
Kur duhet të përdor ngjashmërinë kosinus?
Ngjashmëria e kosinusit mat ngjashmërinë midis dy vektorëve të një hapësire të brendshme produkti. Ai matet me kosinusin e këndit midis dy vektorëve dhe përcakton nëse dy vektorë janë duke u drejtuar afërsisht në të njëjtin drejtim. Shpesh përdoret për të matur ngjashmërinë e dokumenteve në analiza e tekstit.
Pse të përdorim ngjashmërinë kosinus në vend të distancës Euklidiane?
Ngjashmëria e kosinusit është e dobishme sepse edhe nëse dy dokumentet e ngjashëm janë larg njëri-tjetrit nga distanca Euklidiane për shkak të madhësisë (si, fjala 'kriket' u shfaq 50 herë në një dokument dhe 10 herë në një tjetër) ata mund të kanë ende një kënd më të vogël midis tyre. Sa më i vogël këndi, aq më i madh është ngjashmëria.
Cili është ndryshimi midis ngjashmërisë së kosinusit dhe distancës Euklidiane?
Në këtë artikull, ne kemi studiuar përkufizimet formale të distancës Euklidiane dhe ngjashmërisë së kosinusit. Distanca Euklidiane korrespondon me norma L2 e një ndryshimi midis vektorëve. Ngjashmëria e kosinusit është proporcionale me produktin me pika të dy vektorëve dhe në përpjesëtim të zhdrejtë me produktin e madhësive të tyre.
Cili është ndryshimi midis ngjashmërisë së kosinusit dhe distancës së kosinusit?
Zakonisht, njerëzit përdorin ngjashmërinë kosinus si një metrikë ngjashmërie midis vektorëve. Tani, distanca mund të përkufizohet si 1-cos_similarity. Intuita pas kësaj është se nëse 2 vektorë janë krejtësisht të njëjtë, atëherë ngjashmëria është 1 (kënd=0) dhe kështu, distanca është 0 (1-1=0).