Na imagem acima, se você quiser que
b
seja mais semelhante a
a
do que a c
, qual medida você deve escolher?Produto escalar
Correto! O produto escalar é proporcional ao cosseno e aos
comprimentos dos vetores. Portanto, embora o cosseno seja maior para o ângulo
formado por
b
e c
do que para o ângulo formado
por b
e a
, o comprimento do vetor maior de
a
faz com que o produto escalar de a
e
b
seja maior do que o produto escalar de b
e
c
.
Cosseno
O cosseno depende apenas do ângulo entre os vetores, e o ângulo menor
\(\theta_{bc}\) faz com que \(\cos(\theta_{bc})\) seja maior que
\(\cos(\theta_{ab})\).
Distância euclidiana
A distância \(\vec{bc}\) é menor que \(\vec{ab}\), deixando
b
mais próximo de c
do que de a
.Você está calculando a similaridade de videoclipes. O comprimento dos
vetores de embedding de videoclipes é proporcional à popularidade deles. Você
muda de cosseno para produto escalar para calcular a similaridade. Como a
semelhança entre os videoclipes muda?
Os vídeos em alta ficam mais semelhantes a todos os vídeos em geral.
Como o produto escalar é afetado pelas medidas dos dois vetores, a
grande extensão dos vídeos mais populares os torna mais semelhantes a todos
os vídeos.
Os vídeos em alta só ficam mais semelhantes a outros vídeos em alta.
O produto escalar é calculado como \(|a||b|\cos(\theta)\).
Supondo que
a
seja um videoclipe popular, sabemos que o
comprimento da incorporação, \(|a|\), é maior do que o de vídeos não populares.
O comprimento maior aumenta o
produto escalar, independentemente do valor de \(|b|\). Assim, os vídeos populares
ficam mais parecidos com todos os outros, não apenas com outros vídeos populares.
Os vídeos mais populares são menos semelhantes entre si do que
vídeos menos populares.
Como o produto escalar aumenta com o comprimento do vetor, e os vídeos populares têm
comprimento de vetor alto, a medida de similaridade vai aumentar, não diminuir.
Não houve alterações.
O produto escalar é afetado pelo comprimento do vetor. O comprimento de vetor alto de
vídeos populares vai mudar a medida de similaridade (anteriormente cosseno).
Considerando a mesma configuração da pergunta anterior, suponha que você volte
para o cosseno do produto escalar. Como a semelhança entre os videoclipes muda?
Os vídeos em alta ficam menos semelhantes a todos os outros.
Como o cosseno não é afetado pelo comprimento do vetor, o comprimento do vetor grande
das incorporações de vídeo mais conhecidas não contribui para a semelhança.
Assim, a mudança para o cosseno do produto escalar reduz a semelhança
entre os vídeos populares e todos os outros vídeos.
Os vídeos em alta ficam mais semelhantes a todos os outros.
O coseno não é afetado pelos comprimentos do vetor, então mudar do produto escalar
vai fazer com que as semelhanças de todos os vídeos populares diminuam.
Os vídeos em alta ficam mais semelhantes apenas entre si.
O coseno não é afetado pelos comprimentos do vetor, então mudar do produto escalar
vai fazer com que as semelhanças de todos os vídeos populares diminuam.
Não houve alterações.
Como o cosseno não é afetado pelo comprimento do vetor, enquanto o produto escalar é,
mudar do produto escalar para o cosseno vai mudar as semelhanças.