Teste seu conhecimento

Um gráfico mostrando os pontos a, b e c em relação a um ponto central.
Na imagem acima, se você quiser que b seja mais semelhante a a do que a c, qual medida você deve escolher?
Produto escalar
Correto! O produto escalar é proporcional ao cosseno e aos comprimentos dos vetores. Portanto, embora o cosseno seja maior para o ângulo formado por b e c do que para o ângulo formado por b e a, o comprimento do vetor maior de a faz com que o produto escalar de a e b seja maior do que o produto escalar de b e c.
Cosseno
O cosseno depende apenas do ângulo entre os vetores, e o ângulo menor \(\theta_{bc}\) faz com que \(\cos(\theta_{bc})\) seja maior que \(\cos(\theta_{ab})\).
Distância euclidiana
A distância \(\vec{bc}\) é menor que \(\vec{ab}\), deixando b mais próximo de c do que de a.
Você está calculando a similaridade de videoclipes. O comprimento dos vetores de embedding de videoclipes é proporcional à popularidade deles. Você muda de cosseno para produto escalar para calcular a similaridade. Como a semelhança entre os videoclipes muda?
Os vídeos em alta ficam mais semelhantes a todos os vídeos em geral.
Como o produto escalar é afetado pelas medidas dos dois vetores, a grande extensão dos vídeos mais populares os torna mais semelhantes a todos os vídeos.
Os vídeos em alta só ficam mais semelhantes a outros vídeos em alta.
O produto escalar é calculado como \(|a||b|\cos(\theta)\). Supondo que a seja um videoclipe popular, sabemos que o comprimento da incorporação, \(|a|\), é maior do que o de vídeos não populares. O comprimento maior aumenta o produto escalar, independentemente do valor de \(|b|\). Assim, os vídeos populares ficam mais parecidos com todos os outros, não apenas com outros vídeos populares.
Os vídeos mais populares são menos semelhantes entre si do que vídeos menos populares.
Como o produto escalar aumenta com o comprimento do vetor, e os vídeos populares têm comprimento de vetor alto, a medida de similaridade vai aumentar, não diminuir.
Não houve alterações.
O produto escalar é afetado pelo comprimento do vetor. O comprimento de vetor alto de vídeos populares vai mudar a medida de similaridade (anteriormente cosseno).
Considerando a mesma configuração da pergunta anterior, suponha que você volte para o cosseno do produto escalar. Como a semelhança entre os videoclipes muda?
Os vídeos em alta ficam menos semelhantes a todos os outros.
Como o cosseno não é afetado pelo comprimento do vetor, o comprimento do vetor grande das incorporações de vídeo mais conhecidas não contribui para a semelhança. Assim, a mudança para o cosseno do produto escalar reduz a semelhança entre os vídeos populares e todos os outros vídeos.
Os vídeos em alta ficam mais semelhantes a todos os outros.
O coseno não é afetado pelos comprimentos do vetor, então mudar do produto escalar vai fazer com que as semelhanças de todos os vídeos populares diminuam.
Os vídeos em alta ficam mais semelhantes apenas entre si.
O coseno não é afetado pelos comprimentos do vetor, então mudar do produto escalar vai fazer com que as semelhanças de todos os vídeos populares diminuam.
Não houve alterações.
Como o cosseno não é afetado pelo comprimento do vetor, enquanto o produto escalar é, mudar do produto escalar para o cosseno vai mudar as semelhanças.