向量基础

💡 概念:向量是什么?
向量是既有 “大小” (Magnitude) 又有 “方向” (Direction) 的量。 与之相对的是标量(只有大小,如温度、价格)
一维向量
只有一个分量,用一个实数表示,描述在数轴上的位置。表示向量的方向和大小:从原点0指向;
- 长度(大小)
就是它的绝对值
- 方向
- 向右
- 向左
- 没有方向
一维空间只有“正/负”两个方向;
二维向量
二维向量可以用有序对(x,y)表示,描述它在平面内的水平与垂直分量
- :水平方向的分量
- :垂直方向的分量
向量的长度(模长)
向量从原点 (0,0) 指向点 (x,y),其长度由勾股定理得到:

几何意义:想象一个直角坐标系
- 是直角三角形的底
- 是直角三角形的高向量的长度
- 就是这个直角三角形的斜边长度
向量的方向
知道了长度(斜边)和 (邻边),我们可以通过三角函数来确定向量的方向(角度 )
余弦公式:
AI 中的应用:余弦相似度
在 AI 领域,我们通常不只关心单个向量的角度,更关心两个向量之间的夹角,以此来判断它们的相似程度
🎬 实际应用场景
- 向量 A: 用户喜欢的电影类型特征
- 向量 B: 某部新上映电影的属性特征
- 目标: 判断是否推荐?即计算 A 和 B 的余弦相似度。
余弦相似度公式:
这个公式由两部分组成:
• 分子(点积): 衡量两个向量在方向上的累积一致性。
◦ 公式:
• 分母(模长乘积): 用于归一化,消除向量长度本身的影响。
◦ 公式:

结果解读
计算结果范围在 之间:
✅ 结果是 1:完全相似。方向完全相同,夹角
❌ 结果是 0:完全无关。互相垂直,夹角
🚫 结果是 -1:完全相反。方向背道而驰,夹角
三维向量
三维向量用有序三元组表示,记录向量在三个方向上的投影
- :沿水平轴的分量
- :沿竖直轴的分量
- :沿垂直屏幕的分量
模长
向量加法
端点连接“首尾相接”,即对应分量相加:
🎯场景
假设我们正在分析两个用户的水果购买行为,向量表示为
[苹果数量🍎, 香蕉数量🍌]- 🧘用户 A(平民):
[1, 1]—— 只是买点零食
- 💰用户 B(土豪):
[100, 100]—— 进货式超级采购
这时候,我们该怎么判断他们的关系?这完全取决于你手中拿的是哪把“尺子”📏:
1️⃣如果用欧氏距离
距离 140。在向量空间里,这是一个非常遥远的距离。如果你设定的阈值是 10 或者 20,这两人会被判定为“毫无关系”
- 测量视角:看的是两点在空间中的物理直线距离。
- 业务判定:“这俩完全不是一类人”。
- 适用场景:你需要严格区分消费能力或量级(比如要把零售散户和批发商区分开)
2️⃣如果用余弦相似度
相似度为 1。这是余弦相似度的最大值(范围是 -1 到 1),意味着两者 100% 完美相似
- 测量视角:看的是两个向量指向的夹角方向。
- 业务判定:“这俩口味完全一致!”(都喜欢 1:1 的搭配)。
- 适用场景:推荐系统、语义搜索(你需要匹配兴趣偏好或内容相关性,而不在乎频次高低或文本长短)
💡 核心心法
- 📍找位置(大小/数值敏感)👉 用 欧氏。
- 🧭找方向(特征/比例敏感)👉 用 余弦。
End of Article