2026-01-04
#Ai

向量基础

向量基础

💡 概念:向量是什么?

向量是既有 “大小” (Magnitude) 又有 “方向” (Direction) 的量。 与之相对的是标量(只有大小,如温度、价格)

一维向量

只有一个分量,用一个实数表示,描述在数轴上的位置。表示向量的方向和大小:从原点0指向;
  • 长度(大小)
    • 就是它的绝对值
  • 方向
    • 一维空间只有“正/负”两个方向;
    • 向右
      • 向左
        • 没有方向

        二维向量

        二维向量可以用有序对(x,y)表示,描述它在平面内的水平与垂直分量
        • :水平方向的分量
          • :垂直方向的分量

            向量的长度(模长)

            向量从原点 (0,0) 指向点 (x,y),其长度由勾股定理得到:
            notion image
            几何意义:想象一个直角坐标系
            • 是直角三角形的底
              • 是直角三角形的高向量的长度
                • 就是这个直角三角形的斜边长度

                  向量的方向

                  知道了长度(斜边)和 (邻边),我们可以通过三角函数来确定向量的方向(角度 )
                  余弦公式:

                  AI 中的应用:余弦相似度

                  在 AI 领域,我们通常不只关心单个向量的角度,更关心两个向量之间的夹角,以此来判断它们的相似程度
                  🎬 实际应用场景
                  • 向量 A: 用户喜欢的电影类型特征
                    • 向量 B: 某部新上映电影的属性特征
                      • 目标: 判断是否推荐?即计算 A 和 B 的余弦相似度。
                        余弦相似度公式:
                        这个公式由两部分组成: • 分子(点积): 衡量两个向量在方向上的累积一致性。 ◦ 公式: • 分母(模长乘积): 用于归一化,消除向量长度本身的影响。 ◦ 公式:
                        notion image
                        结果解读 计算结果范围在 之间:   ✅ 结果是 1:完全相似。方向完全相同,夹角   ❌ 结果是 0:完全无关。互相垂直,夹角   🚫 结果是 -1:完全相反。方向背道而驰,夹角

                        三维向量

                        三维向量用有序三元组表示,记录向量在三个方向上的投影
                        • :沿水平轴的分量
                          • :沿竖直轴的分量
                            • :沿垂直屏幕的分量

                              模长

                              向量加法

                              端点连接“首尾相接”,即对应分量相加:

                              🎯场景

                              假设我们正在分析两个用户的水果购买行为,向量表示为 [苹果数量🍎, 香蕉数量🍌]
                              • 🧘用户 A(平民):[1, 1] —— 只是买点零食
                                • 💰用户 B(土豪):[100, 100] —— 进货式超级采购
                                  这时候,我们该怎么判断他们的关系?这完全取决于你手中拿的是哪把“尺子”📏:
                                  1️⃣如果用欧氏距离
                                  距离 140。在向量空间里,这是一个非常遥远的距离。如果你设定的阈值是 10 或者 20,这两人会被判定为“毫无关系”
                                  • 测量视角:看的是两点在空间中的物理直线距离。
                                    • 业务判定:“这俩完全不是一类人”。
                                      • 适用场景:你需要严格区分消费能力或量级(比如要把零售散户和批发商区分开)
                                        2️⃣如果用余弦相似度
                                        相似度为 1。这是余弦相似度的最大值(范围是 -1 到 1),意味着两者 100% 完美相似
                                        • 测量视角:看的是两个向量指向的夹角方向。
                                          • 业务判定:“这俩口味完全一致!”(都喜欢 1:1 的搭配)。
                                            • 适用场景:推荐系统、语义搜索(你需要匹配兴趣偏好或内容相关性,而不在乎频次高低或文本长短)

                                              💡 核心心法

                                              • 📍找位置(大小/数值敏感)👉 用 欧氏。
                                                • 🧭找方向(特征/比例敏感)👉 用 余弦。
                                                  End of Article