想象一下,你手里有一台相机或者一部手机,它可以拍照。你看到的每一张照片,其实都是由成千上万,甚至上百万个微小的点构成的,这些点就叫做像素。
图片
当人们说他们的手机有1200万、2000万,甚至5000万像素的摄像头时,说的正是图像中包含了多少这样的微小像素。每一个像素都携带一些信息,要么只是亮度值,要么就是它应该呈现的颜色。
在最开始的三个例子里,我们只会讨论黑白图像,也就是所谓的灰度图像。在灰度图像里,每个像素只存储一个数值,这个数值在 0 到 255 之间,用来表示它的亮度。因为显然它是黑白图像,所以不会存储任何颜色信息。
零维张量
让我们从最简单的层级开始,那就是零维张量。一个零维张量就是一个单独的数字,仅此而已。就好像你问:“在一张黑白照片里,单独的某一个像素的亮度是多少?” 这个像素没有宽度,没有高度,只有一个点。举个例子,这个像素的亮度可能是 128。所以,一个零维张量就是一个数字,比如 128。它没有形状、没有结构、没有方向,仅仅是一个单独的数。
一维张量
现在我们向前走一步。如果你有一排像素,比如说照片的最上面一行像素,每一个像素都有自己的亮度值。你可以把它看作一个一维张量,简称 1D。举例来说,假设一行里有五个灰度像素,它们的亮度值可能是 100、20、140、200 和 30。这样你就得到五个依次排列的数字。这就是一个数字列表。它有长度或大小,但没有高度和宽度,就像一条直线。
类似地,即使是一条竖直的像素带——也就是一列像素——依旧是一个一维张量,因为它本质上还是一个方向上的数字列表。所以,一维张量就像是黑白图像里的一行或者一列像素值,它只承载一个维度的数据。我们也常常把一维张量称为向量。
二维张量
接下来再走一步,如果我们有一整张图像,比如一张小的黑白照片,其中每个像素仍然只存储一个亮度值,但它们现在是按照行和列排列的。这就形成了一个网格。这就是二维张量,简称 2D。在这个网格的每一个位置上都有一个数字,比如左上角可能是 100,它旁边的是 110,依此类推。黑白图像——也就是灰度照片——就是这样存储的:一大张数字表。所以,二维张量也被称为矩阵,它是按行和列排列的像素值。
三维张量
到目前为止,我们讨论的都是灰度像素——只有亮度,没有颜色。那如果我们想存储彩色图像,比如一张你用手机拍的真实照片呢?每一个彩色像素不再只是一个数字,而是由三个不同的数值构成:一个表示红色,一个表示绿色,一个表示蓝色。它们被称为通道。
图片
所以,现在你的图像中的每一个点不再是一个单独的数,而是一个包含三个数值的小捆绑。举个例子,如果你的图像是 3 像素高、3 像素宽,但每个像素有三个值而不是一个,你就得到了三张矩阵叠加在一起:一张表示红色,一张表示绿色,一张表示蓝色。这就叫做三维张量,简称 3D。
你可以把它想象成一个数字立方体。在高度方向上,有行;在宽度方向上,有列;而在第三个方向上,也就是深度方向,有颜色通道。所以,这个立方体的每一个点都由三层数值构成:红、绿、蓝。
让我们举一个具体的例子。假设第一行第一列的那个像素,它的红色值是 255,绿色值是 0,蓝色值也是 0。那就意味着这个像素是鲜艳的红色。下一个像素可能会有不同的红、绿、蓝数值。这些彩色数值组合在一起,就构成了完整的图像。而所有这些数值,都存在于一个三维张量里。
所以,每一次你在手机相册里滑动查看照片时,你的眼睛其实都在看三维张量,只是你没有意识到。
现实世界的例子
既然我们已经用像素理解了张量,那就把这种理解扩展到其他现实世界的例子。首先,我们来看天气数据。想象一下,我们要追踪不同城市随时间变化的温度。如果你有 10 个城市的温度数据,每小时测量一次,持续 24 小时,你可以把这些数据存储为一个二维张量:24 行代表每个小时,10 列代表每个城市。
但如果我们还想加入其他数据,比如湿度和风速呢?那么,每个单元格就不再是一个数字,而是一个由三个数值组成的小组合:温度、湿度和风速。于是,这些数据就变成了一个三维张量,其中第三个维度用来存储不同的天气特征。
金融领域的例子
现在让我们转到一个完全不同的领域——金融。假设你在追踪 50 家公司的股票价格,跨度是 100 天。这就构成了一个二维张量:每一行代表一天,每一列代表一家公司。
但是,如果你还想在每只股票里存储更多细节,比如开盘价、收盘价和交易量,那么每一个单元格就会变成一个数值组合。这就引入了第三个维度。于是,我们就可以把这份数据看成是一个立方体。假设这份数据对应的是某一个证券交易所,比如纽约证券交易所(NYSE)。当然这里是假设的数据,但我们可以把 NYSE 想象成这样一个立方体。
接着,如果我们对其他证券交易所也有类似的存储方式,比如纳斯达克(NASDAQ)、印度的国家证券交易所(NSE)、香港交易所,以及东京证券交易所,那么它们每一个都会有自己的数据立方体,就像 NYSE 一样。
所以,现在我们不再只有一个立方体,而是有一系列立方体,每个交易所一个。如果你把这些立方体堆叠在一起,比如并排放置,那么就形成了一个四维张量,一种能够容纳多层次、多来源金融数据的结构。
这正是深度学习系统处理庞大数据集的方式:通过把它们组织进高维张量。这些张量帮助金融分析师在庞大的数据集中进行运算、发现模式并进行预测。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。盛达优配官网-十大股票配资网站-实盘配资平台-公司配资炒股提示:文章来自网络,不代表本站观点。