数据表示
网络是连接并能够通信的不同设备的集合。例如,一个公司的局域网连接了员工的计算机和打印机、扫描仪等设备。员工可以使用网络共享信息,还可以通过网络使用共同的打印机/扫描仪。要从一个设备传输或通信到另一个设备的数据以各种格式(如音频、视频等)呈现。本教程解释了计算机中不同数据类型的表示方式,并在网络中传输。
计算机网络中的不同数据类型:
- 文本
- 数字
- 图像
- 视频
- 音频
文本数据:
以文本格式表示的数据使用位模式(两个二进制位-0和1的组合)表示。文本数据只是一个字符串,而字符串是字符的集合。每个字符根据称为Unicode的国际标准被赋予一个特定的编号。为字符分配编号的过程称为“编码”,这些编号称为“代码”。现在,这些代码被转换为二进制位,以位模式表示文本数据,并通过网络以流的形式传输到其他设备。
Unicode:
它是字符编码的通用标准。它为全世界使用的几乎所有语言中的几乎所有字符提供了唯一的代码。它定义了超过1,40,000个字符。它甚至为表情符号定义了代码。Unicode的前128个字符指向ASCII字符。ASCII是另一种字符编码格式,但它只有128个代码对应128个字符。因此,ASCII是Unicode的子集。
文件扩展名:
.doc,.docx,.pdf,.txt等
例如:
Word:H
Unicode表示:U+0048
2. 数字数据
数字通过除以2而直接转换为二进制模式,而不需要任何编码。我们想要传输的数字通常是十进制数系统的() 10 . 我们需要将数字从() 10 转换为二进制数系统-() 2以获得位流。
数字格式:
整数
日期
布尔值
十进制
定点
浮点
例子:
数字:780
二进制表示:1100001100
3. 图像
图像数据也像文本数据一样以位流的形式传输。图像也称为图片,是由 像素 这些小元素组成的集合。单个像素是图片的最小可寻址元素,它就像一个大小为1/96英寸/0.26毫米的点。图像的尺寸由图像高度上的像素数乘以图像宽度上的像素数给出。
在计算机中的表示:
灰度图像:
黑白/灰度图像由白色、黑色和中间所有阴影组成。它可以被认为只是 白色强度的变化 . 像素中白色的强度由称为 像素值 的数字给出。灰度图像中的像素值可以在范围内 0到255之间 ,其中0表示黑色,255表示白色,区间中的所有数字表示不同的阴影。为图像创建具有图像中所有像素的像素值的矩阵。该矩阵被称为 通道 。
彩色图像:
每个像素由三个晶体管代表 代表三种标准颜色: 红色、绿色和蓝色(RGB)、黄色、青色和洋红(YCM) 。任何已知颜色都可以通过使用这三种颜色生成。根据像素中颜色的强度,为每种颜色生成三个矩阵/通道。
假设有一张彩色图像,并为图像中每个像素的红色、绿色和蓝色创建了三个矩阵:
第一个像素的红色、绿色和蓝色的强度分别为[141, 35, 31]。这样,每个像素都会被分析并转化为二进制位流,这个位流会被传输到网络中的其他设备来传送图像。N位位流用来表示2N种可能的颜色。从0到255,我们可以用不同的8位模式表示256种颜色阴影。
例如 ,如果一个图像只有黑色或白色,那么只需要一个位就足够表示像素:
白色 – 1
黑色 – 0
文件扩展名:
.jpg, .jpeg, .png等。
4. 音频
传输音频信号与其他格式不同。音频是广播录音或音乐。音频信号被 生成为模拟波形,转换为数字格式 以便存储在计算机中,通过以位来表示波形在每个时刻的振幅。另一个参数是采样率。它表示采样率或者说保存的样本数。
音频质量取决于 采样率 和 比特率 。如果在每个时刻使用更多的位来表示振幅,并且更准确地捕捉到更多的时刻,我们可以准确地保存音频的每个细节。
文件扩展名:
.mp3, .m4a, .WAV, .AAC, 等。
5. 视频
视频是一个 帧的集合;每个帧是一张图片 ,具有相同或不同的尺寸。这些帧/图像被表示为矩阵,就像我们上面讨论的那样。所有的帧/图像被连续显示,一个接一个,来展示运动的视频。为了表示一个视频,计算机会分析关于视频的数据,如:
- 每秒帧数(FPS)
- 视频时长
- 图像分辨率(水平像素数X垂直像素数)
- 位深度(表示一个像素所需的位数 -> 颜色数目)
视频大多与音频组合在一起,如电影或视频游戏。
文件扩展名:
.mp4, .MOV, .AVI 等。