Top

本地磁盘小日记ヾ(≧▽≦*)ゝ

世界无限大.且行且珍惜w~
编码.计算机视觉.网络.语言.绘图在学/M2F/各种发烧友/死宅/见习天使w;

关于人们感知与数字视音频编码的关系入门-视觉篇01.

众所周知,视音频的数字化是为惹方便人们更好地记录视听而被人们所折腾出来的一门技术。既然主要是为惹人们而服务的,在我们的探究过程中就水到渠成地首先偏向于贴合人们所设计惹。本文主要是从生理角度上浅谈一下人们与数字视音频编码的关系w。针对人类视觉系统,我们可以从光学、色度学、视觉生理学、视觉心理学、解剖学、神经科学和认知科学等领域去多方位的研究它与数字视频的关系。

视觉部分01-主要是简单介绍,日后会展开补充!

后续文章将对各种视觉系统模型进行浅度分析、归纳一些常用的理论.公式与示意图,并会结合数字图像处理那本书来进行更多浅度解析。

转载时请注明最下面的出处信息!

光:人眼可见电磁波谱(波粒二象性);

简而言之,"光"其本质是一种处于特定频段的光子流。通俗不严谨一点来讲光子流可以认为成由光的粒子组成,光子中的电子以不同频率的震动并以波的形式释放能量,从而发出了光。光的速度是恒定的,所以频率越高,波长就越短。可见光由波长380nm到750nm之间的光子组成,称为可见光谱。震动的频率越高,颜色相对应的位置就会越高。

可见光谱的一些颜色被称为黑色体,理论上一种理想的黑色物体被加热时它可以呈现出光谱的颜色,并随着温度的变化而变化。

你能看到的任何东西都是由可见光谱中的光子组成。

光的频率可用波长进行度量(可见光的波长用单位纳米表示)。我们所能看到的光一般都是会发光的东西或者是通过各种反射反射过来的光。

眼睛则是人类采集光的器官,它是人们感官中最重要的器官,普通人大脑中大约有百分之80的记忆都是通过眼睛获得的。

眼睛在做些什么;

光有跳跃的,也有不跳跃的。当有光线碰(或者说打)到人眼后面的视网膜的时候,眼睛就顺利完成了它的"采集"任务。光线通过眼角膜与瞳孔进入眼睛,打到晶状体后晶状体再将光聚焦产生一个焦平面,打到视网膜上,它们会把这些光线转化为神经脉冲传给脑子。过于靠近或远离焦平面会让"采集"的光在脑内形成的"图像"变得模糊。视网膜可以比喻为感光胶片或相机中的CCD。

视网膜上有"视感"与"视锥"两种用于感光的细胞。每一只人眼大概有1.2亿个感光细胞,而这1.2亿有95%左右都是视感细胞,它们对弱光和快速运动敏感,不过这些细胞只能感知亮度,而却不能感知色度。锥细胞对蓝红或绿这三种色度敏感,不过在弱光下却通常不能很好的工作。杆细胞主要对蓝色敏感。

不过视网膜上的感光细胞不止只有两个。比如"光敏中枢细胞(PGC)“,它可以在较长的周期内对光的数量做出反应。不过对于PGC来说,它原则上y用于没有足够的光线使锥细胞工作的时候。

人眼一般可以非常好的感知出相对亮度而且可以对照明的大量变化做出快速地调整,具有亮度适应性。我们能看到最弱的光线和不伤眼的最亮光线的比值大概是一万亿比一。从明视觉状态到暗视觉状态(暗适应)必须经过10-35s才能看到周围物体,而反之却仅需3-6s,这称为明适应。人眼对光的敏感程度与光的波长和光辐射功率有关。

人眼一般具有三种不同类型的锥细胞,每一种针对一种特定波长的光,对应着红黄蓝。它对绿色最为敏感,其次是红色,最后是蓝色。如果你的眼睛感知不到红或绿色,很大一部分的原因就是因为缺少一种锥细胞所致。在明视觉(相对于夜间视觉)的情况下,由于人眼对不同波长可见光的感受性不同,因此能量相同的不同色光表现出不同的明亮程度,黄绿色看着最亮,光谱两端的红色和紫色则暗得多。

大多数我们所感知的细节来自于眼睛所能看到的范围的一个极小的区域,这个区域位于视野的正中心,称为视网膜中央凹,关键性的锥细胞主要位于此。它只覆盖惹视网膜的百分之一,但大脑的视觉部分百分之五十的信息其实都来源于此。其它部分主要由用于弱光和高速视觉的杆细胞组成。所以我们通常在看东西的时候总会是对着要注视东西的某个大点,而很难做到利用起余光"全方位"的去看。

大脑接到眼睛的信号又是如何处理的:

人类通常都有很复杂的视觉系统..复杂到大脑的约1/4都在为视觉系统而服务,复杂到目前积极研究惹视觉神经学几十年的人们还没有商讨出一个接近描述人眼的特征来描述它。理想情况下人类大概可以分辨出一百万种颜色,CIE(国际照明委员会)在1931年决定整个可见光谱可以用红绿蓝的混合色表示,研究出了一个色彩空间图,基本证实惹这一点。

我们如何感知亮度:

相比颜色人们的感知能力更多地转向惹亮度。我们在亮度下分辨清晰的边缘和微小的细节的能力比分辨颜色要好得多。我们在一定程度上也能分辨出和它们周围物体不同的物体移动,这意味着我们察觉移动的东西比静止的东西更好。

我们观看方式中的多数在某种角度上本质上并不是真实的,视觉错觉会利用大脑大脑处理信息的特点进行加工。

我们如何感知色彩:

和亮度相比,我们的色彩感知既模糊又慢。从人的视觉系统看,色彩可用色调、饱和度和亮度来描述。

色调(HUE)表示颜色的类别。彩色物体的色调取决于物体在光照下所反射的光谱成分。亮度(Luminance)是指人眼对光的明亮程度的感觉。饱和度(Saturation)指彩色光所呈现彩色的深度或纯洁程度。对于同一色调的彩色光,其饱和度越高,它的颜色就越纯;而饱和度越小,颜色就越浅或纯度越低。色度指色调和饱和度的合称,既反映惹彩色光的颜色,也反映惹颜色的深浅程度。

大量实验表明,人眼大约可分辨37万种颜色,能分辨128种不同的色调,5-10种不同的饱和度,对亮度十分敏感。

我们如何感知白色:

没有色光等同于一点光都没有,而可见光谱中也没有白色光子。白色其实是反射所有可见波长的表面的颜色,在人类视觉中人们也常常把它与亮度变化所混淆。所以在不同情况下,我们感知为白色的颜色有相当一些不一样,这取决于它的周围是什么。

我们如何感知立体与空间:

越接近所看的物体,我们每只眼睛看到的影像就越不一样。我们能够利用差异的程度来确定物体的距离。虽然我们用一只眼睛也能很好判断东西在哪。人的两只眼睛存在间距(平均值为6.5cm),这就是双目视差。

有许多因素可以引发我们看东西时的空间感知。它们包括相对大小、重叠、透视、光线和阴影、遥远物体的蓝色阴影,以及你相对物体移动脑袋时看到的物体的不同角度。

运动视差是由观察者和景物发生相对运动所产生的,这种运动使景物的尺寸和位置在视网膜的投射发生变化,从而产生深度感。与此同时眼睛的适应性调节(通过晶状体和附属肌肉)眼睛主动调焦的行为和视差图象在大脑中的融合(辐辏.双眼与被观察物体三点)都可以让我们感知到立体视觉。

我们如何感知运动:

我们的大脑中有相当数量的神经细胞在寻找我们周围的不同方向的运动。它们确保我们能够非常快速地察觉并回应。这些运动传感细胞特别适应于察觉在复杂背景前面沿一个方向运动的物体。我们能够在许多其他的物体中跟踪一个单独的物体,这也称之为对比效应。

用视觉暂留举例来说,典型地通过回放影像实现运动的感受需要每秒变化16次(16f/s(帧)),低于这个速度的东西看上去就像幻灯片。运动越快,看上去也就越自然流畅惹。这也称之为视觉惰性。

我们的视野:

所谓视野即头部不动时眼球向正前方注视所能看到的空间范围,也称为周边视力,指黄斑中心凹以外的视力。正常人眼的最大范围约在左右35度和上下40度,最佳视野范围约在左右15度和上下15度,最大固定视野约在左右90度上下70度,头部活动时视野可扩展到左右95度和上下90度。视野还受背景色的影响,例如黑色背景下的彩色视野范围小于白色背景下的的彩色视觉范围。

我们如何感知闪烁与细节:

人眼受到周期性光脉冲照射时,若重复的频率不是很高,则会产生忽暗忽明的闪烁感觉。若将重复的频率提高到某一定值以上,人眼将感觉不到闪烁,形成均匀的非闪烁光源的感觉。不引起闪烁感觉的光脉冲最低的重复频率,称为临界闪烁频率。比如在CRT显像管显示器中刷新率就是这个道理。

分辨率就是指人眼对所观察的实物细节或图像细节的辨别能力,具体量化起来就是能分辨出平面上的两个点的能力。眼睛分辨景色细节的能力有一个极限值,将这种分辨细节的能力称为人眼的分辨率或视觉锐度。眼睛对被观察物体上相邻两点之间能分辨的最小距离所对应视角的倒数。

我们所看不到的一些东西:

视频对于人眼来说也有掩蔽效应,可以分为空间域中.时间域中和彩色的掩蔽效应。

视觉的大小不仅与邻近区域的平均亮度有关,还与邻近区域的亮度在空间上的变化(不均匀性)有关。在图像序列中相邻画面的变化剧烈(例如场景切换)时,人眼的分辨率会突然下降。在亮度变化剧烈的背景上,人眼对色彩变化的程度也会明显地降低。


@本地磁盘姬

ohayou.aimo.moe

微博:@萌萌的本地磁盘w

Twitter:@AmyGreen

2018年08月22日