AR 介绍以及技术原理
一、 AR
哈哈,挺有趣的吧,这其实是用一款有趣的软件制作出来的,名叫「唐纳德涂鸦」(: ;iOS: )。首先,我想问一下,大家知道什么是 AR 吗?
现实增强技术,亦称AR,它能够实时计算摄影机的影像位置和角度,并附加相应的图像。其目的是在屏幕上叠加虚拟世界与现实世界,实现两者间的互动。换言之,当现实世界以影像形式展现于屏幕时,AR技术便在现实与用户之间引入了一层可控的编程界面,由此拓展了一种全新的体验空间。借助AR技术,用户得以与周围环境实现更为丰富和深入的互动,不仅能够即时执行各种操作,还能即时获得响应,而不仅仅是浏览资讯。
在移动设备领域,AR技术正迅速兴起,相较于需要特定设备的VR技术,AR技术更加易于接近。在iOS和安卓平台上,相关应用已经相当丰富。以下是一些用户可能有所耳闻的AR应用:
2、AR技术原理
AR 从其技术手段和表现形式上,可以明确分为大约两类:
1、 AR
计算机视觉技术在AR领域的应用,通过构建现实世界与虚拟屏幕之间的对应关系,使得我们设计的图形或三维模型仿佛附着于真实物体之上,呈现在屏幕之中。那么,这种效果是如何实现的呢?
本质上,我们需要在现实世界中确定一个依托的平面,接着将此三维空间中的平面投影至我们的二维显示屏上,并在该平面上绘制出我们希望呈现的图形。从技术实施的角度来看,这可以划分为两大类:
1) - AR
实现此方法需预先准备一个模板(如绘制特定规格的形状的卡片或二维码),随后将其放置于现实世界的某个位置,这相当于在现实场景中确定了一个平面。接着,利用摄像头对模板进行识别和姿态评估(即Pose),并确定其具体位置。以该位置为中心,建立一个新的坐标系,即模板坐标系。我们的任务实质上是要找到一个变换,使模板坐标系与屏幕坐标系之间建立映射关系。通过这个变换,我们能在屏幕上绘制的图形呈现出依附于模板的效果。要理解这一原理,需要具备一定的3D射影几何知识。从模板坐标系转换到真实屏幕坐标系,需先进行旋转和平移至摄像机坐标系(),再从摄像机坐标系映射至屏幕坐标系(实际上,由于硬件误差,这一过程中还需进行理想屏幕坐标系到实际屏幕坐标系的转换,此处不予详细探讨),具体可参考下图。
在编码过程中,这些操作均转化为矩阵形式,而在线性代数中,矩阵象征着一种变换。通过对坐标执行矩阵左乘操作,即可实现线性变换(对于非线性的平移变换,则可通过引入齐次坐标来执行矩阵运算)。具体公式如下:
其基本原理与AR技术一致,但具备一个显著特点,即能够以任何拥有充足特征点的物体,比如书籍的封面,作为平面参照物,无需预先准备特定的模板,从而打破了模板对AR应用领域的限制。其工作原理涉及运用一系列算法,例如SURF、ORB、FERN等,从模板物体中提取特征点,并对这些特征点进行记录或学习。摄像头在扫描周边环境时,会捕捉并提取环境中的关键特征点,随后将这些特征点与预先存储的模板物体的特征点进行对比。一旦检测到的特征点与模板中的特征点匹配数超过预设的阈值,便判定已识别出该模板。接下来,系统会根据这些匹配的特征点坐标来估算Tm矩阵,并据此进行图形的绘制,其方法与增强现实技术中的图形绘制方式相似。
2、 LBS- AR
LBS与AR技术相结合,将地理位置信息与增强现实功能相融合,在此之前,这一技术的应用领域主要集中在各种游戏上,比如去年在全球范围内大热的《Go》游戏,便是这一技术应用的典范之一。游戏首先确定玩家所在的具体位置,随后系统会安排该地区特有的妖怪种类及其出现的概率。玩家只需跟随导航指引,便能够轻松寻找到各种口袋妖怪。此外,游戏还巧妙地融入了AR技术,使得玩家在现实世界中能够真实地重现捕捉妖怪时投掷精灵球的动作。
这种增强现实技术是通过结合设备的全球定位系统功能与传感器来实现的,它不再需要依赖某些应用,因此在用户使用体验上相较于传统AR技术更为优越。此外,由于它无需实时识别用户姿态和计算特征点,其性能在对比传统AR和Less AR技术时也更为出色。因此,与这两种技术相比,基于位置服务的AR(LBS-AR)能更有效地应用于移动设备。
LBS-AR导航应用在展示大量信息时,会遭遇以下两个难题。
物体相互覆盖无法显示的问题
运用实时聚类算法,对相互重叠度较高的标签进行即时整合,用户点击汇总标签后,所有被汇总的标签将以列表形式一一呈现,便于用户进行后续的挑选。
点选几个物体相互覆盖部分时的物体选择问题。
运用射线交会法,每当用户触控屏幕,便依据坐标变动,将二维屏幕上的坐标点转化为三维射线,进而检测该射线是否与三维场景中的标识发生交点。一旦发现交点,系统便会将这些交点所对应的标识以列表形式呈现,供用户进行后续挑选。
硬件技术难点:
交互技术
微软推出的AR硬件以其手势操控功能著称,用户佩戴眼镜后,便能够通过空中手指的点击、拖拽、拉伸等动作来操控虚拟物体和功能菜单界面。例如,使用Air tap手势即可激活全息图,而另一特定手势则可唤起开始菜单。
语音操控:
手势操作确实让双手得到了释放,然而,它存在一个严重的弊端,那就是频繁地抬起手臂会导致手臂感到疲惫。相比之下,语音操作则是一种更优的人机交互方式。目前,微软、Now、苹果的Siri、亚马逊的Echo都推出了出色的语音识别助手,但它们的识别准确率仍然有待提高,目前只能作为辅助操作的工具,其智能水平也远未满足AR交互的需求。
体感操控:
若未来某日全息通讯技术得以实现,届时,我们不仅能够进行语音和视觉的沟通,甚至可能与远方的友人实现触觉上的互动,诸如握手等。为了达到更加逼真的增强现实体验,体感设备的重要性不言而喻。目前,市面上已有众多厂商推出了体感手套、体感枪等辅助设备。然而,这些产品的功能尚显薄弱,仍有巨大的提升潜力。
镜片成像技术
无论是增强现实技术还是虚拟现实技术,视场角都是决定用户体验的关键要素之一。目前市面上的AR眼镜,其可视广角普遍偏低,大多在30°左右,而Meta One更是仅有23°,而人们所熟知的视角则只有12°。这种现象主要归因于镜片成像技术和光学模组尚不成熟,目前尚无有效的解决方案。然而,如此狭窄的视角无疑严重削弱了增强现实的效果。
而除了FOV,AR在成像方面,还存在着以下的问题需要解决:
软件层面,首先需要强化的是底层算法,尤其是输入和输出算法。为此,必须借助精确的图像识别技术来准确判定物体的位置以及三维坐标等关键信息。值得注意的是,与一般3D定位不同,在增强现实领域,物体的定位必须考虑到观察者的相对位置和三维立体坐标等多重因素,其难度显著增加。此外,如何运用叠加呈像算法,将所需信息有效叠加至视网膜上,也是一个不容忽视的技术挑战。
在硬件配置上,光学镜片依旧面临色散以及图像畸变等挑战。当智能眼镜进行成像时,视野边缘会显现出红绿蓝三色的变化,这是棱镜反射光线时产生的典型色散效应。这一问题可以通过软件色彩校正或采用多材料镜片来缓解。然而,软件校正会加重硬件负担并减少图像的帧率。而多材料镜片的制作成品率较低,这也是增强现实眼镜价格高昂的一个因素。
SLAM技术
SLAM技术,即同步定位与建图技术。有人曾言,在两年前,扫地机器人便是这一技术的典型代表。确实,这类机器人能够扫描室内布局,并规划出清扫路径,无疑是SLAM技术的最佳体现。实际上,SLAM技术同样适用于增强现实领域。目前,基于此技术开发的知名产品包括微软、谷歌以及Leap等。
以AR技术为例,我们熟悉其观看视频的功能,但若要将画面精确映射至墙面或壁橱,SLAM技术便成为关键。具体来说,当SLAM技术启动时,它会扫描用户所在的空间,进而构建起房间内物品布局的立体模型。
这是微软推出的首款无需依赖线缆束缚的全息计算设备,它允许用户与数字信息进行互动,同时也能实现与周围真实环境中全息图像的实时交互。
微软MR头显外观:
让我们先来看一下 的官方宣传视频
投射新闻信息流:
模拟游戏:
.jpg
收看视频和查看天气:
辅助3D建模:
二、 AR、VR、MR与全息头像、裸眼 3D 的区别
接下来,我将为大家简要地阐释几个基本名词概念,包括VR、AR、MR以及全息投影和裸眼3D。
1、 VR
虚拟现实技术,亦称VR,是一种简称。它主要通过计算机技术模拟构建一个立体的虚拟环境,为用户带来视觉、听觉以及触觉等多感官的仿真体验,仿佛置身其中。用户可以不受限制地实时观察三维空间中的各种事物,并在这一虚拟领域中与虚拟物体进行互动。
比如贝壳看房:
贝壳的虚拟现实体验不尽人意,存在较大的延迟和画质不佳的问题,这或许是因为他们在处理数据时将原本的15G压缩至约15M。此外,手机壳引起的画面扭曲更是让VR看房体验变得痛苦不堪。更糟糕的是,其VR功能并未得到充分优化,在使用过程中,手机自动锁屏甚至可能导致画面突然变黑。
MR,即混合现实,涵盖了增强现实与增强虚拟两大领域,它所代表的是将现实与虚拟世界融合而成的全新视觉体验空间。在这个空间中,实体与数字元素共同存在,并能进行实时交互。要实现混合现实,必须在一个能够与现实世界中的各种事物进行互动的环境中。若所有事物均为虚拟,那么就属于VR的范畴了。若所呈现的虚拟数据仅能简单叠加于现实对象之上,则该技术属于增强现实。而混合现实技术的核心在于与真实世界的互动以及信息的即时捕捉。
Leap在MR领域颇具盛名。自2014年以来,Leap已发布多部展示其AR技术的视频,其中包括在体育馆内激起水花的大鲨鱼、掌心中的大象以及藏于办公桌腿后的机器人。这些早期视频给人留下深刻印象,Leap的AR效果堪称惊艳,其逼真的显示效果甚至能够被实物遮挡,完美地融入现实世界之中。
此处尚存一段Leap演示视频,其中呈现的视点,正是Leap设备佩戴者所看到的景象。
观察到的交互设计显示,Leap与同类产品相比并无显著差异,其独特之处在于能够实现多平面识别,并打造出房间级别的体验。然而,扫描多个地点可能会让用户觉得操作起来较为繁琐。此外,该项目结合了VR(虚拟现实)、AR(增强现实)、MR(混合现实)等技术。
定义
全是虚的
半真半假
真假难辨
代表产品
Rift、HTC Vive、 VR、三星Gear VR
、 Leap
代表游戏
《极乐王国》
《精灵宝可梦Go》
《超次元MR》
适用场景
商场娱乐、游戏、影片
游戏、移动APP
商业领域
交互区别
VR设备主要应用于纯虚拟环境的互动,其功能涵盖位置定位、头部动作捕捉、动作识别、眼部跟踪、数据手套和数据头盔等多种技术。例如,Rift、Vive、Gear VR以及暴风魔镜等设备,此外,还有诸如红龙摄像机系统以及ONE等专用的VR视频直播工具。
增强现实设备:鉴于增强现实技术涉及现实世界与虚拟世界的融合,因此大多数情况下都配备有摄像头。这些设备在捕捉现实场景的同时,会将虚拟图像与之叠加,实现展示与交互的功能。例如,谷歌、微软等公司生产的AR设备均具备这一特性。
现有设备区别
正如前述的交互差异所述,VR设备,即面向普通消费者的设备,其设计重点在于提供沉浸式体验。因此,这些设备普遍采用了封闭的结构。这一设计旨在避免现实世界的干扰,以保持用户对虚拟环境的深度沉浸。为此,VR设备通常被设计成头戴式,与面部接触的部分使用了橡胶或海绵材料。这样的设计不仅提升了佩戴的舒适性,还有效地防止了漏光,从而确保了封闭空间的完整性。现阶段,基于3D成像技术的VR设备普遍采用凸透镜设计。这些技术要素的融合使得VR设备在视觉上显得较为笨拙。
因此,目前市场上的消费级虚拟现实设备普遍呈现出封闭式设计、配备凸透镜以及较为笨重的特点。
当然也有简易的VR设备。
相较于其他设备,AR设备在外观上更为轻巧,并且多采用眼镜式设计(例如),并配备摄像头以捕捉周围环境。这些设备的镜片一般采用透明棱镜,图像通过镜框内置的微型投影仪投射至棱镜,随后经过棱镜的反射,最终到达近人眼处。人眼通过棱镜,能够看到叠加在现实场景之上的显示信息。
因此,目前市场上的消费级增强现实设备普遍具备轻巧便携的特点,配备透明棱镜以及摄像头等识别元件。
3、全息投影
全息投影技术,亦称作虚拟成像技术,它基于干涉与衍射的原理,能够捕捉并重现物体的真实三维影像。这项技术不仅能创造出立体的空中幻影,还能实现幻影与表演者的互动,共同完成表演,从而带来令人叹为观止的演出效果。全息立体投影并非依赖数字技术完成,它通过将不同视角的影像投射至一种源自国外的特殊全息膜上,从而确保你无法观察到非自身视角的图像,从而达到了全息立体影像的呈现效果。对于全息投影的直观认识,可以参考《钢铁侠》中的“贾维斯”这一形象。通过全息投影技术,我们得以无需佩戴眼镜或头盔,便能够观察到逼真的三维物体与空间。全息投影的初衷,即是在现实世界中重现一个立体的虚拟环境。
4、裸眼3D
裸眼3D的直观理解,即是无需借助任何辅助设备,观看3D电影所能获得的视觉体验,这与我们戴上3D眼镜观看3D电影所感受到的效果相似。裸眼3D技术与全息投影技术之间最显著的差异,在于它们所采用的成像原理各不相同,这也导致了它们呈现出的效果有所区别。裸眼3D技术是通过光栅原理来实现投影成像的,而全息投影技术则是基于干涉与衍射的原理。在当前技术环境下,裸眼3D技术对观众的视角和观看距离有特定限制,相比之下,全息投影则不受此类限制。
裸眼3D技术和全息投影的观看体验无需借助额外设备,可以直接观赏;而VR、AR、MR技术所呈现的画面效果,则需要依赖相应的辅助设备,才能确保观看的流畅性。
应用领域
VR/AR 技术在医疗上的有几个运用案例:
在诊疗过程中以及日常工作中,该工具为医生提供助力,解决难题,例如,借助VR/AR技术,医生能够轻松实现对手术部位的精确定位。
(2)用于物理治疗及恐惧症的治疗(如恐高症等);
借助虚拟网络技术,患者能够更加便捷地进行就诊。根据高盛发布的AR/VR行业报告预测,VR/AR直播市场的年销售额在2020年达到了12亿美元,预计到2025年这一数字将增至51亿美元。
虚拟现实与增强现实技术具备在教育界确立为常规工具的巨大潜能,它们有望彻底改变学生在基础教育以及高等教育阶段的学习体验。借助这些技术,教师能够使学生沉浸在三维空间中,与各种物体展开互动。比如,学生能够通过探索虚拟世界来认识太阳系、学习历史事件以及人体内部结构等内容。此外,学校将获得免费资源以促进这一技术的市场推广。目前,该机构已经实施了超过一百场的“虚拟实地考察”活动。依据高盛发布的AR/VR研究报告,预计VR/AR直播市场的年销售额在2020年将达到3亿美元,并在2025年增至7亿美元。
军队能够借助增强现实手段,辨别方向,并获取包括实时位置在内的关键地理信息等军事资料。
参观者得以通过增强现实技术获取文化古迹的相关信息,不仅能够借助头戴式显示器(HMD)阅读古迹的文字介绍,还能够观察到遗址缺失部分的虚拟复原。
头盔式显示器向用户展示各类辅助信息,涵盖虚拟仪表盘、维修对象的内部构造以及相关零件的图纸等。
该系统依托增强现实及人脸追踪技术,在通话过程中,于通话者面容上实时叠加诸如帽子、眼镜等虚拟物品,极大地增强了视频对话的娱乐性。
通过应用增强现实技术,在体育比赛的直播过程中,能够即时将辅助信息嵌入到画面里,从而让观众获得更为丰富的信息内容。
虚拟现实技术在直播行业中扮演了关键角色,广泛应用于体育赛事直播、音乐节直播以及全球性会议直播等多个领域。2015年,我们见证了NBA新赛季的首场比赛以及美国民主党总统竞选辩论的盛况。在国内,2016年4月30日至5月2日,强氧科技便以VR直播的形式呈现了草莓音乐节的精彩瞬间。然而,目前VR直播设备的高昂价格仍然是进入这一领域的重大障碍。
依据高盛发布的AR/VR市场分析报告,预计到2020年,VR/AR直播的年度销售额将达7.5亿美元,而到2025年,这一数字预计将增至41亿美元。
这类游戏使来自世界各地的玩家得以共同踏入一个逼真的自然环境,通过扮演虚拟角色,以网络对战的方式进行互动。
在浏览和参观过程中,人们得以借助增强现实技术,获取途径建筑的相关信息,并查阅展品的相关数据资料。
利用增强现实技术,将规划成效与实际场景相结合,以便直观地感受规划的实际效果。