本篇文章4800字,读完约12分钟

眼动仪作为心理学基础研究中的重要工具,用于记录人们处理视觉信息时的眼动轨迹特征,广泛应用于注意力、视觉感知、阅读等领域的研究。

早在19世纪,人们就通过观察人的眼球运动来观察人的心理活动。20世纪60年代以来,随着相机技术、红外技术和微电子技术的快速发展,特别是计算机技术的应用,高精度眼球运动仪的研发得到了推动,眼球运动研究在人机交互中的应用也得到了极大的推动。

眼球运动分析有着悠久的历史,目前的研究越来越热门

眼球运动分析是一种基于眼球运动的跟踪技术。一般来说,它是知道人们观看物体的位置,也就是一种凝视检测技术。从1879年开始,一些人开始关注人们阅读时的眼球运动模式,通过长期的实践和反复观察,他们可以发现人们是如何阅读以及如何吸收阅读信息的。这是一段很长的历史,已经有一百多年了。

当人类刚刚将眼动分析技术总结为一门完整的学科并有意识地对其进行研究时,它已经进入了20世纪。

起初,眼动分析领域的先驱们也走了许多弯路。首先,他们在主体上安装了一个叫做反射键的硬件。肉眼观察是人眼观察事物的旋转模式,但这是一种相对低效的模式,因为即使在正常光线环境下,人眼的旋转速度也非常快,我们无法准确捕捉到人眼的旋转轨迹。

后来,一些实验者采用了类似于将线圈植入眼睛的侵入式方法,通过观察线圈的旋转轨迹来观察人眼的旋转模式,这对于实验参与者来说也是非常不舒服的。

随后,眼动分析领域慢慢过渡到使用非侵入性眼动仪器来观察人眼的旋转。顾名思义,无创眼动分析仪利用外部眼睛发出的不可见光扫描人眼瞳孔,这样参与者就不会感到受到干扰,大大减轻了受试者的不适。这是目前眼动分析的主流实验方法。

从肉眼到线圈,现在到红外线。眼动分析的手段一直在改进和优化。相对于不准确的肉眼观察和对受试者眼球有健康影响的线圈,用于眼球运动分析的红外跟踪技术相对准确和安全。

众所周知,眼球含有较多的液体,并强烈吸收红外线,所以一定强度的红外线在直接照射眼睛时会导致白内障。然而,白内障与短波红外线的作用有关。波长大于1.5微米的红外线不会导致白内障。眼动分析技术中使用的红外波长,包括气心一危,都控制在安全范围内,并通过了安全认证。用户正常使用不会对眼球造成伤害。

现代眼动仪的结构一般包括四个系统:1 .光学系统,2。瞳孔中心坐标提取系统。视觉场景和瞳孔坐标叠加系统。图像和数据记录与分析系统。眼睛运动有三种基本方式:凝视、扫视和后续运动。

眼球运动可以反映视觉信息的选择方式,这对于揭示人眼如何观察事物具有重要意义。根据研究报告,眼动仪在心理学研究中常用的数据或参数主要包括:注视点轨迹、眼球运动时间、平均速度时间和扫视方向的距离、瞳孔大小(面积或直径、单位像素)和眨眼。

目前,瞳孔角膜反射法在眼球运动分析领域很流行,它在眼睛上形成两个光点,并根据光点和瞳孔之间的相对位置来推断使用者的视角。

眼球运动分析给用户带来了新的人机交互体验

事实上,通常看似常见的人机交互是一项意义深远的研究。一般来说,人机交互是用户和机器硬件之间的一种交互和操作。具体来说,人机交互有两种:一种是用户向机器提交指令,而普通的鼠标、键盘和扫描仪,包括体感棒、体感跟踪器和眼动跟踪器等可以应用于游戏控制台/虚拟现实设备,都属于这种输入设备。另一种是在接收到用户的指令后,机器将处理后的数据和结果输出到图像、声音或触觉中,这些都是人们可以体验和理解的。输出设备主要包括显示器、扬声器等。

即将改变人机交互史的眼动追踪 到底是什么模样?

题外话:现代智能手机的触摸屏是一种具有输入/输出控制的人机交互设备。

今天,我们将主要谈谈第一种人机交互模式,即眼动分析,它起着输入的作用。毫无疑问,眼动分析作为一种处于时代前沿的人机交互模式,天生具有各种独特的优势。

确切地说,眼动跟踪技术应用于人机交互领域,它的学名是眼动交互和眼神交流。目前,以奇鑫益威为代表的眼动技术公司的眼动分析产品主要分为三大类:眼动通讯辅助工具、眼动跟踪模块和眼动仪。

其中,眼睛交流辅助工具是专门为手和脚操作电脑有困难的人开发的,当然,它们也包括逐渐冻僵的人。

就在不久前,互联网上出现了一波冰桶挑战。其中,当挑战者将所有冰水从头顶流至全身时,他可以短暂地体验到,作为一个冻僵的人,他无法自由地控制全身运动的痛苦。

除了患有眼外伤的残疾人之外,功能强大的眼部交流辅助设备可以帮助这些手脚不便的人像普通人一样通过控制眼睛从互联网中受益。

眼球运动交互的主要优点是它不需要其他外围设备的帮助。毕竟,像鼠标、键盘和体感追踪这样的输入设备仍然严重依赖于人类的运动器官(手和身体),而眼睛交流辅助工具受到解放运动的限制。

眼睛通信辅助工具直接捕捉用户眼睛观看计算机屏幕的位置信息,然后快速做出反应,例如操作当前光标。

它的第二个优点是基于非干涉控制,不会对周围的人产生任何实质性的影响。我们可以想象一个共同的场景:在办公室里使用语音或体感棒控制设备,语音控制命令或挥动体感棒的轨迹很容易影响周围的人,而且看起来会很滑稽。但是,使用眼控设备进行输入不会产生干扰环境的噪音,而且会变得更加私密,别人无法获得您当前的输入内容,因此它也可以作为输入密码的一种方式,而其他输入方法在安全性方面无法取代眼动输入。

即将改变人机交互史的眼动追踪 到底是什么模样?

只有把合适的技术应用到合适的领域,技术的最大优势才能发挥出来。例如,亚马逊的智能家居语音控制产品amazon alexa也是一款语音控制设备,它与siri、contana和其他智能语音助手产品没有什么不同,只是亚马逊将alexa应用于一个非常合适的场景:家居。首先,作为一个非常隐私的空,用户向alexa发送指令就像在家聊天一样,即使家里有多个成员,也不会有尴尬;其次,用户以一种接近对话的方式控制alexa,就像和管家说话一样,没有任何不服从的感觉。

即将改变人机交互史的眼动追踪 到底是什么模样?

从这个角度来看,眼动分析技术有着广泛的应用,除了周围光线的高亮度或用户的强烈晃动。齐新一伟的眼球运动分析是基于瞳孔角膜反射法。光源主要来自红外光,几乎不受黑暗的影响,只有在极强的阳光下才会受到干扰。

眼球运动分析研究人员将评估与不同产品相对应的不同且最合适的眼球运动分析技术解决方案。例如,百度和腾讯的用户体验研究机构都有眼球运动跟踪设备。当他们开发新网站或新产品时,研究人员可以详细分析用户体验这些产品的过程,以及产品实现中的缺陷。这是将眼球运动分析应用于用户体验优化领域的一次成功尝试。

即将改变人机交互史的眼动追踪 到底是什么模样?

在结合其他技术方面,三星的note 7采用了非常成熟的虹膜识别方案。与指纹一样,它用于确认用户的唯一性。虹膜识别技术可以与眼球运动分析相结合,将身份识别和输入控制集成在一个模块中,为眼球运动分析用户提供更安全的隐私保护。

眼球运动分析有助于虚拟现实创造更好的操作体验

作为一个由计算机模拟的虚拟三维世界,虚拟现实为用户创造了一个接近第二真实世界的模拟世界。因此,当前虚拟现实技术面临的问题是解决用户在使用时面临的各种眩晕和不适。

使用虚拟现实时的不适主要由两个因素造成。第一个是因为屏幕刷新率不够,导致画面呆滞;第二是因为普通的vr产品很容易使佩戴者的脖子感到疲劳。

让我们谈谈第一个因素。拥有出色的虚拟现实体验实际上需要复杂的处理流程。一般来说,有以下步骤:传感器采集,传输,游戏引擎处理,驱动硬件渲染图像,和液晶像素颜色切换。

最后,它被输出到人眼的图像中,其中的每一步都会产生延迟。因此,所有vr产品必须支持三个关键参数:20毫秒延迟、75hz以上的图像刷新率和1k以上的陀螺仪刷新率。

目前,主流显示屏的刷新率为60赫兹,这意味着每秒产生60帧。但是,对于虚拟现实或者专业的电子竞技玩家来说,60 Hz的刷新率仍然不够,市场上一些高端产品的刷新率已经达到了120 Hz。

所谓延迟感是指头部运动与虚拟现实设备的视觉感知之间的匹配程度。根据研究,人体头部运动和视野恢复的延迟必须小于20毫秒,否则会产生视觉阻力感,导致强烈的眩晕。

由于vr需要同时渲染两幅图片,即使gpu输出的图片是4k,输出给肉眼的分辨率也只有1080p。如果你想让每只眼睛都体验2k级的图像,那么gpu需要提供至少5k级的图像输出能力。现在gpu渲染日常系统运行的5k图片不成问题,但是渲染游戏的5k图片非常困难。

目前,gpu的性能一般基于行业中三角形填充率的量化标准,并根据市场上主流入门级vr GPUs采用的malit760mp4性能进行计算。在28纳米hpm制造工艺下,工作频率为600mhz,输出速率超过每秒3亿个三角形,像素填充速率为每秒2.6g。因此,gpu的性能必须达到每秒300米,即3亿个三角形的输出速率,才能满足入门级vr产品的要求。所有gpu三角输出速率低于13.9亿的芯片,无论cpu是四核还是八核配置,都不符合入门级vr产品的行业标准,也无法支持主流的中级vr市场。

即将改变人机交互史的眼动追踪 到底是什么模样?

可以看出,无论我们想要追求更高的刷新率、更高的分辨率还是更低的延迟,每一项要求都会增加硬件计算性能的计算负担。对于移动设备来说,计算能力的缺乏更加明显。现在,大多数具有良好经验的虚拟现实设备必须依靠具有强大计算能力的主机。随着无线传输技术的不断进步,5ghz传输已经普及,60ghz传输已经上路。虽然我们暂时还不能完全摆脱沉重的主机,但至少我们可以戴上无线连接的虚拟现实头显示器,在家里自由行动。

即将改变人机交互史的眼动追踪 到底是什么模样?

目前,虚拟现实行业有很多厂商在大力推广中提高了图形计算能力,优化了相关软件和算法。启信益威的合作伙伴包括全球最著名的制造商:htb、高通、英伟达等。,共同推动眼动分析在虚拟现实领域的应用和发展。

第二个因素源于虚拟现实的运行模式。在没有眼睛跟踪的虚拟现实环境中,用户必须首先锁定目标,然后通过动作(转弯和行走)使虚拟现实设备的陀螺仪、加速器等设备产生感应,从而驱动画面转换。

然而,这种方法的缺点是,在现实生活中,我们的眼球可以旋转一定的角度。在大多数情况下,我们不需要一直转动头来观察图片。你可以通过转动眼球快速锁定目标。因此,在vr头部显示中,用户头部的频繁旋转会带来额外的锻炼,进而导致疲劳。

眼睛跟踪技术已经解决了上述问题。有了带有眼睛跟踪技术的虚拟现实头部显示器,屏幕上的真实景象可以位于整个屏幕上的任何位置,而不是总是面对屏幕的中心。另一点,奇鑫益伟的眼球跟踪技术采用了注射点渲染技术,可以使用户关注的焦点画面清晰,叙事区域被模糊画面所替代,符合人类看事物的特点。

例如,让我们举个例子:伸出你的拇指,在离你鼻子大约10厘米的位置观察它。当你用肉眼看到指甲盖时,它可能是一个中央凹入的视野,周围的东西对当前的观察者来说是模糊的。对于机器来说,你不需要投入100%的计算能力来渲染整个清晰的画面,这可以大大减轻图形处理器的计算负担。

“奇新一威”等眼动跟踪产品的刷新率为120赫兹,即每秒钟发出120个注视点,延迟将减少到15纳秒左右,这与工程师的优化和软硬件的完美结合是分不开的。

眼动跟踪是一种相对较新的人机交互技术,通用制造商提供了一套完整的模块解决方案,这是一种嵌入式和成型的解决方案。通过物理耦合相应的模块并与相应的软件控制模块协作,这意味着该产品具有眼睛跟踪解决方案,用户可以直接使用它。

眼动跟踪需要进一步减少延迟和控制模块的功耗,并进一步与图形处理器制造商和虚拟现实硬件/软件开发商合作,通过深度学习优化在不同场景中用肉眼渲染虚拟现实图像的计算,同时减轻图形处理器和中央处理器的负担。

作为一项很有可能颠覆当前以鼠标和键盘操作为主流的人机交互模式的技术,眼动分析具有明显的优势:私密性、不受环境光的明显影响、可访问性、对虚拟现实技术的自然适应性等。,这向我们展示了未来人机交互的可观前景。虽然眼睛跟踪仍然存在一些问题,如高成本和延迟需要进一步降低,但我们仍然可以对这项未来技术保持足够的信心。

来源:搜狐微门户

标题:即将改变人机交互史的眼动追踪 到底是什么模样?

地址:http://www.shwmhw.com/shxw/55382.html