这几天,我想大家都在用支付宝AR扫描“福”字,玩五个福字红包。 那么支付宝AR如何识别你扫描的“福”字呢? 这个科技含量就高很多了,而且采用了最新的技术。 扫描识别,无论是窗花、字迹,还是春联,只要是祝福的,都可以识别。 但问题是,如此神奇的技术背后是如何做到的呢?
下面小编就来说说支付宝扫描识别的科技秘密。 了解计算机的朋友一定知道,计算机是根据二进制原理运行的。 也就是说,无论屏幕上显示什么,后面的计算机接收到的都是一串由0和1组成的数字。 最后经过翻译和解码,形成相应的图像。 因此,如果你想让手机识别它,你扫描的就是“福”字,而不是任何其他文字或场景。 您需要完成以下步骤来完成这个看似简单的识别过程。
第一步是稳定识别动态手机摄像头,因此需要稳定手机并瞄准要识别的区域。 支付宝软件开始在后台执行,对焦、拍摄等简单的初始图像,然后对图像进行简单的对齐和校正操作。
第二步处理后的图像进行“双植”,对复杂的颜色进行分类,分为前景色和背景色。 前景色被定义为黑色,背景信息被定义为白色。 这样做的目的是为了方便计算机识别和判断,并节省带宽和资源。
第三步,对处理后的图片进行修复和去噪,使主体更加清晰。 当一切准备就绪后,程序将开始进行“字符切割”处理。 由于各种拍摄原因,难免会出现一些缺点,包括细致、智能的切割和填充处理。 同时,春联、窗花上“福”字的特殊性和多变性也使得切割具有一定的局限性。 为了解决这个限制,就需要进行下一步的“字符识别”。 ”,优化数据算法、算法、hash(哈希函数)等。
第四步算法是比较常见的算法,但是这里的智能支付宝,为了避免不必要的人力浪费,最好的办法就是根据“福”字来写算法,这样就不用考虑适配了所有汉字结构。 同时,支付宝的最终目标是让用户扫描出“福”字,因此对算法的要求并不是很严格。 这就是为什么,有时你会发现你不必写出正确的“福”字来认它,只要它具有相似的结构即可。
步骤5:当识别出的字符与数据库中的字符基本匹配时,将向支付宝服务器发送反馈指令。 同时,收到指令后会向用户手机发送反馈。 说了这么多,感觉挺麻烦的。 事实上,在执行移动应用程序的时间不到0.5秒。 当您扫描更多时,系统会自动学习和优化。
所以,为了激活猴子模式,支付宝也是煞费苦心,想出了这样的招数。 不过,出于对技术的敬畏,我们不得不承认支付宝确实实现了高效识别图像的能力,无论是对于未来的人工智能识别还是翻译。 文献提供了新的方法和思路。