BusQuery-公交宝典 » Blog Archive » 图像识别模块细分

图像识别模块细分

话说当前,图像识别是热门技术,有很多场合要用到。列举一二如下:
1,网上搜索,我要搜索所有“关咏荷”的图片或者我要搜索所有包含一张桌子的图片,搜索引擎如何在照片中发现关咏荷或一张桌子?
2,工业应用,流水线上,我要在所有的物件上贴一个标签,但流水线上的物体在运动过程中可能没有那么固定,位置有旋转,如何让标签贴到正确的位置?可以用图像识别技术,在贴标签之前旋转物件直到图像识别软件认为角度正确为止。
3,警察查人,可以用火车站的摄像头识别每位进站人员,把亿们的脸与通辑犯的脸进行对比,反化妆。
4,网络反黄,现在黄色图片无所不在,许多门户网站都是毒源生产地,如果开发出一款软件能自动识别黄色图片,从而不矛显示,则对于青少年的健康成长很有好处。

总之,这个技术是很有前途的。哪个公司先攻克这些技术,谁就能发大财。我对这些技术有些初步的设想,把它写了下来,希望能给将来作点参考。不过,估计这辈子也用不上了。除非我解决了衣食住行问题,可以没有生活压力地编程。

首先是这个领域的模块细分,然后,设想其中一些较易市场化的部分。

1,色彩分析组,可以分析出是否黄色图片,因为黄色图片包含更多的皮肤色彩.皮肤的色彩随拍照环境和相机的因素有不同,但毕竟在一定的范围内.进一步处理,可以分辨是否是风景摄影,是否是卡通图案,卡通图案和真实照片在色彩的表现上肯定不同.
2,形状分析组,每种物体都有不同的形状,首先得勾勒轮廓.然后要模糊计算,从而得出画面里有一个人,一张桌子等的结论.如果形状严格固定,如流水线上对操作对象的识别,可以比较标准图象和摄得图像进而调整物体的位置和角度,进行准确操作.
3,关键点分析组,每个人的脸看起来都很象,但毕竟有不同,如何在众多的图片中查找某个人,也许可以用关键点来分析,如每个人的两眼之间的距离,五官轮廓都不一样,两眼和脸面的对比度是很强的,所以人眼是很容易识别的.
4,三维分析组和动态跟踪, 这一组是针对移动的图像来说的,捕捉屏幕上的改变的部分,则可知一个动态的物体的存在,如果是一辆车,随着车的移动,车在屏幕上的形状也在变化,有可能依据车的这些图像计算出车的三维形状来.这里有另一个小分支,针对屏幕上的动态部分,把它设定在拍摄的中心,这就是动态跟踪.
5,测试等级准备组.这一组负责准备各组阶段测试用图片,凭感觉易识别的图片放在前阶段. 图片要依据各组侧重点的不同选取.

附,每一组都会依据一些基本的图像算法,如增大对比度,取轮廓,直方图分析等等.但每一组的侧重点不同,对这些算法的精确性有不同的要求,先期可以不考虑cpu速度,用开源的一些库,只要保证判断结果的正确性. 后期每一组在完成自身功能的前提下,还要对算法进行优化和加速,舍弃一些精确算法,也许会有一些误判也行,要求是速度快,适于在嵌入式产品上应用.前期获利也许还是在嵌入式的版本上.因为一些工业应用的需要.

随时都会有一些想法, 在后面补充.

百度图像搜索依据的是网页上的文字,找某个人,则出现众多相似图片,其实如果能搜索出图像中的人的话则多好啊.刘若英的脸,为什么人眼一下子就能分辨出来,不管她怎么化妆戴不戴墨镜?电脑不能做到吗?
如果在火车站飞机场安装摄像头,嵌入的软件能够把在逃嫌犯的肖像和进站人员进行快速比对,不是能够随时抓捕嫌犯吗?
进一步联想,未来的机器人都安装上机器视觉,它能识别不同的人和物体.它们的机器智能不断提高(因为全球有许多程序员在把思维程序化),而它们的运算速度和储存量都远超于人,最终,人们什么都不用做,因为机器人不知疲倦不会受伤,可以自动行走,操作流水线,还包括做家务.人类只要学习怎么给机器人编程序就行了.
有这么多的入口,单个人力是无法做好它的,单个人如果开始的话,可以从这样的编程练习开始:一张jpeg格式的照片,把它缩小后,程序还能识别它们是同一张图片.
我感觉这里面都有个模糊匹配的意思,不知道”混沌学”和”模糊学”是干什么的,对这个算法有没有指导意义.

Leave a Reply