时常有一种体验,事先沒想到那个点上,就看不懂别人的文章和道理!这个点集焦了思想的内涵,所以看书,我感觉是从内驱力出发的。
先放一个论断吧,机器视觉外观缺陷检测是人工智能的恶梦,比如包括工业生产丶医疗影像行业,那些急于反驳的人,可能是被眼花撩乱的繁荣应用景象迷失了,他的证据都是雾霾下的花....,无论工业视觉,还是医疗影像,要做很精细的缺陷检测,都需要连续的变形理论支持,有些人感觉人眼还是容易区分的,视觉仍然很难,其实涉及的理论问题,是他浑然不知的存在或者根本就沒有想过,这对任何人都是真的。
可以这么类比下,眼睛对人的重要性与机器视觉对机器的重要性几乎是同等的。也可以这么去想,如果机器视觉外观缺检查简单,医院里很多医生都可以说再见了。这就是很多顶级的人工智能公司(比如lBM)在医疗影像领域的疯狂投资的原因),结局自己去查或等着看吧(在你有生之年)。为什么?
我有一个想法,牛顿(几大定律),爱因斯坦(质能),麦克斯韦(麦方程组),克劳修斯(熵),拉马努金等,在写下他们的公式之前,这些公式的原型已经在脑海中了,所以人类的文明进程是由冥想推动的。所以在我的文章中,我尽量不使用任何一个显眼的公式,如果你不能理解文字后面的思想,一大堆公式过来也白搭,而且人们也应该有这样的体验,真正能把问题解决得放心的是想得深入后再Copy公式的套路。
所以要看清人工智能的前景,多冥思冥思就好了,就象我文章里说过的人们所有的知识只是在比较两件事同还是不同,比如这里把相机成像可以理解为平面的仿射、射影、曲面的变形等,缺陷模型都可以用从最小二乘法(或逼近的思想)开始整起(先就这么粗鲁的去想,实际情况比这复杂),最小二乘法就是真值与逼近值之间的比较,最优传输不也是个比较吗?缺陷可以理解为光滑曲线曲面上的不规范突变,如果应用场景中,物料可以用光滑曲线曲面那怕分段建模也好,那么这个场景要实现缺陷检测很有希望。光滑?那有那么多光滑?就先光滑吧,这样,一个光滑的曲面在相机视场的不同位置被仿射,仿射后图像每个像素点附近的结构是怎样变形的?各种不同的变形,算法需要记住各种变形的映射!这些映射怎么求解呢?要解决这种问题,你将会发现,你需要很深刻的数学背景,说几个词吧,比如矩阵分解、极分解、最优传输映射。上面是光滑静态的情况,如果一个曲面上有噪音(噪声与缺陷强度,形态相当),曲面随时间流逝还在发生某种程度变形,就上面两项,对一般数学家水准已经致命了!我们现实中,很少的光滑,很少的静态...特别是医学影像。你偏要举些实际应用例子来秀,只能说那是冰山一角的极少数。
在使用人工智能之机器学习时,有些专业人士首先甩出一个结论,多层神经网络可以逼近任意复杂函数,各种方法和理论很多,不防来理一理。
1. 梯度下降法(Gradient Descent)
2. 牛顿法和拟牛顿法(Newton's method & Quasi-Newton Methods)
3. 共轭梯度法(Conjugate Gradient)
4. 启发式优化方法
5. 解决约束优化问题——拉格朗日乘数法
6、最优传输映射
7、熵原理在各种约束下概率分布
8 对一个良好的模型,在求解过程中,不动点理论里面的压缩映射原理,不劳威尔不动点,绍德尔不动点,莱夫希茨不动点。
9、对于时变的有噪音模型,各种最优估计方法,比如常见的卡尔曼滤波。
人的价值就在于思考,以上我觉得不是胡说八道,感兴趣可以翻翻我的QQ说说与微信朋友圈,谷歌眼镜、平果siri,自动驾驶,AR/VR,在人们疯狂时,冷水及时的泼出了,人们对科学做出重大贡献有诺贝尔奖,有沒有对止住盲目给个奖呢?你继续在循序渐进中找借口掩饰伤痛吧……