※ 引述《kingx163 (果酱猫)》之铭言:
: 各位版友好
: 小弟刚接触影像辨识没有多久
: 看到目前有yolo, Azure Computer Vision,
: Cloud Vision API等等可以选择
: 请问各位年薪300w大大都用哪一种呢?
: 另外,应该如何判断用哪家的呢?
: 谢谢!
YOLO是model
Azure Computer Vision跟Google Cloud Vision API都是platform
你应该先厘清你的需求,才知道要用何种工具/framework/model
不然就像是问网友出发要搭啥交通工具,却连要去哪里都没说一样
我最近也自学Computer Vision/Machine Learning,可以给你一点建议
有些需求AOI就可以解决,有些用CV效果会更好,有些需要用到ML其良率才能接受
如果刚接触这块,可以先玩一下OpenCV,看一些早期的论文
了解一下以前在做CV时是怎么用GLCM,小波之类的特征去辨识
现在如果不是自己从头写,已经不太会接触到这块了
直接拿现成Model network去使用或train都难度很低
刚好这几天做了个投影片,你可以参考一下,简单展示了CV跟ML可以做的东西
https://goo.gl/SYEvbe (一直按 > 就可以照着flow播了)
据我自学的认知,Machine Learning里,
跟CV比较有关的就是Classification跟Object Recognition
简单来说Classification就是辨识这张图是啥
Object Recognition是认出图内的物体位置与名称,你说的YOLO就是这种
属于R-CNN家族之一,它家族大概是这样:
R-CNN, Fast R-CNN, Faster R-CNN, YOLO, SSD, R-FCN....(最后一个我没试过)
如果只是想做Computer Vision,建议你玩OpenCV
如果要用Machine Learning,我前阵子有写篇很杂的心得在fb社团
https://www.facebook.com/groups/616369245163622/permalink/1204406499693224/
那时候边忙边写,写得很乱也没整理,简单来说是这样
平台: linux/ubuntu最多人用,windows资源比较少
语言: C++/python吃遍天下,其他语言看运气
Framework:Caffe还是最多,tensforflow最近比较热门,Keras似乎也不少人用
Torch有点老了,CNTK微软努力推当中(至少社群回应蛮热情的)
如果你只是想测效果,用OpenCV DNN Moudle去读 Model来测
找到你需要的model再选择要用怎么环境改成production
这样可以少花很多时间在建置环境上
大致上是这样,如果要问怎么建模的话我还没学到那,只会很简单的CNN,就帮不上忙了