我的理解是这样: 原po说的“跑出人类不了解的东西”大概指的是类神经网络的权重值。
通常在类神经网络上我们比较多是在探讨网络的结构,不太会去真的看每一个神经元的权重,顶多会去利用每一层的权重的统计值来加速收敛速度。
对我来说,机器学习是一件自然而然发生在资料上的事情; 它是一个人类看这群资料的角度,或者甚至就是资料本身。
我写的很抽象,是因为其实它就是一个抽象的概念,很多方法都可以达成机器学习,最简单的,大家高中都学过线性回归,它也是一种机器学习。
我们是这样看待线性回归的:
1. 这个资料是线性的
2. 用最小平方法找到一条线代表这群资料
3. 利用这条线,我们可以归类或是预测笔资料 (输入x得到y)
线是我们看待这个资料的方式,也代表了资料本身,所以可以用来预测,大概的逻辑就是这样。
线可以接受的话,接下来我们就可以探讨几件事。
1. 如果y不能对应整个实数域,只能对应到几个有限的整数怎么办?
2. 如果资料不是线性的怎么办?
3. 我们要怎么确保手上的资料可以代表我们要预测的所有资料?
4. 我们要怎么把手上的东西转成可以学的资料?
5. 如果多个算法找到的结果不太一样怎么办? 或是同一个算法到底要用哪一组参数?
这些问题都有很多理论在描述或是想办法解决
不过我觉得实务上最困难的还是取得或是转化资料,而对于机器来说他们也不可能学出脱离资料本身的结果,也没办法做出超过人类定义的动作。
在我们可以找到一个可以喂世界上所有资料的方式,或是可以定义一个很抽象很抽象的动作之前,机器人用永远会是人类的奴隶。