#《终极算法》
2021-09-22

如果所有两个因素组合的预测都失败了,你可以尝试任意个数因素的组合,机器学习者和心理学家称之为“合取概念”。字典对词的定义就属于合取概念:椅子是有靠背、若干条腿的坐具。把任意一个描述去掉,就不再是椅子……

2021-09-11

亚里士多德说过:在知识的领域,没有什么东西不是首先凭借感觉来形成的。莱布尼茨又加了一句,“除了知识本身”。

2021-09-07

理性主义者认为,感官会欺骗人,而逻辑推理是通往知识的唯一可靠的道路。经验主义者认为所有推理都是不可靠的,知识必须来源于观察及实验。

理性主义者喜欢在迈出第一步前,就提前规划好一切。经验主义者喜欢尝试新事物,然后看看结果会怎样。

2021-09-05

在机器学习领域存在不同思想的学派,主要学派包括符号学派、联结学派进化学派、贝叶斯学派、类推学派。

对于符号学派来说,所有的信息都可以简化为操作符号,就像数学家那样,为了解方程,会用其他表达式来代替本来的表达式。

对于联结学派来说,学习就是大脑所做的事情,因此我们要做的就是对大脑进行逆向演绎。大脑通过调整神经元之间连接的强度来进行学习,关键问题是找到哪些连接导致了误差,以及如何纠正这些误差。

进化学派认为,所有形式的学习都源于自然选择。如果目然选择造就我们,那么它就可以造就一切,我们要做的,就是在计算机上对它进行模仿。进化主义解决的关键间题是学习结构。

贝叶斯学派最关注的问题是不确定性。所有掌握的知识都有确定性,而且学习知识的过程也是一种不确定的推理形式。那问颙就变成,在不破坏信息的情况下,如何处理嘈杂、不完整甚至自相矛盾的信息。

对于类推学派来说,学习的关键就是要在不同场景中认识到相似性,然后由此推导出其他相似性。如果两个病人有相似的症状,那么也许他们患有相同的疾病。问题的关键是,如何判断两个事物的相似程度。

每个学派对其中心问题的解决方法都是一个辉煌、来之不易的进步,但真正的终极算法应该把5个学派的5个问题都解决,就不是只解决一个。

2021-09-04

控制好数据,控制好算法掌握的模型的所有权,这就是21世纪战争的内容,这些战争可能会发生在政府、企业、工会以及个人之间。为了共同利益,你也有道德义务来分享数据。只依靠机器学习不能治愈癌症,依靠癌症病人却可以做到这一点,方法就是为了将来的病人,分享自己的信息。

一个反对机器学习的观点与以上观点相关,就是我们常听到的--“数据无法代替人类的直觉”。实际上,这句话可以反过来:人类直觉无法代替数据。直觉就是你在不知道事实的情况下依靠的东西,而因为你不常用它,所以直觉非常宝贵。但如果证据摆在你面前,为什么还要拒绝证据?

2021-09-03

在计算机科学中, P 和 NP 是两类最重要的问题。如果我们能有效解决它,那么这个问题就属于 P :如果我们能有效找到其解决方案,那么这个问题属于 NP 。

著名的 P = NP 的问题就是,能有效找到的问题是否可以得到有效解决。因为 NP 完全问题,回答这个问题需要的只是证明某个 NP 完全问题可被有效解决(或者无法被有效解决)。

那么,这就是本书的中心假设:

所有知识,无论是过去的、现在的还是未来的,都有可能通过单个通用学习算法来从数据中获得。

我将该学习算法称为“终极算法”。如果这种算法成为可能,它的发明将成为人类最伟大的科学成就之一。

一场艰苦卓绝的斗争:你拥有的只是100人的样本和每个人的十几个测量值,你能模拟的也只是某个规模很有限的现象,甚至这个现象可能不是孤立存在的,还受到其他现象的影响,这就意味你仍然没有彻底了解它。

每个算法都会有输入和输出:数据输入计算机,算法会利用数据完成接下来的事,然后结果就出来了。机器学习则颠倒了这个顺序:输入数据和想要的结果,输出的则是算法,即把数据转换成结果的算法。


桂ICP备11003301号-1 公安备案号:45040302000027 Copyright @ 2021- 2022 By Sun zi chao

阅读统计: 1.93W 文章数量: 76 运行天数: 416天 返回cmnsoft