机器学习是当今的时髦词。它的应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。随着电脑在围棋等游戏中击败了专业人士,许多人开始质疑电脑是否也能让司机、甚至医生变得更好。
许多最先进的机器学习模型在功能上都是黑盒,因为几乎不可能对其内部工作原理有任何感觉。这给我们带来了一个信任的问题:我是否相信模型中的某个预测是正确的?或者我是否相信模型总体上做出了合理的预测?虽然围棋的赌注很低,但如果一台电脑取代了我的医生,或者决定我是否恐怖主义嫌疑人(有兴趣的人吗?)或许更常见的情况是,如果一家公司正在用基于机器学习的系统替换某些系统,它必须相信机器学习模型将表现得相当好。
从直觉上看,解释单个预测背后的基本原理,将使我们更容易信任或不信任预测,或整个分类器。即使我们不能理解模型在所有情况下的行为,也有可能(实际上在大多数情况下)理解它在特定情况下的行为。
最后,我要说的是准确性。如果您有机器学习的经验,我敢打赌您一定会这样想:“我当然知道我的模型在现实世界中会表现得很好,我的交叉验证准确度真的很高!”为什么我要去理解它的预测呢? 99%的时候我都知道它是对的。
任何在现实世界中(不仅仅是在静态数据集中)使用过机器学习的人都可以证明,交叉验证的准确性可能非常具有误导性。有时,不应该是可用的数据会意外地泄漏到培训数据中。
有时候,您收集数据的方式引入了现实世界中不存在的相关性,而这正是模型所利用的。许多其他棘手的问题可以让我们错误地理解性能,甚至在做a /B测试时也是如此。我不是说您不应该测量准确性,只是说它不应该是您评估信任的唯一标准。
机器学习是门复杂的多领域交叉学科,如果想要深入了解机器学习,还需多浏览书籍,以及在实战中进行学习。
想了解更多IT资讯,请访问中培教育官网:中培教育