Skip to content

Latest commit

 

History

History
67 lines (34 loc) · 5.64 KB

learning-machine-learning-quora.md

File metadata and controls

67 lines (34 loc) · 5.64 KB

Quora 上关于‘如何学习机器学习’的最佳建议

原文:www.kdnuggets.com/2015/10/learning-machine-learning-quora.html/2

有趣的建议

这里是一些来自我们顾问的有趣且不常听到的建议的合集。

Xavier 的建议

我推荐的下一步是这样的。找一本好的机器学习书籍(我的列表如下),阅读前几章的介绍,然后跳到包含你感兴趣的算法的章节。一旦找到那个算法,深入了解所有细节,尤其是实施它。在之前的在线课程中,你可能已经在 Octave 中实现了一些算法。但这里我说的是在“真实”编程语言中从头实现一个算法。你可以从一个简单的算法开始,比如 L2 正则化的逻辑回归或 k-means,但你也应该推动自己实现更有趣的算法,比如 LDA(潜在狄利克雷分配)或 SVM。

Raviteja 的建议

获取 scikit-learn 或你选择的编程语言中的相应框架。运行上述书中的每一章的算法。Scikit 的优势在于它也提供了一些示例数据供测试。

掌握统计学(学术学科)和概率。Quora 或 Kaggle 练习等社区将帮助你跟上进度。你还可以参考这本书《统计学习的要素》。我没见过有人对这本书感到失望。虽然有点数学,但大部分是自我解释的。

Sean 的建议

在众多语言和技术中,容易迷失方向,它们使我们能够在真实世界数据上进行机器学习实践。它们允许我们执行想法并构建模型。当它们集成到实际应用中时,它们生成具有学习能力的软件,将高维问题浓缩为聚焦的结果。但语言和技术是不断更替的。对 R 或 Python 非常精通可能会让你更快地构建模型或更好地将其集成到软件中,但这并不能说明你选择正确模型的能力,或构建一个真正应对挑战的模型的能力。做得好的机器学习艺术来自于洞察算法中的核心概念及其与尝试解决的痛点的重叠。优秀的从业者在触碰键盘之前就开始看到有趣的重叠点。

额外金句(TM)

在他的回答中,Sean 提到 www.datascienceontology.com,这是一个名副其实的网站。网站有顶级分类,如学习算法、数据库、数据清理和语言,提供了广泛且深入的数据科学术语本体,并解释了这些术语,并附有相关资源的链接。

Xavier 指出,机器学习涉及广度深度,平衡两者的学习很重要。他建议了解最重要算法的基础,但也要尽可能学习尽可能多的低级细节。Xavier 还链接到他的回答‘最重要的 10 种数据挖掘或机器学习算法是什么?’以帮助强调学习最重要算法的观点,这个问题线程本身也是一个有用的资源。

Sean 还提到要“像研究者一样思考”,因为攻读博士学位训练学生在高级研究领域的学科能力。博士学位持有者能够自信地声明他们解决了一个原创问题,并向领域内的其他人辩护这一解决方案。根据 Sean 的说法,非博士可以通过体现这种“研究思维”的心态来模仿博士的机器学习方法。

为了平衡 Sean 对研究重要性的观点,Raviteja 强调实践。他正当地指出,如果在实现模型时不能做出明智的算法选择,那么世界上所有的理论都是无用的。他建议使用 scikit-learn(虽然 R 也可以)并获得解决问题、选择合适算法以及构建有目的模型的实际经验。

个人简介: Matthew Mayo 是一名计算机科学研究生,目前正在撰写关于并行化机器学习算法的论文。他还是一名数据挖掘学生、数据爱好者以及一名有抱负的机器学习科学家。

相关内容:

  • 5 步实际学习数据科学

  • 60+本大数据、数据科学、数据挖掘、机器学习、Python、R 等领域的免费书籍

  • 前 20 个 Python 机器学习开源项目


我们的前三个课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业道路。

2. Google 数据分析专业证书 - 提升你的数据分析技能

3. Google IT 支持专业证书 - 支持你所在组织的 IT


更多相关主题