原文:
www.kdnuggets.com/2017/04/forrester-gartner-data-science-platforms-machine-learning.html
评论 上个月,领先的分析公司 Forrester 发布了他们的“ Forrester Wave™”:2017 年第一季度预测分析和机器学习解决方案报告,由 Mike Gualtieri 编写。
预测分析和机器学习是现在最重要的技术之一,正如 KDnuggets 读者所知,Forrester 预计 PAML 市场在 2021 年前将实现 15% 的复合年增长率(CAGR)。
报告审查并评估了 14 家公司的战略、当前产品和市场表现。结果汇总在图 1 中。
图 1: Forrester Wave™:预测分析和机器学习解决方案,2017 年第一季度
(来源:Forrester Research, Inc. 未经授权的复制、引用或分发均被禁止)
-
SAS 重新构想其数据科学产品组合 并将其数据科学解决方案整合到 SAS Visual Suite 下。它将世界一流的数据准备、可视化、数据分析、模型构建和模型部署集于一体。
-
IBM 喜爱开源。 SPSS 仍然是 IBM 数据科学平台的核心,但 IBM 还推出了来自 Spark 技术中心的 SystemML,并为数据科学编程者引入了数据科学体验。
-
SAP 将预测模型与业务应用直接连接。 SAP 提供全面的数据科学工具来构建模型,同时也是全球最大的企业应用公司。
-
Angoss 准备好成为你的主要解决方案。 Angoss KnowledgeSEEKER 是数据科学团队必备的工具,它通过美观且全面的可视化工具帮助构建决策和策略树。
-
RapidMiner 将广度和深度融入美丽的包装中。 RapidMiner 大力投资重新设计其视觉界面,使其成为我们在此次评估中见过的最简洁和流畅的界面。
-
KNIME 的充满活力的开源社区提高了生产力。 KNIME 不是大公司,但它拥有一个大社区的贡献者,不断推动平台向前发展,如生物信息学和图像处理等功能。
-
FICO 通过模型使企业决策更智能。 FICO 的广泛实际经验造就了一种解决方案,专注于大型组织中首席数据科学家和普通数据科学家的需求。
-
H2O.ai 将算法放在首位。 H2O.ai 以开发开源、集群分布式机器学习算法而闻名,这些算法早在 2011 年当大数据需求迫切时便已存在。H2O 还提供 Sparkling Water 用于在 Apache Spark 上创建、管理和运行工作流,并提供 Steam 用于部署模型。
-
Microsoft 不仅仅是企业的 R 解决方案。 Microsoft 为希望使用 R 编程语言的 数据科学家 提供 Microsoft R,该语言支持可调用的集群分布式算法。它还为希望使用更传统可视化开发工具的数据科学家提供 Azure Machine Learning。
-
Alpine Data 专注于协作。 Alpine Data 的可视化工具为数据工程师、数据科学家和业务利益相关者提供了分工合作构建模型的能力。
-
Dataiku 实现了代码与点击的完美结合。 Dataiku(名字受到日本俳句的启发)提供的数据科学平台允许编码人员在需要时使用笔记本,但在生产力关键时使用可视化工具来构建工作流。
-
Statistica 又一次找到了新家。 Statistica 成立于 1984 年,最初名为 Statsoft,并于 2014 年被 Dell 收购。现在,它成为了新重启的 Quest Software 的一部分。
-
Domino Data Labs 希望编码人员在开源环境中协作,该解决方案旨在整合最流行的开源编码工具和库,为数据科学编码团队提供统一的界面。
-
Salford Systems 强调准确性和自动化,并因其实施特定方法(如 CART、MARS、Random Forests 和 TreeNet)而受到大大小小客户的喜爱。
我尝试了类似 Gartner 报告 的重叠式比较,但结果图像过于拥挤,难以阅读。所以这里是一些亮点:
-
保持领导者地位:SAS、IBM、SAP
-
从 2015 年的强劲表现者到 2017 年的领导者:RapidMiner、KNIME、Angoss、FICO
-
保持强劲表现者地位:Microsoft(在产品提供上有所提升)、Alpine Data、Statistica/Quest(在战略上有所下降)
-
2017 年的新加入者:Domino Data Labs、Dataiku、H20.ai、Salford Systems
-
2017 年下滑的公司:Alteryx、Predixion Software、Oracle
Forrester 的评估与 Gartner 2017 Magic Quadrant for Data Science Platforms 的比较如何?
Gartner 和 Forrester 使用不同的方法论,但在两种情况下,代表公司距离图表左下角的圆圈越远,表现越好。我们测量了每家公司这一距离,将其标准化,使最大距离为 95,最小距离为 5,并在下图 Figure 2 中绘制。
在 Gartner 或 Forrester 图表中都未出现的公司距离值为负(-1)。
图 2:2017 年 Q1 Gartner 与 Forrester 对数据科学、预测分析和机器学习平台的评估
圆圈的大小对应于估计的供应商规模,颜色为 Forrester 标签,形状(圆圈的填充程度)为 Gartner 标签。
总共涉及 17 家公司:13 家同时出现在两个报告中,3 家仅出现在 Gartner(下文简称 G)中,1 家仅出现在 Forrester(下文简称 F)中。
我们看到几个集群:
-
强劲领导者:SAS、IBM、RapidMiner 和 KNIME 被 G 和 F 都评为领导者。
-
领导者:Angoss、SAP 和 FICO 在 F 中是领导者,但在 G 中仅为利基/远见者。
-
强劲竞争者:H2O.ai、微软和 Statistica/Quest 在 F 中是强劲表现者,在 G 中是远见者/挑战者
-
竞争者:Alpine Data、Domino、Dataiku:F 中的强劲表现者/竞争者,G 中的远见者
-
玩家:Salford Systems、Teradata、Alteryx、MathWorks:只有一个排名
如果您是客户,可以从Forrester获取 Forrester Wave™: 预测分析与机器学习解决方案,Q1 2017,或从SAP、RapidMiner或报告中好评提到的其他公司下载。
相关:
-
Forrester Wave™ 大数据预测分析 2015:赢家与输家
-
Gartner 数据科学平台 – 更深入的分析
-
Gartner 2017 年数据科学平台魔力象限:赢家与输家