原文:
www.kdnuggets.com/2021/12/three-r-libraries-every-data-scientist-know-even-python.html
作者 Terence Shin,数据科学家 | 硕士分析与 MBA 学生
图片由 Denis Pavlovic 提供,来自 Unsplash
1. 谷歌网络安全证书 - 快速进入网络安全职业的捷径。
2. 谷歌数据分析专业证书 - 提升你的数据分析能力
3. 谷歌 IT 支持专业证书 - 支持你的组织 IT
长时间以来,我对使用 R 持反对态度,仅仅因为它不是 Python。
但在过去几个月玩弄 R 后,我意识到 R 在多个使用案例中优于 Python,特别是在统计分析方面。此外,R 拥有一些由全球最大的科技公司开发的强大包,而这些不在 Python 中!
因此,在这篇文章中,我想探讨三个我强烈****推荐你花时间学习并装备在你的工具库中的 R 包,因为它们确实是非常强大的工具。
不再赘述,这里是每个数据科学家都应该了解的三种 R 包,即使你只使用 Python:
-
因果影响与谷歌
-
Robyn 与 Facebook
-
使用 Twitter 进行异常检测
假设你的公司为超级碗推出了一个新的电视广告,并想查看它对转化率的影响。因果影响分析尝试预测如果活动从未发生,会发生什么——这被称为反事实。
图片由作者创建
举个实际的例子,因果影响分析尝试预测反事实,即顶部图表中的蓝色虚线,然后将实际值与反事实进行比较,以估算差异。
因果影响对市场营销活动、扩展到新区域、测试新产品功能等非常有用!
营销组合建模是一种现代技术,用于估计多个营销渠道或活动对目标变量(如转化率或销售)的影响。
营销组合模型 (MMMs) 非常受欢迎,超过了归因模型,因为它们允许您衡量电视、广告牌和广播等无法直接量化的渠道的影响。
通常,营销组合模型从零开始构建需要几个月的时间。但 Facebook 创建了一个名为 Robyn 的新 R 包,可以在几分钟内创建一个强大的 MMM。
作者创作的图像
使用 Robyn,您不仅可以评估每个营销渠道的效果,还可以优化您的营销预算!
异常检测,也称为离群点分析,是一种识别与其他数据点显著不同的数据点的方法。
一般异常检测的一个子集是时间序列数据中的异常检测,这是一种独特的问题,因为您还需要考虑数据的趋势和季节性。
作者创作的图像
Twitter 通过创建一个异常检测包来解决这个问题,包内的算法能够自动完成所有工作。它是一种复杂的算法,能够识别全球和局部的异常情况。除了时间序列外,它还可以用于检测值向量中的异常。
感谢阅读!
如果您喜欢这篇文章,请务必在这里订阅以及订阅我的独家通讯,以确保不会错过关于数据科学指南、技巧和窍门、生活经验等更多文章!
不确定接下来读什么?我为您挑选了另一篇文章:2021 年十大最佳数据可视化
以及另一篇:2022 年你应该知道的所有机器学习算法
Terence Shin
-
如果您喜欢这篇文章,请订阅我的 Medium以获取独家内容!
-
同样,您还可以在 Medium 上关注我
-
关注我在LinkedIn上的其他内容
个人简介: Terence Shin 是一位数据爱好者,拥有 3 年以上的 SQL 经验和 2 年以上的 Python 经验,同时也是《Towards Data Science》和《KDnuggets》的博客作者。
原文。经授权转载。