当我告诉大多数人我是一名数据科学家时,他们既印象深刻又感到困惑。
印象深刻,因为它现在被认为是一个如此奇特且享有盛誉的头衔(尽管有些人仍然会称我们为会编码的统计学家)。
很困惑,因为……数据科学到底意味着什么?我们该怎么办?
嗯,这取决于。
关于领域、公司和团队本身。
但总的来说,数据科学包含以下几类工作:
- 数据库和数据工程– 许多数据科学家与数据库密切合作,无论是加载和查询大量数据、构建数据管道,还是清理和准备数据以进行分析。在我上一家公司,我定期使用 SQL 访问我们的数据库,以查询构建机器学习模型所需的数据。我还发现自己创建和更改表格以存储模型和其他分析的结果。
- 数据分析和可视化– 数据可视化不仅涉及数据分析,还涉及…