logo头像
Snippet 博客主题

【面经】数据分析师

必备技能

SQL

核心技能需要熟练掌握,建议刷刷leetcode中相关题目 https://leetcode-cn.com/problemset/database

知识点:
关联查询(各种join)
聚合分析(group by)
分组分析(partition by)
窗口函数

数据仓库

离线
Hive基本概念
分层设计理念:https://cloud.tencent.com/developer/article/1396891

实时
了解即可
Flink + Clickhouse:https://developer.aliyun.com/article/776070
https://clickhouse.tech/

Python

jupyter notebook是一个交互式的python执行环境,对于某些复杂场景可能写sql会比较复杂或者可能实现不了,这时大概率需要写些python代码。
https://jupyter.org/

数据可视化
plotly是python的一个可视化包,可用其快速渲染出饼图、直方图等

https://plotly.com/python/

BI工具

日常工作中需要制作各种指标看板来判断业务发展是否符合预期,比如对于一个电商公司来说需要关心公司每天的订单量以及交易总额(GMV),一旦当核心指标出现波动可能就需要进行分析归因。制作看板需要借助BI分析工具,如:tableau、PowerBI、SAS等。

参考文档:https://zhuanlan.zhihu.com/p/42785003

算法知识

聚类分析

  1. K-means
  2. Dbscan

关联分析

  1. Apriori
  2. fp-growth

业务知识

行业术语

ab测试
灰度
转化漏斗
日活、留存、GMV

行业介绍

数据分析师往往需要借助数据来暴露问题,如果对于行业没有足够的理解可能很难抓住问题的根本。推荐几本介绍行业的数据:
1.《风控要略》
2.《计算广告》