很多同学找Data方向的工作,不知道怎么准备面试、不知道如何刷题、不知道刷到什么程度可以找到工作,本文就Data Analyst/Data Scientist面试求职考点,详细介绍知识点掌握到何种程度可以顺利通过面试!
1. 概率统计
1.1. 描述性统计
· 均值(期望)
· 中位数
· 众数
· 方差(标准差):3 sigma
· 极大/小值
· 数据分布(正态/伯努利/二项/均匀/指数/泊松;偏度与峰度)
· 缺失值
· 异常值
1.2. 假设检验
· 原假设/备择假设
· T检验
· 卡方检验(非参数检验)
· P值
· 置信度
· 置信区间
· A/B Test
1.3. 概率论
· 条件概率(贝叶斯原理)
· 抽样
· 大数定律
· 中心极限定理
· 区间估计/参数估计
· R方
· 方差分析
§ 推荐学习工具:
2. 分析工具
2.1. SQL
· 表的增删改查
· 表连接
· 子查询
· 窗口函数
· SQL语句执行顺序
§ 推荐学习工具:
W3 School: https://www.w3schools.com/sql/default.asp
SQL Zoo:https://sqlzoo.net
§ 推荐刷题工具:
LeetCode - 从Easy到Medium,有时间再Hard,但Hard不必强求(Summary of SQL on LeetCode: https://byrony.github.io/summary-of-sql-questions-on-leetcode.html )
HackerRank - 全部刷完: https://www.hackerrank.com/domains/sql
2.2. Python
· 基本数据结构:列表/字典/字符串/元组/数组/集合
· 基本语句:If条件语句/for循环/while循环
· 基本package:numpy/pandas/sklearn/statsmodel/matplotlib/seaborn
§ 推荐学习工具:
W3 School: https://www.w3schools.com/python/default.asp
RealPython: https://realpython.com
§ 推荐刷题工具:LeetCode - 从Easy到Medium
2.3. Tableau
· 图表类型
· 交互式面板
· 基础的计算函数
2.4. EXCEL
· 基本计算函数
· 数据透视表
· V LOOKUP
3. 算法模型
原理、模型解读、模型评估、使用场景、优缺点、模型优化
· 回归
· 线性回归
· 逻辑回归
· Lasso/Ridge回归
· 分类
· 决策树
· 随机森林
· SVM
· 聚类
· 时间序列模型
§ 推荐刷题工具:LeetCode/Glassdoor真题题库 - 从Easy到Medium
4. Product Sense
4.1. 分析方法
· 漏斗分析
· 拆解分析
· 对比分析
· 留存分析
· 用户分群分析
· 归因分析
· 渠道路径分析
4.2. 指标体系 - AARRR体系
4.2.1. Acquisition(与拉新相关指标)
· 曝光/展现IMPERESSION
· 点击CLICK
· 下载量
· 新注册用户数
· 获客成本(CPM千人展现成本/CPC单次点击成本/CPA单次行动成本)
4.2.2. Activation(与活跃相关指标)
· 活跃用户数(DAU日活用户数/WAU周活用户数/MAU月活用户数)
· 时长指标(用户在线时长/用户登录时长/APP使用时长/视频播放时长)
· 启动次数(冷启动次数/热启动次数)
· 页面浏览量(PV页面浏览量/UV独立访客数)
4.2.3. Retention(与留存相关指标)
· 留存(短期留存:次日、3日、5日、7日 - 反映功能短期留人效果/长期留存:30日、60日 - 反映留存长期稳定性)
· 用户生命周期(LT = 当日留存率+次留率+3留率+…n留率)
4.2.4. Revenue(与变现相关指标)
· 交易类 - 核心在于成交(GMV/成交量/销售收入/ARPU每个用户平均收入/复购率)
· 社区类 - 核心在于打造生成内容的活跃社区(内容生成用户数/内容互动用户数/内容实际收入 - 内容价值)
· 企业类 - 核心在于用户体验(体验用户数/付费用户数/用户生命周期价值LTV)
4.2.5. Refer (与传播相关指标)
· 病毒K因子(邀请率 = 发出邀请数/现有用户数/接受率 = 新注册用户数/发出邀请数/K因子 = 邀请率*接受率)
· 传播周期
§ 推荐学习工具:
Framework - 必看!: https://stellarpeers.com/frameworks/
Product Sense: https://productschool.com
A Collection of Data Science Take Home Challenge: https://datamasked.com
互联网企业模拟面试实例: Decode and Conquer
Cracking the PM Interview - 重点看:Estimation, Product, Case
5. Behavior
5.1. 模板:S(Situation) - T(Task) - A(Action) - R(Result)
5.2. 主题:
(1) Leadership and how to influence others
(2) A hard challenge faced and How to solve it
(3) A true failure and how to turn it around
(4) A proud success made with team together
还在等待什么,赶快收藏起来,逐一攻破备战求职季吧!
Comments