自学数据分析,学到什么程度可以找工作
Updated: Sep 12
数据分析本身是一门非常综合的学科,通常在面试准备的过程中也是非常的零散和琐碎,很多求职者不停的就各个方面进行复习准备,但总觉得学不到头,或者不管怎么准备总会不够充分,面试被挂。那么,今天就给大家带来一个最精简版的框架,帮助大家检测自己的学习/面试程度。
【概率统计】
1. 描述性统计
均值(期望)
中位数
众数
方差(标准差):3 sigma
极大/小值
数据分布(正态/伯努利/二项/均匀/指数/泊松;偏度与峰度)
缺失值
异常值
2. 假设检验
原假设/备择假设
T检验
卡方检验(非参数检验)
P值
置信度
置信区间
A/B Test
3. 概率论
条件概率(贝叶斯原理)
抽样
大数定律
中心极限定理
区间估计/参数估计
R方
方差分析
推荐学习工具:
数理统计:
https://www.1point3acres.com/bbs/thread-610533-1-1.html
A/B: https://www.udacity.com/course/ab-testing--ud257
【分析工具】
1. SQL
表的增删改查
表连接
子查询
窗口函数
SQL语句执行顺序
推荐学习工具:
W3 School: https://www.w3schools.com/sql/default.asp
SQL Zoo:https://sqlzoo.net
推荐刷题工具:
LeetCode - 从Easy到Medium,有时间再Hard,但Hard不必强求(Summary of SQL on LeetCode: https://byrony.github.io/summary-of-sql-questions-on-leetcode.html )
HackerRank - 全部刷完: https://www.hackerrank.com/domains/sql
2. Python
基本数据结构:列表/字典/字符串/元组/数组/集合
基本语句:If条件语句/for循环/while循环
基本package:numpy/pandas/sklearn/statsmodel/matplotlib/seaborn
推荐学习工具:
W3 School: https://www.w3schools.com/python/default.asp
RealPython: https://realpython.com
推荐刷题工具:LeetCode - 从Easy到Medium
3. Tableau
图表类型
交互式面板
基础的计算函数
4. EXCEL
基本计算函数
数据透视表
V LOOKUP
【算法模型】
原理、模型解读、模型评估、使用场景、优缺点、模型优化
回归
线性回归
逻辑回归
Lasso/Ridge回归
分类
决策树
随机森林
SVM
聚类
时间序列模型
推荐学习工具:https://github.com/ariafyy/iworkHunter
推荐刷题工具:LeetCode/Glassdoor真题题库 - 从Easy到Medium
【Product Sense】
1.分析方法
漏斗分析
拆解分析
对比分析
留存分析
用户分群分析
归因分析
渠道路径分析
2. 指标体系 - AARRR体系
Acquisition(与拉新相关指标)
曝光/展现IMPERESSION
点击CLICK
下载量
新注册用户数
获客成本(CPM千人展现成本/CPC单次点击成本/CPA单次行动成本)
Activation(与活跃相关指标)
活跃用户数(DAU日活用户数/WAU周活用户数/MAU月活用户数)
时长指标(用户在线时长/用户登录时长/APP使用时长/视频播放时长)
启动次数(冷启动次数/热启动次数)
页面浏览量(PV页面浏览量/UV独立访客数)
Retention(与留存相关指标)
留存(短期留存:次日、3日、5日、7日 - 反映功能短期留人效果/长期留存:30日、60日 - 反映留存长期稳定性)
用户生命周期(LT = 当日留存率+次留率+3留率+…n留率)
Revenue(与变现相关指标)
交易类 - 核心在于成交(GMV/成交量/销售收入/ARPU每个用户平均收入/复购率)
社区类 - 核心在于打造生成内容的活跃社区(内容生成用户数/内容互动用户数/内容实际收入 - 内容价值)
企业类 - 核心在于用户体验(体验用户数/付费用户数/用户生命周期价值LTV)
Refer (与传播相关指标)
病毒K因子(邀请率 = 发出邀请数/现有用户数/接受率 = 新注册用户数/发出邀请数/K因子 = 邀请率*接受率)
传播周期
推荐学习工具:
Framework - 必看!: https://stellarpeers.com/frameworks/
Product Sense: https://productschool.com
A Collection of Data Science Take Home Challenge: https://datamasked.com
互联网企业模拟面试实例: Decode and Conquer: Answers to Product Management Interviews
Cracking the PM Interview - 重点看:Estimation, Product, Case
【Behavior】
模板:
S(Situation) - T(Task) - A(Action) - R(Result)
主题:
(1) Leadership and how to influence others
(2) A hard challenge faced and How to solve it
(3) A true failure and how to turn it around
(4) A proud success made with team together
话不多说,快点开始行动,备战招聘季吧!