• info svip

数据分析自学到什么程度可以找到工作?

很多同学找Data方向的工作,不知道怎么准备面试、不知道如何刷题、不知道刷到什么程度可以找到工作,本文就Data Analyst/Data Scientist面试求职考点,详细介绍知识点掌握到何种程度可以顺利通过面试!


1. 概率统计

1.1. 描述性统计

· 均值(期望)

· 中位数

· 众数

· 方差(标准差):3 sigma

· 极大/小值

· 数据分布(正态/伯努利/二项/均匀/指数/泊松;偏度与峰度)

· 缺失值

· 异常值


1.2. 假设检验

· 原假设/备择假设

· T检验

· 卡方检验(非参数检验)

· P值

· 置信度

· 置信区间

· A/B Test


1.3. 概率论

· 条件概率(贝叶斯原理)

· 抽样

· 大数定律

· 中心极限定理

· 区间估计/参数估计

· R方

· 方差分析


§ 推荐学习工具:

数理统计:https://brilliant.org/

https://www.1point3acres.com/bbs/thread-610533-1-1.html

A/B: https://www.udacity.com/course/ab-testing--ud257


2. 分析工具

2.1. SQL

· 表的增删改查

· 表连接

· 子查询

· 窗口函数

· SQL语句执行顺序


§ 推荐学习工具:

W3 School: https://www.w3schools.com/sql/default.asp

SQL Zoo:https://sqlzoo.net

§ 推荐刷题工具:

LeetCode - 从Easy到Medium,有时间再Hard,但Hard不必强求(Summary of SQL on LeetCode: https://byrony.github.io/summary-of-sql-questions-on-leetcode.html

HackerRank - 全部刷完: https://www.hackerrank.com/domains/sql


2.2. Python

· 基本数据结构:列表/字典/字符串/元组/数组/集合

· 基本语句:If条件语句/for循环/while循环

· 基本package:numpy/pandas/sklearn/statsmodel/matplotlib/seaborn


§ 推荐学习工具:

W3 School: https://www.w3schools.com/python/default.asp

RealPython: https://realpython.com

§ 推荐刷题工具:LeetCode - 从Easy到Medium


2.3. Tableau

· 图表类型

· 交互式面板

· 基础的计算函数


2.4. EXCEL

· 基本计算函数

· 数据透视表

· V LOOKUP


3. 算法模型

原理、模型解读、模型评估、使用场景、优缺点、模型优化

· 回归

· 线性回归

· 逻辑回归

· Lasso/Ridge回归

· 分类

· 决策树

· 随机森林

· SVM

· 聚类

· 时间序列模型


§ 推荐学习工具:https://github.com/ariafyy/iworkHunter

§ 推荐刷题工具:LeetCode/Glassdoor真题题库 - 从Easy到Medium

4. Product Sense

4.1. 分析方法

· 漏斗分析

· 拆解分析

· 对比分析

· 留存分析

· 用户分群分析

· 归因分析

· 渠道路径分析


4.2. 指标体系 - AARRR体系

https://medium.com/@ms.mbalke/aarrr-framework-metrics-that-let-your-startup-sound-like-a-pirate-ship-e91d4082994b

4.2.1. Acquisition(与拉新相关指标)

· 曝光/展现IMPERESSION

· 点击CLICK

· 下载量

· 新注册用户数

· 获客成本(CPM千人展现成本/CPC单次点击成本/CPA单次行动成本)


4.2.2. Activation(与活跃相关指标)

· 活跃用户数(DAU日活用户数/WAU周活用户数/MAU月活用户数)

· 时长指标(用户在线时长/用户登录时长/APP使用时长/视频播放时长)

· 启动次数(冷启动次数/热启动次数)

· 页面浏览量(PV页面浏览量/UV独立访客数)


4.2.3. Retention(与留存相关指标)

· 留存(短期留存:次日、3日、5日、7日 - 反映功能短期留人效果/长期留存:30日、60日 - 反映留存长期稳定性)

· 用户生命周期(LT = 当日留存率+次留率+3留率+…n留率)

4.2.4. Revenue(与变现相关指标)

· 交易类 - 核心在于成交(GMV/成交量/销售收入/ARPU每个用户平均收入/复购率)

· 社区类 - 核心在于打造生成内容的活跃社区(内容生成用户数/内容互动用户数/内容实际收入 - 内容价值)

· 企业类 - 核心在于用户体验(体验用户数/付费用户数/用户生命周期价值LTV)


4.2.5. Refer (与传播相关指标)

· 病毒K因子(邀请率 = 发出邀请数/现有用户数/接受率 = 新注册用户数/发出邀请数/K因子 = 邀请率*接受率)

· 传播周期


§ 推荐学习工具:

Framework - 必看!: https://stellarpeers.com/frameworks/

Product Sense: https://productschool.com

A Collection of Data Science Take Home Challenge: https://datamasked.com

互联网企业模拟面试实例: Decode and Conquer

Cracking the PM Interview - 重点看:Estimation, Product, Case



5. Behavior

5.1. 模板:S(Situation) - T(Task) - A(Action) - R(Result)

5.2. 主题:

(1) Leadership and how to influence others

(2) A hard challenge faced and How to solve it

(3) A true failure and how to turn it around

(4) A proud success made with team together


还在等待什么,赶快收藏起来,逐一攻破备战求职季吧!