top of page

自学数据分析,学到什么程度可以找工作

Updated: Sep 12, 2023

数据分析本身是一门非常综合的学科,通常在面试准备的过程中也是非常的零散和琐碎,很多求职者不停的就各个方面进行复习准备,但总觉得学不到头,或者不管怎么准备总会不够充分,面试被挂。那么,今天就给大家带来一个最精简版的框架,帮助大家检测自己的学习/面试程度。


【概率统计】

1. 描述性统计

  • 均值(期望)

  • 中位数

  • 众数

  • 方差(标准差):3 sigma

  • 极大/小值

  • 数据分布(正态/伯努利/二项/均匀/指数/泊松;偏度与峰度)

  • 缺失值

  • 异常值

2. 假设检验

  • 原假设/备择假设

  • T检验

  • 卡方检验(非参数检验)

  • P值

  • 置信度

  • 置信区间

  • A/B Test


3. 概率论

  • 条件概率(贝叶斯原理)

  • 抽样

  • 大数定律

  • 中心极限定理

  • 区间估计/参数估计

  • R方

  • 方差分析


推荐学习工具:

数理统计:



【分析工具】

1. SQL

  • 表的增删改查

  • 表连接

  • 子查询

  • 窗口函数

  • SQL语句执行顺序

推荐学习工具:

推荐刷题工具:

LeetCode - 从Easy到Medium,有时间再Hard,但Hard不必强求(Summary of SQL on LeetCode: https://byrony.github.io/summary-of-sql-questions-on-leetcode.html

HackerRank - 全部刷完: https://www.hackerrank.com/domains/sql


2. Python

  • 基本数据结构:列表/字典/字符串/元组/数组/集合

  • 基本语句:If条件语句/for循环/while循环

  • 基本package:numpy/pandas/sklearn/statsmodel/matplotlib/seaborn

推荐学习工具:

推荐刷题工具:LeetCode - 从Easy到Medium


3. Tableau

  • 图表类型

  • 交互式面板

  • 基础的计算函数


4. EXCEL

  • 基本计算函数

  • 数据透视表

  • V LOOKUP


【算法模型】

原理、模型解读、模型评估、使用场景、优缺点、模型优化


  • 回归

    • 线性回归

    • 逻辑回归

    • Lasso/Ridge回归

  • 分类

    • 决策树

    • 随机森林

    • SVM

  • 聚类

  • 时间序列模型

推荐刷题工具:LeetCode/Glassdoor真题题库 - 从Easy到Medium


【Product Sense】

1.分析方法

  • 漏斗分析

  • 拆解分析

  • 对比分析

  • 留存分析

  • 用户分群分析

  • 归因分析

  • 渠道路径分析


2. 指标体系 - AARRR体系

  • Acquisition(与拉新相关指标)

    • 曝光/展现IMPERESSION

    • 点击CLICK

    • 下载量

    • 新注册用户数

    • 获客成本(CPM千人展现成本/CPC单次点击成本/CPA单次行动成本)


  • Activation(与活跃相关指标)

    • 活跃用户数(DAU日活用户数/WAU周活用户数/MAU月活用户数)

    • 时长指标(用户在线时长/用户登录时长/APP使用时长/视频播放时长)

    • 启动次数(冷启动次数/热启动次数)

    • 页面浏览量(PV页面浏览量/UV独立访客数)


  • Retention(与留存相关指标)

    • 留存(短期留存:次日、3日、5日、7日 - 反映功能短期留人效果/长期留存:30日、60日 - 反映留存长期稳定性)

    • 用户生命周期(LT = 当日留存率+次留率+3留率+…n留率)


  • Revenue(与变现相关指标)

    • 交易类 - 核心在于成交(GMV/成交量/销售收入/ARPU每个用户平均收入/复购率)

    • 社区类 - 核心在于打造生成内容的活跃社区(内容生成用户数/内容互动用户数/内容实际收入 - 内容价值)

    • 企业类 - 核心在于用户体验(体验用户数/付费用户数/用户生命周期价值LTV)


  • Refer (与传播相关指标)

    • 病毒K因子(邀请率 = 发出邀请数/现有用户数/接受率 = 新注册用户数/发出邀请数/K因子 = 邀请率*接受率)

    • 传播周期

推荐学习工具:

Framework - 必看!: https://stellarpeers.com/frameworks/

A Collection of Data Science Take Home Challenge: https://datamasked.com

互联网企业模拟面试实例: Decode and Conquer: Answers to Product Management Interviews

Cracking the PM Interview - 重点看:Estimation, Product, Case


【Behavior】

模板:

S(Situation) - T(Task) - A(Action) - R(Result)

主题:

(1) Leadership and how to influence others

(2) A hard challenge faced and How to solve it

(3) A true failure and how to turn it around

(4) A proud success made with team together


话不多说,快点开始行动,备战招聘季吧!





bottom of page