初識Python語言
第一周
主要內容
Python語言概述和環境安裝丨變量、數據類型和進制丨運算符和分支結構丨循環結構入門丨循環結構的應用
可解決問題
了解Python,搭建Python開發環境,編寫簡單的Python代碼
可掌握的核心能力
Python開發環境的安裝(3.6+) | Pycharm的安裝和使用 | Markdown軟件的安裝和使用 |
分支結構的應用場景 | for循環和while循環應用場景區分 | break和continue關鍵字的使用 |
窮舉法(暴力破解法)的應用 |
常用數據結構和函數
第二周
主要內容
字符串丨列表的應用丨元組和集合丨字典類型的應用丨函數使用入門
可解決問題
掌握Python中常用數據類型,實現常用的業務邏輯
可掌握的核心能力
列表的運算 | 創建列表的生成式(推導式) | 元組的應用場景(打包解包、變量值交換) |
集合類型的特點(無序性、互異性、確定性) | 集合的運算 | 字典中鍵和值的特點 |
字典的索引運算和循環遍歷 | 函數的定義和調用 |
函數和面向對象編程
第三周
主要內容
包和模塊丨函數的高級用法丨裝飾器和生成器丨面向對象編程基礎丨面向對象編程進階
可解決問題
掌握Python中模塊的使用,導入三方模塊,數據作用域,了解Python高級特性,面向過程,面向對象的編程思維
可掌握的核心能力
包和模塊的概念 | Python標準庫中的常用模塊 | 安裝和使用第三方模塊(pip命令詳解) |
Python中的作用域(LEGB、閉包) | Python內置函數中的高階函數 | 裝飾器函數的工作原理 |
普通函數到生成器的轉變 | 面向對象的核心概念(類和對象) | 常用的魔法方法 |
多重繼承和MRO問題 |
Python網絡數據采集
第四周
主要內容
爬蟲概述和頁面抓取丨解析頁面的方式丨爬取數據的持久化和商業IP代理丨獲取頁面動態內容-1丨獲取頁面動態內容-2
可解決問題
掌握爬蟲技能,主流的數據抓取,自動化瀏覽器操作,競品研究。
可掌握的核心能力
爬蟲的作用和分類 | 爬蟲合法性的探討 | 三方庫requests的安裝和使用 |
三方庫beautifulsoup4的安裝和使用 | 通過瀏覽器開發者工具獲得元素的選擇器 | 使用XPath語法實現頁面解析 |
將爬取到的數據寫入CSV文件 | 將爬取到的數據寫入Excel文件 | 修改請求頭Cookie信息 |
破解目標網站封禁IP的方法 | Ajax技術和頁面動態內容 | 抓包工具的介紹和使用 |
通過數據接口獲取JSON數據 | 使用打碼平臺破解文字驗證碼 |
數據分析概述和Excel的應用
第五周
主要內容
數據分析和數據分析師概述丨指標和指標體系建設丨Excel的安裝和快速上手丨Excel中的函數和公式計算丨Excel透視表和、透視圖和商業數據看板
可解決問題
數據分析崗位認知,入門受眾面最廣的數據分析工具Excel
可掌握的核心能力
數據分析在各行各業的應用 | 互聯網產品的定義和商業模式認知 | 互聯網產品類型和盈利模式分析 |
互聯產品的指標分類和常見指標 | 如何為企業搭建指標體系 | 數據采集的埋點設計和規范 |
Excel中函數的應用場景和分類 | 透視表的本質和應用場景 | 添加和定制切片器 |
制作商業數據看板 |
關系型數據庫和SQL
第六周
主要內容
數據庫概述和MySQL的安裝使用丨表關系和SQL的應用丨SQL數據查詢詳解丨窗口函數和JSON類型丨Python程序接入MySQL數據庫
可解決問題
掌握數據庫的核心內容,掌握SQL的使用,掌握使用SQL進行數據分析
可掌握的核心能力
關系型數據庫的特點 | 關系型數據庫產品介紹 | MySQL圖形化工具Workbench的使用 |
投影、別名和運算 | 數據篩選和空值處理(where子句) | 分組和聚合函數(group?by子句和having子句) |
嵌套查詢(子查詢) | 連接查詢(內連接、左外連接、右外連接) | 使用窗口函數解決排名和TopN查詢問題 |
使用數據庫持久化網絡爬蟲采集的數據 |
商業智能(BI)工具
第七周
主要內容
MySQL其他相關知識丨從Excel到Power?BI丨Power?BI中的數據清洗和建模丨Power?BI中的數據可視化和報表制作丨認識和使用Tableau
可解決問題
掌握主流BI工具PowerBI,Tableau等工具的使用
可掌握的核心能力
從Excel升級到Power?BI的理由 | Power?Query編輯器的使用 | 事實表和維度表 |
DAX函數 | 高階視覺對象的應用 | 數據的鉆取 |
Tableau?Desktop功能區介紹 | 基礎可視化圖表的應用 | 餅圖、折線圖、樹狀圖、堆積柱狀圖、直方圖、散點圖、氣泡圖 |
商業智能(BI)工具
第八周
主要內容
深入探索Tableau丨Tableau數據分析項目實戰丨認識和使用fineBI丨數據思維和分析模型-1丨數據思維和分析模型-2
可解決問題
掌握主流數據分析思維,使用模型對項目進行分析。
可掌握的核心能力
數據分箱和數據桶 | 相關分析和回歸分析 | LOD表達式的應用場景 |
儀表板的布局和樣式 | RFM模型 | AIPL模型 |
AARRR模型(海盜模型) | RARRA增長模型 | 渠道和運營分析 |
A/B測試的應用閉環 | 產品生命周期和迭代流程 | 用戶生命周期和運營策略 |
數據分析報告撰寫原則 | 數據分析報告撰寫要素 | 優質數據分析報告解讀 |
Python數據分析
第九周
主要內容
Python數據分析工具介紹丨使用NumPy實現批量數據處理丨使用Pandas進行數據分析-1丨使用Pandas進行數據分析-2丨使用Pandas進行數據分析-3
可解決問題
掌握使用Python進行數據分析,掌握Python數據分析三劍客。
可掌握的核心能力
新建和使用Notebook | ndarray對象的索引和切片 | 廣播機制 |
讀取CSV和Excel文件創建DataFrame | DataFrame對象的數據篩選 | DataFrame對象的數據拼接和合并 |
數據清洗的概念 | 數據的分箱(離散化) | DataFrame對象的數據分組聚合操作 |
生成透視表和交叉表 | 計算協方差和相關系數 |
Python數據分析
第十周
主要內容
使用Matplotlib繪制統計圖表丨Seaborn和Pyecharts的使用丨電商項目相關業務知識介紹丨項目實操
可解決問題
掌握數據可視化的多種庫,結合項目進行可視化,進行數據分析
可掌握的核心能力
Matplotlib的配置參數 | 定制坐標系 | 柱狀圖和堆疊柱狀圖 |
餅圖和環狀餅圖 | 加載Seaborn自帶的數據集 | Pyecharts常用圖表舉例 |
電商產品的生命周期 | 電商用戶的生命周期 | 電商產品核心指標和指標體系解析 |
電商產品運營活動概述 | FAST模型和KISS復盤 | 用戶畫像和用戶標簽 |
電商產品用戶購買預測 | 電商產品用戶評論情感預測 |
統計思維和機器學習的數學基礎
第十一周
主要內容
線性代數丨微積分丨概率論丨統計學丨信息論
可解決問題
掌握統計思維,為機器學習做準備
可掌握的核心能力
矩陣和行列式 | 特征值和特征向量 | 導數的概念和意義 |
空間函數和偏導數 | 貝葉斯定理 | 正態分布詳解 |
假設檢驗 | 主成分分析 | 聯合熵和條件熵 |
機器學習算法
第十二周
主要內容
機器學習概述和kNN算法丨回歸算法丨邏輯回歸丨樸素貝葉斯丨決策樹
可解決問題
掌握機器學習的主流算法,掌握分類,回歸,樹模型
可掌握的核心能力
機器學習三大要素:模型、策略、算法 | 模型評估方法概述 | 機器學習中的概念解析 |
一元線性回歸和多元線性回歸 | 線性回歸算法原理 | 回歸模型評價標準MSE、R^2、RMSE、MAE等 |
Sigmoid函數 | 似然函數、極大似然估計 | 決策樹算法概述及學習過程 |
特征依據:香濃熵、信息增益、GINI系數 | 隨機森林集成算法 |
機器學習算法
第十三周
主要內容
支持向量機丨聚類算法和輪廓系數丨集成算法丨特征工程和評價指標丨機器學習項目實戰
可解決問題
掌握集成學習的主流算法,掌握非監督學習,掌握模型評估及優化策略。
可掌握的核心能力
SVM算法數學推導過程 | 最大幾何間隔、拉格朗日乘子法、對偶性質 | KMeans聚類算法原理及應用 |
DBSCAN聚類算法原理及應用 | Bagging思想、Boosting思想、Stacking思想 | 特征工程 |
建模流程規范 | 數據量綱處理:歸一化、標準化、缺失值處理 | WOE、IV值意義及特征轉換 |
特征重要性評估 |
數據倉庫和大數據挖掘
第十四周
主要內容
數據倉庫、數據湖和Hadoop生態圈丨ETL工具丨數據倉庫丨Hive丨數倉搭建和數據分析項目
可解決問題
了解大數據生態,使用大數據工具進行數據分析,數據挖掘。
可掌握的核心能力
Hadoop生態圈概述 | 數據的預處理 | 數據倉庫建模 |
Hive的數據定義語言 | Hive的數據操作語言 | Hive的數據查詢語言 |
Hive數據抽樣(隨機抽樣、塊抽樣、分桶抽樣) | 用戶行為分析和購買預測 |
就業指導和模擬面試
第十五周
主要內容
就業期的技術和心理準備丨如何制作一份優質的簡歷丨面試流程和注意事項丨一對一模擬模式丨一對一模擬面試
可解決問題
就業沖刺,掌握面試技巧,如何表達出自己的能力
可掌握的核心能力
數據分析師的硬實力和軟技能 | 數據挖掘工程師簡歷要點 | STAR法則的應用 |
高頻面試題回答技巧 | 面試后的總結和復盤 | 簡歷文字問題剖析 |