Login
Sign Up For Free
English
中文 (繁體)
中文 (香港)
中文 (简体)
日本語
Filipino
Bahasa Indonesia
Bahasa Melayu
Pусский
Português (Brasil)
Magyar
Français
Español
Deutsch
Čeština
العربية
Català
Dansk
Ελληνικά
فارسی
Suomi
Gaeilge
Hindi
עברית
Hrvatski
Italiano
Norsk bokmål
Nederlands
한국어
Polski
Română
Slovenský
Svenska
Türkçe
українська
беларуская
ไทย
Standard view
藍白拖的真諦
2 years ago
latest #79
藍白拖的真諦
2 years ago
Day 13 DataFrame 操作
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Pandas Cheat Sheet
https://pandas.pydata.or...
懶人包
立即下載
藍白拖的真諦
2 years ago
數值資料分組
np.inf 無窮大
np.inf到0為第一組,1到2為第二組
藍白拖的真諦
2 years ago
用CNT_C_G和TARGET分組,並求出各組的所得平均
藍白拖的真諦
2 years ago
上述的視覺化
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day 14 太廢惹 就放一起吧
藍白拖的真諦
2 years ago
相關係數
藍白拖的真諦
2 years ago
Day15 相關係數綜合練習
沒什麼新內容 跳過
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day16 繪圖調整與KDE
藍白拖的真諦
2 years ago
作業
藍白拖的真諦
2 years ago
distplot 大概就是hist + KDE(應該吧
Python可视化 | Seaborn5分钟入门(一)——kdeplot和distplot
藍白拖的真諦
2 years ago
Day17 連續資料離散化
(其實就是分組的樣子)
大致操作
藍白拖的真諦
2 years ago
Day18 離散化綜合練習
藍白拖的真諦
2 years ago
Day19 Subplot
藍白拖的真諦
2 years ago
語法參考
https://matplotlib.org/....
Multiple Subplots | Python Data Science Handbook
藍白拖的真諦
2 years ago
語法參考
https://matplotlib.org/....
Multiple Subplots | Python Data Science Handbook
藍白拖的真諦
2 years ago
joinplot
seaborn.jointplot — seaborn 0.11.2 documentation
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day20 Heatmap & Grid-plot
進階畫圖(?
藍白拖的真諦
2 years ago
gridplot好像有在統計課本裡看過
藍白拖的真諦
2 years ago
大樣本的點陣圖好醜
藍白拖的真諦
2 years ago
Day21
上傳kaggle初體驗(?
藍白拖的真諦
2 years ago
Day22 特徵工程入門
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day23 去偏態
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day24 類別特徵基礎處理
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
其實一樣是在講標籤和獨熱編碼
藍白拖的真諦
2 years ago
Day25 類別資料處理 - 均值編碼
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day26 時間資料處理
周期循環特性
sin/cos解
藍白拖的真諦
2 years ago
Python-基础-时间日期处理小结
datetime — Basic date and time types — Python 3.10.4...
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
啊漏記了 上面的時間資料是Day27啦
藍白拖的真諦
2 years ago
真·Day 26 類別資料 - 其他編碼方式
計數編碼
特徵雜湊
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day28 數值資料間的組合使用
如何組合、為何組合 需依靠領域知識
藍白拖的真諦
2 years ago
Day29 類別與數值資料的組合使用
群聚編碼:
和均值類似 但不使用應變數
而是藉由其他有相關性的自變數編碼
藍白拖的真諦
2 years ago
Day30 特徵選擇
刪除較無用的變數
藍白拖的真諦
2 years ago
範例
藍白拖的真諦
2 years ago
Day31 特徵重要性
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day32 葉編碼
CTR预估[十一]: Algorithm-GBDT Encoder
這段其實我沒有很明白
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
Day33 機器學習概要(?
定義模型 設定參數
評估模型:loss func.
找出最好的辣個
過擬合 over-fitting
吸收太多雜音 使模型過於神經質
如何知道有過擬合?
可保留部分資料,觀察其誤差是否與訓練資料的誤差有改變趨勢
藍白拖的真諦
2 years ago
解決過擬合或欠擬合
增加資料量、降低模型複雜度、正規化
增加模型複雜度、減輕或不使用正規化
當資料太少就容易發生過擬合,或使用決策樹模型也較容易發生過擬合
藍白拖的真諦
2 years ago
找最佳模型:
可考慮梯度下降(Gradient Descent)、增量訓練(Additive Training)
欠擬合這個說法真的好好笑
(看到該彎不彎的模型)
你是不是欠擬合!
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
ML Lecture 1: Regression - Case Study
藍白拖的真諦
2 years ago
Day34 訓練/驗證/測試集之切分
為何需要驗證/測試集
評估訓練情形,確認模型是否過擬合
如何切分:
Python Scikit-learn的 train_test_split
K-fold Cross-validation
讓每個資料集都可以當一次測試集
驗證(validation)與測試(testing)之差異
驗證用來修正與檢驗模型,測試則為最終評估,為求樣本外表現結果,只有最後才可以使用(個人理解
藍白拖的真諦
2 years ago
ML Lecture 2: Where does the error come from?
藍白拖的真諦
2 years ago
資料不均勻時的切分
藍白拖的真諦
2 years ago
Day35 迴歸v.s分類問題
藍白拖的真諦
2 years ago
机器学习大牛最常用的5个回归损失函数,你知道几个?
藍白拖的真諦
2 years ago
Day36 評估指標選定
藍白拖的真諦
2 years ago
Day37、38 迴歸模型介紹
這個我熟
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
多元logistic迴歸
參數參考
LogisticRegression - 参数说明_Jark_的博客-CSDN博客_logisticre...
藍白拖的真諦
2 years ago
Day39 Lasso/Ridge regression
藍白拖的真諦
2 years ago
Linear least squares, Lasso,ridge regression有何本质区别? ...
Ridge 是為了解決高度線性重合而生
但不能進行特徵選擇
而Lasso會將貢獻太爛的變數權重→0
可以進行特徵選擇 但不能group selection
藍白拖的真諦
2 years ago
Day40 Lasso/Ridge的實作
別人都寫好了
藍白拖的真諦
2 years ago
Day41 決策樹基本概念
藍白拖的真諦
2 years ago
作業參考
藍白拖的真諦
2 years ago
Day42 決策樹實做
藍白拖的真諦
2 years ago
Day43 隨機森林基本概念
藍白拖的真諦
2 years ago
我自己的理解:
因為決策樹是把所有資料丟進去跑,容易有overfit的問題,所以以隨機森林作為改善。
隨機森林隨機在每棵樹只選取部分資料與特徵,再看那筆資料各樹統計下來哪個預測值最多來決定最終預測值。就是從資料裡重複抽樣的意思,和bootstrap相似。
藍白拖的真諦
2 years ago
Day44 隨機森林實做
藍白拖的真諦
2 years ago
@Edit 2 years ago
Day25-26 梯度提升概念與實作
好程序员Python教程:30 梯度提升树原理(一)
我覺得直接看這個老師的就好
藍白拖的真諦
2 years ago
而且這個老師講話好圓潤啊(?
感覺是蠻有趣的人
藍白拖的真諦
2 years ago
藍白拖的真諦
2 years ago
@Edit 2 years ago
Day47 超參數調整
窮舉 Grid Search : 一個一個找
隨機 Ransom Search : 隨便找(×
藍白拖的真諦
2 years ago
Day48 Kaggle介紹與實作
好麻煩要花比較多時間
明天再來完成這部分
藍白拖的真諦
2 years ago
Day49-50 模型集成
藍白拖的真諦
2 years ago
@Edit 2 years ago
back to top
delete
reply
edit
cancel
cancel