Re: [請益] 機器學習在台灣的出路

08/29 01:20, , 5^F

08/29 01:20, 5^F

目前 DM 一部分的核心就是 ML ，是有點離題拉即使單純寫新方法，也並非 google 那些大企業，拿 XGB 舉例，作者是個在國外念博士的中國人，非數學相關科系，因為這些理論都已經發展十幾年了，要怎麼有效率的實作才是重點

→

08/29 01:21, , 6^F

08/29 01:21, 6^F

推

vu04y94

08/29 01:25, , 7^F

08/29 01:25, 7^F

→

vu04y94

08/29 01:25, , 8^F

08/29 01:25, 8^F

推

popo14777

08/29 01:45, , 9^F

08/29 01:45, 9^F

目前 DL 很夯更多拿 AI 去騙計畫的好像什麼都要跟 AI 扯上邊

→

08/29 02:17, , 10^F

08/29 02:17, 10^F

→

08/29 02:21, , 11^F

08/29 02:21, 11^F

→

08/29 02:21, , 12^F

08/29 02:21, 12^F

→

08/29 02:21, , 13^F

08/29 02:21, 13^F

對阿我數學系的，目前也不少數學系教授在做這方面 CS 領域很廣，所以做這方面的比較少人就我所知，台大一些 CS 的打 Kaggle 很強，其實 data mining 、ML、DL 這方面，資工課程比較完善，像是台大李宏毅的 ML 線上課程，林軒田，甚至是剛回國的陳縕儂( 超正教授XD ) 都是這方面的專家，而且都不是數學背景喔，所以資工做這塊不是問題

推

del680202

08/29 07:27, , 14^F

08/29 07:27, 14^F

→

angusyu

08/29 09:05, , 15^F

08/29 09:05, 15^F

應該說這塊連國外都還在發展中 XGB的作者是個在美國念博士的中國人所以並非那些大企業在玩而台灣是有這方面的人就看台灣未來的走向了台灣未來對這塊的需求又是如何?? 其實這塊很多都在發展中是有機會走出自己的一條路的 ※ 編輯: f496328mm (114.36.63.197), 08/29/2017 09:34:52

推

ken90242

08/29 09:52, , 16^F

08/29 09:52, 16^F

推

senjor

08/29 09:57, , 17^F

08/29 09:57, 17^F

→

senjor

08/29 09:57, , 18^F

08/29 09:57, 18^F

推

ckp4131025

08/29 10:02, , 19^F

08/29 10:02, 19^F

→

ckp4131025

08/29 10:02, , 20^F

08/29 10:02, 20^F

推

08/29 11:02, , 21^F

08/29 11:02, 21^F

→

08/29 11:03, , 22^F

08/29 11:03, 22^F

→

08/29 11:03, , 23^F

08/29 11:03, 23^F

推

08/29 11:10, , 24^F

08/29 11:10, 24^F

推

jason91818

08/29 11:10, , 25^F

08/29 11:10, 25^F

推

Telemio

08/29 12:25, , 26^F

08/29 12:25, 26^F

推

08/29 12:31, , 27^F

08/29 12:31, 27^F

推

gogogogo3333

08/29 12:32, , 28^F

08/29 12:32, 28^F

→

08/29 12:35, , 29^F

08/29 12:35, 29^F

主要想說的是，不是大公司才能做，而且他非數學相關科系

推

say29217074

08/29 12:48, , 30^F

08/29 12:48, 30^F

推

stosto

08/29 17:55, , 31^F

08/29 17:55, 31^F

某部分，不敢說大部分，做這方面的碩士生，使用 default 參數是很常見的，所以當然不會知道 kernel ，( 不是學店生喔 )

→

stosto

08/29 17:55, , 32^F

08/29 17:55, 32^F

→

stosto

08/29 17:56, , 33^F

08/29 17:56, 33^F

這點是沒錯，大公司應該要分部門，專門研究這塊的，不過一般人，使用現成 model，做好其他部分就很厲害了，畢竟 model 只是其中一部分自己開發 model 這點，在 Kaggle 上也有這種情形，拿最近結束的比賽 Instacart Market Basket Analysis 來說就有參賽者開發出 arboretum - Gradient Boosting on GPU 當然成果是不錯的，另外 XGB 也是有 GPU 版本，未來 GPU 會被大大利用

推

08/29 19:58, , 34^F

08/29 19:58, 34^F

→

08/29 20:00, , 35^F

08/29 20:00, 35^F

參數不會是重點，重點還是在 feature，應該這樣講，參數大家都會調，那憑什麼比其他人強？？

推

08/29 20:43, , 36^F

08/29 20:43, 36^F

→

08/29 20:43, , 37^F

08/29 20:43, 37^F

學校很多都這樣阿，幾個方法比較一下，因為沒有壓力，做不好沒差有些小細節更是要注意，例如比較時，要設 seed ，相同的 training data、testing data，不然沒意義

→

08/29 20:44, , 38^F

08/29 20:44, 38^F

→

08/29 20:44, , 39^F

08/29 20:44, 39^F

推

08/29 21:06, , 40^F

08/29 21:06, 40^F

→

08/29 21:06, , 41^F

08/29 21:06, 41^F

→

angusyu

08/29 22:33, , 42^F

08/29 22:33, 42^F

推

howhowyang

08/30 02:21, , 43^F

08/30 02:21, 43^F

→

howhowyang

08/30 02:21, , 44^F

08/30 02:21, 44^F

→

howhowyang

08/30 02:21, , 45^F

08/30 02:21, 45^F

推

senjor

08/30 09:58, , 46^F

08/30 09:58, 46^F

推

lspci

08/31 03:06, , 47^F

08/31 03:06, 47^F

推

09/02 18:37, , 48^F

09/02 18:37, 48^F

→

09/02 18:38, , 49^F

09/02 18:38, 49^F

→

09/02 18:39, , 50^F

09/02 18:39, 50^F

→

09/02 18:39, , 51^F

09/02 18:39, 51^F

推

09/02 21:50, , 52^F

09/02 21:50, 52^F

我目前沒看過有教 feature engineering 的線上課程，可能這太細了，又是case by case 單就 ML 的話，台大李弘毅的不錯，youtube 上有我剛開始學，是直接打 Kaggle ，學習別人的方法，並沒有上線上課程， Kaggle 的 kernel 很有幫助，大家會分享自己的 code 與想法， code 不難讀，慢慢看累積經驗，建議你多做幾個題目，過期的比賽也沒關係不過排名至少要有 top 10% rank feature engineering 方面，我有對於兩個 kaggle 比賽上，寫篇文章介紹我的方法 https://github.com/f496328mm/kaggle_Grupo_Bimbo_Inventory_Demand https://github.com/f496328mm/kaggle_Bosch_Production_Line_Performance 我認為這只能靠經驗累積，基本上，類似的問題，feature engineering 都很類似這就是為什麼要找 feature，調參數很沒意義不過我也有經歷過初學者，陷入調參數的困境中，最好不要這樣，但是會這樣很正常有興趣可以合作玩玩看，我沒碰過的問題，我也不懂 feature，這需要花費很多時間，所以蠻希望找人合作 ※ 編輯: f496328mm (36.231.224.18), 09/03/2017 16:37:07

推

09/05 22:42, , 53^F

09/05 22:42, 53^F

→

09/05 22:42, , 54^F

09/05 22:42, 54^F

→