close

在去年的6月5日,Produce 101 第2季的Concept賽程告一段落,現場票數最高者,可以獨得10萬票的加分票。

候選名單,很簡單,只有兩位,丹尼爾與姜東昊。

當時,我使用了SVM演算法,預測的結果,與現實卻是相反的。

在後來,即使節目結束了,由於資料還在,我有空就寫了其他的演算法試試看,得到的結果都非常不好,像是隨機森林,決策樹 ,knn,神經網路包括nnet與neuralnet,結果都讓我滿失落的。

我以為,數據組的筆數不足(前35強,就只有35筆資料),欄位資料之間的關聯性很低,這樣子的數據,就是無法預估到正確的結果。

一直到最近,我想了想,來練習羅吉斯迴歸,就想說,那就拿前35強的資料來練習寫程式。

結果,竟然羅吉斯迴歸這個演算法,預估正確了!

下表,是我餵給演算法的數據。其中,Concept的投票結果(Concept.Vote),超過80票的就是“1”,低於80票的就是“0”。羅吉斯迴歸,就是分辨『有、沒有』、『是、不是』很好用的演算法。

pd101s2_top2_of_top35_2.png

 

下面是我寫的code。看不懂的,就直接看最下面的結果。丹尼爾是大於80票,姜東昊則是小於80票,與事實相符。

pd101s2_top2_of_top35.png

 

最近,真的是有些忙,再加上工作的不穩定,讓心神一直沒辦法定下來,也就造成沒有心思來寫部落格。希望周遭的一切,都能往好的方向前進。

arrow
arrow

    Shavid 發表在 痞客邦 留言(0) 人氣()