2019年1月6日 星期日

Google Trends 嘗試分析 (蔡英文 v.s. 韓國瑜)


在ptt政黑板看到一篇網路聲量的文章,就是在比較蔡英文跟韓國瑜的網路聲量。 


該篇文不對題,不可信,因為搜尋量不代表網路聲量,而網路聲量包含搜尋量。

個人對網路聲量的數字真假,打上一個問號,甚至是不信任。各家的網路聲量都不相同,到底數值怎麼來的?是否與想探討之現象有相關聯?或者有人為操弄的空間?又或者可以誤導解讀。

不是專業的分析者,講出來的統計數字並不適當的可能性很大。(如:賴院長說平均薪資,但其實是用薪資中位數更具有代表性。)

回歸正題,網路聲量跟時間點相當有關,本篇文章是在2019.1.6撰寫,資料參考也是從這天來看。



圖表的數值是怎麼來的?以下是google搜尋熱度的趨勢變化解釋:
這些數字代表搜尋字詞在特定區域和時間範圍內的熱門程度變化趨勢,以圖表中的最高點做為比較基準。100 分代表該字詞的熱門程度在該時間點達到最高峰。50 分表示該字詞的熱門程度為最高點的一半,0 分則表示該字詞熱門程度的資料不足。
白話來說,以特定字詞作範圍,100就是一時段內最高搜尋量,並以此量為基準,50表示是搜尋量為最高量的一半。


地區:台灣。時間範圍:過去7天。

藍色是蔡英文、紅色是韓國瑜,大部分的時間,紅色的線都在藍色上面,韓國瑜的搜尋量比蔡英文還高。

這代表「在『Google搜尋』使用者們中,『韓國瑜』比『蔡英文』更好奇,更熱門。」

在跨年時,人們好奇韓國瑜的跨年,所以從1/1凌晨到早上7點直線上升,並在早上7點時搜尋量達到100,之後又直線摔落,判讀是因為跨年行程已經過時了,熱度退燒。

搜尋量的升降,會跟當時的事件相關。

蔡英文的搜尋量勝過韓國瑜的時刻,就是在1/3下午9點後。在1/2下午4點,蔡英文總統回應習近平主席之後,可以看見蔡英文的搜尋量直接上噴。

但究竟是發生甚麼事件,讓1/3下午9點後,蔡英文的搜尋量超越韓國瑜呢?

那時也沒有新議題發生,也沒有新的回應,也沒有新的文章。隔天突破高峰,是否是電視台媒體討論所致?只從Google Trends並不能看出相關性。

網路聲量是在網路上討論的程度,聲音的大小。講話是用分貝做測量,網路的聲音則是用討論程度的熱度做代表。 

講話大聲可能是在罵人,網路聲量大也不一定是正面。 

來看看Google Trends提供的其他數據吧。

下面有相關搜尋,當中的「人氣竄升」分類,可以看到最近當紅的搜尋,有些字詞知道緣故,但不懂緣故的字詞就很令人感興趣了。

  1. 蔡英文738,蔡英文總統升旗時,穿著繡有738的外套。
  2. 韓國瑜 米糠(柴犬)、斗六日本料理、icrt,韓國瑜市長的周邊或是行程。
也許第二搜尋字詞,能讓你找到意想不到的事情,也可能藉此找到上車的車票?

再者是「熱門」分類,可以看到經由斷詞後,歸類為與特定字詞相關的相關搜尋。有一些要點出來。
  1. 蔡英文,「蔡 的 英文」,這樣的斷詞,大概是搜尋「蔡英文的XXX」。
  2. 韓國瑜,「韓國」,搜尋韓國瑜的人,百分之百也搜尋了韓國。

最後,再分享個另一個網站的網路聲量統計。Fb專頁儀表板

蔡英文的討論人數則是在近日內一人輾壓各對手總和。若以某項數據代表「網路聲量」所,討論人數比搜尋量更貼切適當。因為我沒有google蔡英文,直接在ptt跟fb上看大家如何討論蔡英文。


後記 


數據的判讀一直是很難的專業,即便有了大數據分析系統,但是卻不能判別邏輯上是否能解釋。 

一項數據若沒有辦別因果關係,母子關係,而錯誤地拿來支持論證,那論證結果會因為這個錯解,可能變得一文不值,通篇廢話。 

最後還是沒有找到蔡英文為何在1/3下午9點上升的關鍵,是因為政論節目的討論,閱聽者感到興趣去搜尋嗎?那1/2當晚,那些政論節目的談話主題是甚麼?我沒有查證,

文中雖然提到老司機,不過實際嘗試,辦不到呢……