通過社交媒體實現(xiàn)的這種雙向交流為很多公司企業(yè)提供了寶貴機會,能夠讓他們與終端用戶直接溝通。
關鍵詞提取
首先我們需要在初級輸入(primary input)中輸入種類條目,找到數(shù)據(jù)提取需要的不同關鍵詞。舉例來說,對高價的組合式櫥柜,我們需要知道不同品牌的數(shù)量、名稱和特點,現(xiàn)在流行的款式等等。同時還需要剔除一些干擾詞來去掉無關信息。如果我們僅僅使用“櫥柜”這個關鍵詞,就能找到“@XXX – 競爭激烈啊! Brand-YYY @Kitchen_Art #生活方式”,這樣的信息就是和組合櫥柜無關了。
數(shù)據(jù)提取和數(shù)據(jù)篩選
一旦關鍵詞列表確定了,我們就需要確定合理的查詢模式來抓取有效內容。為了避免上面提到的問題,我們在輸入關鍵詞的同時也要剔除干擾詞。當然我們還需要篩選正確的信息源,對組合櫥柜來說,可以找Houzz.com論壇等。
將定性數(shù)據(jù)轉化為定量數(shù)據(jù):接下來我們需要通過文本挖掘和自然語言處理技術來將定性數(shù)據(jù)轉化為定量數(shù)據(jù)。
演示如下圖:
之后還需要通過“測試&學習”方式對上表進行調整,調整后如圖:
購買意向&基本分類創(chuàng)建&調整:分析購買意向時,我們需要以樣本數(shù)據(jù)掃描為基礎,創(chuàng)建一個初級分類。
情感分析
分析語氣來判斷公眾心態(tài),看他們對某個產(chǎn)品是持積極、消極還是中立態(tài)度。
這種包含了預測模型和習慣分類法的基于Na?ve Bayes分類器的分類方法能夠有效提高準確度(>80%)。
語氣計算流程如下:
文本挖掘:從每條動態(tài)中提取主要概念、創(chuàng)建變量并記錄100個左右的概念。
人工情感分類:隨意提取10%樣本或至少5000個數(shù)據(jù)點、人工對這些數(shù)據(jù)進行分類。
預測模型:利用決策樹、神經(jīng)網(wǎng)絡,SVM等算法,學習樣本數(shù)據(jù)分類,從而確定分類規(guī)則。
習慣規(guī)則:基于Business Logic、 Na?ve Bayes分類器等條件概率算法,建立習慣規(guī)則,提高語氣情感分析的準確性。
運用分類規(guī)則:將預測算法規(guī)則和習慣規(guī)則應用到整個數(shù)據(jù)集,獲取每個信息點的語氣情感信息。
開發(fā)潛在客戶
購買意向分析和語氣分析結束后,我們可以將內容分為:
高可能性客戶
中等可能性客戶
低可能性客戶
然后著重分析高可能性和中等可能性用戶的需求和痛點,然后制定溝通策略來對他們進行重點營銷。
解決方案運作模式
每一個新的數(shù)據(jù)產(chǎn)生以后,這個數(shù)據(jù)就將根據(jù)現(xiàn)有規(guī)則被分到相應的分類條目中。每三個月應該對這些規(guī)則進行再驗證。
社交媒體分析工具
目前可供市場分析師使用的社交媒體分析工具非常多,如Radian6、Sysomos、Poly Analyst (Megaputer)、HootSuite等等。這些工具可以用來分析多個渠道的數(shù)據(jù),也有專門用于分析某個網(wǎng)站數(shù)據(jù)的分析工具,如Twitter分析工具,F(xiàn)acebook分析工具等。所有這些分析工具都能用于將定性數(shù)據(jù)轉化成數(shù)據(jù)表格,可用于社交媒體監(jiān)測。
還有一些使用感較好的統(tǒng)計工具,如R語言、SPSS文本挖掘器、SAS統(tǒng)計分析系統(tǒng),能夠用于預測建模等高級分析過程。Naive Bayes分類器可用于提高情感分析的準確度。