当前位置 > 首頁 > 會員服務 > CPDA數據分析師优秀原创文章:运用数据分析方法提升电信存量用户捆绑率的研究

CPDA數據分析師优秀原创文章:运用数据分析方法提升电信存量用户捆绑率的研究

来源:中国数据分析行业网 | 时间:2019-09-23 | 作者:数据委

作者:武汉 CPDA數據分析師:李毅、王月皎、李純、郭轶、劉莎、王荊

 

一、研究現狀和發展趨勢

存量用戶價值問題已越來越受到電信運營商的重視。隨著移動通信與其相關行業互相融合,利用新技術、新項目以及應用需求滿足當前人們的生活需求,人們享受到互聯網時代移動通信技術發展帶來的優質用戶體驗。在新的5G時代,客戶價值將成爲競爭焦點,對存量價值客戶的爭奪將成爲新賽場。

 

二、大數據时代存量用户价值提升的方式

(一)存量經營的涵義

存量經營囊括了運營商除拓展新客戶外的大部分經營活動,除了前端的市場活動,還包括後端的支撐活動(如網建、網優、IT系統完善等)。表現爲運營商針對現有客戶,以提升客戶忠誠度、釋放客戶價值爲目的的一系列經營方針和策略,主要是通過客戶信息挖掘、精細化管理、差異化服務來實現客戶保有和價值提升,體現出運營商對流失率的控制,除了要留住客戶,還要對客戶的價值進行挖掘和提升。隨著用戶市場日趨飽和,用戶增量市場的空間不斷減少、增速日益放緩,運營商對存量市場的依賴程度將不斷增加。

 

(二)精准營銷流程

精准营销不但提高了营销的准确率和命中率,同时也提高了服务水平。基于运营商的用户大數據,通过大數據挖掘、机器学习等方式进行数据价值的获取,具体营销流程见下图。

圖1:精准營銷流程

 

三、基于聚類分析的客戶細分模型建立與評估

細分客戶可以幫助運營商更加精准的了解客戶的消費行爲,了解客戶的特征。對客戶按照一定的標准進行劃分,實現對市場精准的分割,實現精准營銷。

 

(一)提取用戶畫像

用戶畫像即商業目的下用戶標簽的集合。運營商制定自有的標簽體系,並對用戶的語音和流量使用情況進行數據統計和分析,從而確定用戶所匹配的相應標簽。用戶標簽可以分爲兩部分,一是自然標簽,包括用戶的基礎信息、性別、年齡、家庭住址等,二是用根據用戶的基礎信息和行爲數據的歸納和分析而來的特征標簽,如最常用的APP、最喜歡的電商網站等等。根據用戶的基礎信息和行爲信息,對用戶進行360度的屬性特征和行爲偏好畫像。用戶標簽産品能全方位的了解用戶行爲特征,爲鎖定潛在目標用戶群、營銷決策等提供數據支撐基礎。

 

(二)數據維度與樣本量的確定

本文所用實驗取公司數據服務支撐平台的用戶數據爲樣本。根據電信用戶特點,針對性的選取了用戶屬性,剔除了無效的屬性,因數據維度較低,無需對數據做降維處理。根據電信業務經營的常識,結合本次實驗的需要,在數據選取時將遵從以下兩條原則:

 

1.在不損壞數據完整性的情況下,合並意義相近或相同的字段;

2.與本實驗無關的字段進行剔除,裁剪掉無效的字段。

 

本實驗將隨機抽取100000戶樣本用戶(在網6個月以上),剔除無效的或缺省值較多的字段,有效數據占樣本整體量的98.05%,最後得到98050戶數據作爲樣本參與客戶細分模型建立。

 

(三)用戶分類

用戶中包含兩部分,一部分是訂閱過流量包的用戶,一類是非訂閱用戶,計算二者比例。

擬符合流量包訂購條件樣本62950戶,另4770戶已爲冰激淩套餐,10327戶近半年無流量需求。

 

流量包 層級 國內 贈送省內 樣本數 備注
半年包 40半年包 - 3G 14504
流量月包 10元 100M - 18300 流量1元卡(OCS)12戶、ARPU值小于等于10元8戶
20元 300M - 13005
30元 500M 1000M+2G省內*12個月促銷 9700
50元 1G 5G 4652
70元 2G 10G 2599 騰訊大王卡等2I資費35戶,其中ARPU值小于60元的30戶。
100元 3G 15G 190

 

(四)數據建模

根據數據字段及樣本的選取規則,從上述的98050個數據中篩選過濾,得到下面部分字段的客戶數據信息。有部分字段在系統中直接提取出來是無法使用的,經過轉化求和等方式進行了加工,才得到以下內容,主要字段列舉如下:

 

表1:客戶畫像數據字段

字段名 數據類型 說明
用戶識別號 Text 用戶唯一識別碼
用戶號碼 Text 用戶服務號碼
在網時長 Number 用户在網時長
用戶産品名稱 Text 用戶産品名稱
是否訂購流量包 Text 用户是否訂購流量包
使用網絡類型 Number 用户使用網絡類型
手機上網費 Number 用戶6個月平均上網費用
ARPU值 Number 用戶6個月平均ARPU值
國內语音时长 Number 用户6个月國內语音平均时长
國內流量 Number 用户6个月平均國內流量

剔除存在缺失值、空值樣本後,選取有通信行爲的客戶數據98050條作爲聚類目標對象集,部分客戶數據如下表所示(本文涉及的數據均經過特殊加工處理)

 

表2客戶使用行爲數據表

用戶標識 在網時長 産品名稱 流量包 使用網絡 上網費(元) ARPU值 國內语音时长 國內流量(MB)
155**588 99 2 1 2G 0 9.65 10 0
130**362 148 4 1 3G 0 140 24 0
131**856 5 4 0 3G 3.75 53.1 57 1.1
130**912 37 3 0 4G 34 120.5 0 1899
156**872 42 1 1 2G 13.6 30.5 138 707
131**949 46 4 0 4G 0 10.5 63 267
155**603 75 2 1 4G 86 100.2 294 4300
186**686 42 1 1 4G 170 230.2 217 8905
155**690 89 3 1 3G 6 138.1 23 6.3
131**698 24 2 0 2G 0 36.8 31 0

 

(五)客戶細分模型建立與評估

使用datahoop平台,将套餐名称、网龄、ARPU值?? 、國內语音(分钟)、月均國內流量(G)、age、月均消费、免费流量、收费流量、收费和流量费等变量都放在X轴导入系统进行分析。

 

使用“異常值分析”,有39個異常值占比不高,可不做處理。

 

使用“相關系數矩陣”工具計算相關性,可知免費流量和收費流量系數大于0.9,屬于強相關,其他均小于0.7,因此將免費流量和收費流量的比值 作为新的变量,与网龄、ARPU值、月均國內语音(分钟)、月均國內流量(G)一起作为变量进行下一步建模。

 

將上述五個變量再次導入datahoop平台進行“相關系數矩陣”。結果顯示其相關性均小于0.8,不存在強相關,可以使用聚類分析來對這些用戶進行分類。

 

使用聚類中的K-means計算方法,在datahoop平台中建立數據流,將聚類系數分別設定爲3、4、5,來檢測何種分類下情況最佳。

結果顯示,在聚類系數爲4時,平均輪廓系數爲0.6537,此時分類效果最佳。

k-value silhouette coefficient
3 0.4539
4 0.6537
5 0.6497

圖1:各種分類下的輪廓系數結果

 

 

 

???????

(0爲不常使用用戶;1爲中端日常用戶;2爲中端商務用戶;3爲高端商務用戶)

 

類別 ARPU值(Y) Domestic Voice(S) Domestic flows(M) Network age(M) 客戶分類
0 19.62 58 1.13 6 不常使用用戶
1 45.72 1823 325.72 15 中端日常用戶
2 98.9 6582 4321.69 18 中端商務用戶
3 135.5 31257 10732.78 8 高端商務用戶

 

通過聚類模型分析結果如下:

0类用户为不常使用用戶,可以尝试推荐10元100M-30元500M流量包,培养用户使用流量习惯,提高用户在網時長,目的在于挽留用户继续使用。

 

1类用户为中端日常用戶,适合推荐存费送电子劵产品预存120元赠送240元,12个月。

 

2类用户为中端商務用戶,适合推荐存费送电子劵产品预存240元赠送480元,12个月。

 

3类用户为高端商務用戶, 适合推荐用户迁转为畅越冰激凌套餐。

 

通過聚類分析後得到的分類結果,還是比較符合用戶實際使用情況的。接下來就運用這種分類方式對我們將要推薦業務的用戶數據進行分類並進行實踐。

 

四、存量用戶價值提升實證分析及研究

取出一批待維系的用戶數據,提取他們的屬性,即建模過程張選取的屬性,將這些數據導入datahoop平台,使用聚類k-means算法進行分類。按照分類的結果對不同類的用戶進行不同産品的推薦。

 

建模目標在于,確定用戶的個人屬性和消費能力對其訂購相應業務的影響力大小,以便于對其他非訂購用戶進行業務適配,並進行相應推薦。

 

由于研究能提供的触点渠道存在局限性,本次采用了电话营销的传统方式进行渠道触达。电话营销方式的客户感知是远低于通过APP或网上营业厅等渠道的客户主动行为转化的感知。据统计,前期存费送电子券、套餐迁转和流量包订购为1.3%,通过大數據精准营销转化率达到了2.3%,提升了个1个PP。从实证结果来看,模型的运行结果实际可行,可以运用于日常工作中。

 

五、結束語

通过参加中国数据分析专业委员会數據分析師(CPDA)培训并获得认证,使我们建立了数据分析思维、熟悉了数据分析流程、掌握了数据分析方法和技能,并结合工作需求进行实际应用的研究,但由于资源条件、设备工具和水平所限,本文在数据分析,模型选择及描述等方面尚有很多不足,需要在未来研究中进一步验证价值,提升研究的有效性和科学性及工作实际应用性。通过数据分析方法,在一定程度上拓展相关领域的分析视角和方法,充分挖掘数据价值,产生数据效益,促进行业的发展。

?