[TOC]
# 點擊流概念
點擊流這個概念更注重用戶瀏覽網站的整個流程,網站日志中記錄的用戶點擊就像是圖上的“點”,而點擊流更像是將這些“點”串起來形成的“線”。也可以把“點”認為是網站的Page,而“線”則是訪問網站的Session。所以點擊流數據是由網站日志中整理得到的,它可以比網站日志包含更多的信息,從而使基于點擊流數據統計得到的結果更加豐富和高效。

# 點擊流模型生成
點擊流數據在具體操作上是由散點狀的點擊日志數據梳理所得,從而,點擊數據在數據建模時應該存在兩張模型表(Pageviews和visits):
1. 用于生成點擊流的原始訪問日志表

2. 頁面點擊流模型Pageviews表

3. 點擊流模型Visits表(按session聚集的頁面訪問信息)

這就是點擊流模型。當WEB日志轉化成點擊流數據的時候,很多網站分析度量的計算變得簡單了,這就是點擊流的“魔力”所在。基于點擊流數據我們可以統計出許多常見的網站分析度量
# 如何進行數據分析
網站數據分析整體來說是一個內涵非常豐富的體系,其整體過程是一個金字塔結構:

改善網站(電商、社交、電影、小說)的運營,獲取更高投資回報率(ROI)
## 網站流量質量分析
流量對于每個網站來說都是很重要,但流量并不是越多越好,應該更加看重流量的質量,換句話來說就是流量可以為我們帶來多少收入

## 網站流量多維度細分
細分是指通過不同維度對指標進行分割,查看同一個指標在不同維度下的表現,進而找出有問題的那部分指標,對這部分指標進行優化。

## 網站內容及導航分析
對于所有網站來說,頁面都可以被劃分為三個類別:
* 導航頁
* 功能頁
* 內容頁
首頁和列表頁都是典型的導航頁;
站內搜索頁面、注冊表單頁面和購物車頁面都是典型的功能頁,
而產品詳情頁、新聞和文章頁都是典型的內容頁。
比如從內容導航分析中,以下兩類行為就是網站運營者不希望看到的行為:

第一個問題:訪問者從導航頁進入,在還沒有看到內容頁面之前就從導航頁離開網站,需要分析導航頁造成訪問者中途離開的原因。
第二個問題:訪問者從導航頁進入內容頁后,又返回到導航頁,說明需要分析內容頁的最初設計,并考慮在內容類頁面提交交叉信息推薦。
## 網站轉化及漏斗分析
所謂轉化,即網站業務流程中的一個封閉渠道,引導用戶按照流程最終實現業務目標(比如商品成交);而漏斗模型則是指進入渠道的用戶在各環節遞進過程中逐漸流失的形象描述;
對于轉化渠道,主要進行兩部分的分析:
訪問者的流失和迷失
1. 助力和流失

造成流失的原因很多,如:
不恰當的商品或活動推薦
對支付環節中專業名詞的解釋、幫助信息等內容不當
2. 迷失

造成迷失的主要原因是轉化流量設計不合理,訪問者在特定階段得不到需要的信息,并且不能根據現有的信息作出決策
# 流量分析常見指標
課程中涉及的分析指標主要位于以下幾大方面:
1. 基礎分析(PV,IP,UV)
PV(訪問量):即Page View, 即頁面瀏覽量或點擊量,用戶每次刷新即被計算一次。
IP(獨立IP):指獨立IP數。00:00-24:00內相同IP地址之被計算一次。
UV(獨立訪客):即UniQue Visitor,訪問您網站的一臺電腦客戶端為一個訪客。 00:00-24:00內相同的客戶端只被計算一次。
* 趨勢分析:根據選定的時段,提供網站流量數據,通過流量趨勢變化形態,為您分析網站訪客的訪問規律、網站發展狀況提供參考。
* 對比分析:根據選定的兩個對比時段,提供網站流量在時間上的縱向對比報表,幫您發現網站發展狀況、發展規律、流量變化率等。
* 當前在線:提供當前時刻站點上的訪客量,以及最近15分鐘流量、來源、受訪、訪客變化情況等,方便用戶及時了解當前網站流量狀況。
* 訪問明細:提供最近7日的訪客訪問記錄,可按每個PV或每次訪問行為(訪客的每次會話)顯示,并可按照來源、搜索詞等條件進行篩選。 通過訪問明細,用戶可以詳細了解網站流量的累計過程,從而為用戶快速找出流量變動原因提供最原始、最準確的依據。


2. 來源分析
* 來源分類:提供不同來源形式(直接輸入、搜索引擎、其他外部鏈接、站內來源)、不同來源項引入流量的比例情況。通過精確的量化數據,幫助用戶分析什么類型的來路產生的流量多、效果好,進而合理優化推廣方案。
* 搜索引擎:提供各搜索引擎以及搜索引擎子產品引入流量的比例情況。從搜索引擎引入流量的的角度,幫助用戶了解網站的SEO、SEM效果,從而為制定下一步SEO、SEM計劃提供依據。
* 搜索詞:提供訪客通過搜索引擎進入網站所使用的搜索詞,以及各搜索詞引入流量的特征和分布。幫助用戶了解各搜索詞引入流量的質量,進而了解訪客的興趣關注點、網站與訪客興趣點的匹配度,為優化SEO方案及SEM提詞方案提供詳細依據。
* 最近7日的訪客搜索記錄,可按每個PV或每次訪問行為(訪客的每次會話)顯示,并可按照訪客類型、地區等條件進行篩選。為您搜索引擎優化提供最詳細的原始數據。
* 來路域名:提供具體來路域名引入流量的分布情況,并可按“社會化媒體”、“搜索引擎”、“郵箱”等網站類型對來源域名進行分類。 幫助用戶了解哪類推廣渠道產生的流量多、效果好,進而合理優化網站推廣方案。
* 來路頁面:提供具體來路頁面引入流量的分布情況。 尤其對于通過流量置換、包廣告位等方式從其他網站引入流量的用戶,該功能可以方便、清晰地展現廣告引入的流量及效果,為優化推廣方案提供依據。
* 來源升降榜:提供開通統計后任意兩日的TOP10000搜索詞、來路域名引入流量的對比情況,并按照變化的劇烈程度提供排行榜。 用戶可通過此功能快速找到哪些來路對網站流量的影響比較大,從而及時排查相應來路問題。
- linux
- 常用命令
- 高級文本命令
- 面試題
- redis
- String
- list
- hash
- set
- sortedSet
- 案例-推薦
- java高級特性
- 多線程
- 實現線程的三種方式
- 同步關鍵詞
- 讀寫鎖
- 鎖的相關概念
- 多線程的join
- 有三個線程T1 T2 T3,保證順序執行
- java五種線程池
- 守護線程與普通線程
- ThreadLocal
- BlockingQueue消息隊列
- JMS
- 反射
- volatile
- jvm
- IO
- nio
- netty
- netty簡介
- 案例一發送字符串
- 案例二發送對象
- 輕量級RPC開發
- 簡介
- spring(IOC/AOP)
- spring初始化順序
- 通過ApplicationContextAware加載Spring上下文
- InitializingBean的作用
- 結論
- 自定義注解
- zk在框架中的應用
- hadoop
- 簡介
- hadoop集群搭建
- hadoop單機安裝
- HDFS簡介
- hdfs基本操作
- hdfs環境搭建
- 常見問題匯總
- hdfs客戶端操作
- mapreduce工作機制
- 案列-單詞統計
- 局部聚合Combiner
- 案列-流量統計(分區,排序,比較)
- 案列-倒排索引
- 案例-共同好友
- 案列-join算法實現
- 案例-求topN(分組)
- 自定義inputFormat
- 自定義outputFormat
- 框架運算全流程
- mapreduce的優化方案
- HA機制
- Hive
- 安裝
- DDL操作
- 創建表
- 修改表
- DML操作
- Load
- insert
- select
- join操作
- 嚴格模式
- 數據類型
- shell參數
- 函數
- 內置運算符
- 內置函數
- 自定義函數
- Transform實現
- 特殊分割符處理
- 案例
- 級聯求和accumulate
- flume
- 簡介
- 安裝
- 常用的組件
- 攔截器
- 案例
- 采集目錄到HDFS
- 采集文件到HDFS
- 多個agent串聯
- 日志采集和匯總
- 自定義攔截器
- 高可用配置
- 使用注意
- sqoop
- 安裝
- 數據導入
- 導入數據到HDFS
- 導入關系表到HIVE
- 導入表數據子集
- 增量導入
- 數據導出
- 作業
- 原理
- azkaban
- 簡介
- 安裝
- 案例
- 簡介
- command類型單一job
- command類型多job工作流flow
- HDFS操作任務
- mapreduce任務
- hive腳本任務
- hbase
- 簡介
- 安裝
- 命令行
- 基本CURD
- 過濾器查詢
- 系統架構
- 物理存儲
- 尋址機制
- 讀寫過程
- Region管理
- master工作機制
- 建表高級屬性
- 與mapreduce結合
- 協處理器
- 點擊流平臺開發
- 簡介
- storm
- 簡介
- 安裝
- 集群啟動及任務過程分析
- 單詞統計
- 并行度
- ACK容錯機制
- ACK簡介