数据解析在线

| 热门资讯 |

【www.guakaob.com--热门资讯】

《史上最全的大数据解析》
数据解析在线 第一篇

大 数 据

目录

大数据概念:史上最全大数据解析 ............................................... 1

大数据概念:史上最全大数据解析 现如今,我们身边很多人对一些热门的新技术、新趋势往往趋之若鹜却又很难说得透彻,

比如大数据,如果被问大数据和你有什么关系,估计很少能说出一二三来。究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然,在聊天时不会显得很“土鳖”;二是在工作和生活环境中,真正能参与实践的大数据案例实在太少了,所以大家没有机会花时间去知其所以然。

我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆积起来形成毫无价值的转述或评论,我很真诚的希望进入事物探寻本质。

如果你说大数据就是数据大,或者侃侃而谈4个V,也许很有深度的谈到BI或预测的价值,又或者拿Google和Amazon举例,技术流可能会聊起Hadoop和Cloud Computing,不管对错,只是无法勾勒对大数据的整体认识,不说是片面,但至少有些管窥蠡测、隔衣瘙痒了。??也许,“解构”是最好的方法。

怎样结构大数据?

首先,我认为大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。

其次,想要系统的认知大数据,必须要全面而细致的分解它,我着手从三个层面来展开:

1

第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。我会从大数据的

特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。

第二层面是技术,技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。

第三层面是实践,实践是大数据的最终价值体现。我将分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。

和大数据相关的理论

特征定义

最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。【数据解析在线】

其实这些V并不能真正说清楚大数据的所有特征,下面这张图对大数据的一些相关特性做出了有效的说明。

古语云:三分技术,七分数据,得数据者得天下。先不论谁说的,但是这句话的正确性已经不用去论证了。维克托·迈尔-舍恩伯格在《大数据时代》一书中举了百般例证,都是为了

2

说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。

那么,什么是大数据思维?维克托·迈尔-舍恩伯格认为,1-需要全部数据样本而不是抽样;2-关注效率而不是精确度;3-关注相关性而不是因果关系。

阿里巴巴的王坚对于大数据也有一些独特的见解,比如,

“今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。” “非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。” “你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。”

特别是最后一点,我是非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。

有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。

价值探讨

大数据是什么?投资者眼里是金光闪闪的两个字:资产。比如,Facebook上市时,评估机构评定的有效资产中大部分都是其社交网站上的数据。

如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

Target 超市以20多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确的推断出孕妇的具体临盆时间,这样Target的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷。 Target的例子是一个很典型的案例,这样印证了维克托·迈尔-舍恩伯格提过的一个很有指导意义的观点:通过找出一个关联物并监控它,就可以预测未来。Target通过监测购买者购买商品的时间和品种来准确预测顾客的孕期,这就是对数据的二次利用的典型案例。如果,我们通过采集驾驶员手机的GPS数据,就可以分析出当前哪些道路正在堵车,并可以及时发布道路交通提醒;通过采集汽车的GPS位置数据,就可以分析城市的哪些区域停车较多,这也代表该区域有着较为活跃的人群,这些分析数据适合卖给广告投放商。

不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉。

从大数据的价值链条来分析,存在三种模式:

1- 手握大数据,但是没有利用好;比较典型的是金融机构,电信行业,政府机构等。

【数据解析在线】

2- 没有数据,但是知道如何帮助有数据的人利用它;比较典型的是IT咨询和服务企业,比如,埃森哲,IBM,Oracle等。【数据解析在线】

3- 既有数据,又有大数据思维;比较典型的是Google,Amazon,Mastercard等。

3

未来在大数据领域最具有价值的是两种事物:1-拥有大数据思维的人,这种人可以将大数据的潜在价值转化为实际利益;2-还未有被大数据触及过的业务领域。这些是还未被挖掘的油井,金矿,是所谓的蓝海。

Wal-Mart作为零售行业的巨头,他们的分析人员会对每个阶段的销售记录进行了全面的分析,有一次他们无意中发现虽不相关但很有价值的数据,在美国的飓风来临季节,超市的蛋挞和抵御飓风物品竟然销量都有大幅增加,于是他们做了一个明智决策,就是将蛋挞的销售位置移到了飓风物品销售区域旁边,看起来是为了方便用户挑选,但是没有想到蛋挞的销量因此又提高了很多。

还有一个有趣的例子,1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。那几乎是重复着千篇一律枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少,枪支、物资多少??有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句:“为什么那里缴获的短枪与长枪的比例比其它战斗略高?”“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!”果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。

这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长。

现在和未来

我们先看看大数据在当下有怎样的杰出表现:

大数据帮助政府实现市场经济调控、公共卫生安全防范、灾难预警、社会舆论监督; 大数据帮助城市预防犯罪,实现智慧交通,提升紧急应急能力;

大数据帮助医疗机构建立患者的疾病风险跟踪机制,帮助医药企业提升药品的临床使用效果,帮助艾滋病研究机构为患者提供定制的药物;

大数据帮助航空公司节省运营成本,帮助电信企业实现售后服务质量提升,帮助保险企业识别欺诈骗保行为,帮助快递公司监测分析运输车辆的故障险情以提前预警维修,帮助电力公司有效识别预警即将发生故障的设备;

大数据帮助电商公司向用户推荐商品和服务,帮助旅游网站为旅游者提供心仪的旅游路线,帮助二手市场的买卖双方找到最合适的交易目标,帮助用户找到最合适的商品购买时期、商家和最优惠价格;

大数据帮助企业提升营销的针对性,降低物流和库存的成本,减少投资的风险,以及帮助企业提升广告投放精准度;

大数据帮助娱乐行业预测歌手,歌曲,电影,电视剧的受欢迎程度,并为投资者分析评估拍一部电影需要投入多少钱才最合适,否则就有可能收不回成本;

大数据帮助社交网站提供更准确的好友推荐,为用户提供更精准的企业招聘信息,向用户推荐可能喜欢的游戏以及适合购买的商品。

4

其实,这些还远远不够,未来大数据的身影应该无处不在,就算无法准确预测大数据终会将人类社会带往到哪种最终形态,但我相信只要发展脚步在继续,因大数据而产生的变革浪潮将很快淹没地球的每一个角落。

比如,Amazon的最终期望是:“最成功的书籍推荐应该只有一本书,就是用户要买的下一本书。”

Google也希望当用户在搜索时,最好的体验是搜索结果只包含用户所需要的内容,而这并不需要用户给予Google太多的提示。

而当物联网发展到达一定规模时,借助条形码、二维码、RFID等能够唯一标识产品,传感器、可穿戴设备、智能感知、视频采集、增强现实等技术可实现实时的信息采集和分析,这些数据能够支撑智慧城市,智慧交通,智慧能源,智慧医疗,智慧环保的理念需要,这些都所谓的智慧将是大数据的采集数据来源和服务范围。

未来的大数据除了将更好的解决社会问题,商业营销问题,科学技术问题,还有一个可预见的趋势是以人为本的大数据方针。人才是地球的主宰,大部分的数据都与人类有关,要通过大数据解决人的问题。

比如,建立个人的数据中心,将每个人的日常生活习惯,身体体征,社会网络,知识能力,爱好性情,疾病嗜好,情绪波动??换言之就是记录人从出生那一刻起的每一分每一秒,将除了思维外的一切都储存下来,这些数据可以被充分的利用:

医疗机构将实时的监测用户的身体健康状况;

教育机构更有针对的制定用户喜欢的教育培训计划;

【数据解析在线】

服务行业为用户提供即时健康的符合用户生活习惯的食物和其它服务;

社交网络能为你提供合适的交友对象,并为志同道合的人群组织各种聚会活动;

政府能在用户的心理健康出现问题时有效的干预,防范自杀,刑事案件的发生;

金融机构能帮助用户进行有效的理财管理,为用户的资金提供更有效的使用建议和规划; 道路交通、汽车租赁及运输行业可以为用户提供更合适的出行线路和路途服务安排; ??

当然,上面的一切看起来都很美好,但是否是以牺牲了用户的自由为前提呢?只能说当新鲜事物带来了革新的同时也同样带来了“病菌”。比如,在手机未普及前,大家喜欢聚在一起聊天,自从手机普及后特别是有了互联网,大家不用聚在一起也可以随时随地的聊天,只是“病菌”滋生了另外一种情形,大家慢慢习惯了和手机共渡时光,人与人之间情感交流仿佛永远隔着一张“网”。

大数据隐私

你或许并不敏感,当你在不同的网站上注册了个人信息后,可能这些信息已经被扩散出去了,当你莫名其妙的接到各种邮件,电话,短信的滋扰时,你不会想到自己的电话号码,邮箱,生日,购买记录,收入水平,家庭住址,亲朋好友等私人信息早就被各种商业机构非法存储或贱卖给其它任何有需要的企业或个人了。

更可怕的是,这些信息你永远无法删除,它们永远存在于互联网的某些你不知道的角落。除非你更换掉自己的所有信息,但是这代价太大了。

用户隐私问题一直是大数据应用难以绕开的一个问题,如被央视曝光过的分众无线、罗维邓白氏以及网易邮箱都涉及侵犯用户隐私。目前,中国并没有专门的法律法规来界定用户隐私,

5

《如何通过数据进行网站分析》
数据解析在线 第二篇

第25期phpwind在线访谈——如何通过数据进行网站分析

嘉宾介绍:

高代鹏,曾供职于国内一家第三方数据公司,主要负责规划为新浪、搜狐、网易等主流媒体型网站提供流量监测和广告效果监测的数据统计产品,以及数据分析和解读,现任phpwind数据平台产品经理。

新浪微博:

策划兼主持人:

李星梅,网名:小米渣, 阿里云phpwind自媒体运营,站长运营辅导、万人在线访谈栏目负责人。新浪微博:

访谈时间:2010年11月24日 14:00

访谈直播:互联网交流分享—53442054

主办单位:阿里云phpwind

访谈流程:

第一部分:嘉宾自我介绍

第二部分:嘉宾解析如何通过数据进行网站分析

第三部分:嘉宾与网友互动

访谈纲要:

Phpwind小米渣:各位朋友们,大家下午好!我是主持人小米渣。以搭建一个开放、共享平台,串联站长们智慧,汇聚业内精英思想为主旨的phpwind运营辅导在线访谈栏目又与大家见面了。

鉴于数据在网站运营中越来越重要的作用,今天我们邀请了资深数据分析师、数据统计产品经理高代鹏先生来为大家讲解如何通过数据进行网站分析,希望大家有所收获!

关于访谈规则,请允许我再次老生常谈:

鉴于本次访谈同步在近160个QQ群,约4万——8万互联网从业朋友在线阅读,为了给所有关注的朋友一个良好的观阅体验,在主持人与嘉宾访谈过程中,请尽量不要发言(欢迎掌声给力)以免干扰嘉宾。

有问题需要向嘉宾探讨的朋友,欢迎猛烈小窗提交给所在群主持人,我们会按照大家提问的时间及相关性进行排序,在第三部分网友互动环节嘉宾会进行回复,且嘉宾互动过的网友将获得神秘礼品一份!

Phpwind小米渣:非常荣幸邀请到您做客phpwind运营辅导在线访谈,听众朋友们都期待对您有更多的了解,请介绍一下自己及职业经历?

云统计高代鹏:

大家好,我是高代鹏,是phpwind数据平台产品经理。曾供职于国内一家第三方数据公司,主要负责大型媒体类网站统计产品的规划、网站的数据分析和行业数据的解读。

很荣幸能与大家一起交流网站的数据分析,这是一门新兴学科,05年起国内才崭露头角。希望通过本次访谈能让大家了解到一些常用的统计方法、分析思路、体会数据的魅力。

Phpwind小米渣:首先,请代鹏介绍一下对于网站产品,日常监控范围内的常见数据种类及含义?

【数据解析在线】

云统计高代鹏:

网站的监测指标有很多,一般的统计产品都包含大约20-30个指标。

这些指标可以分成以下五个类别:用户规模、用户粘性、用户来源、网站受众属性、网站内容属性;

用户规模主要是通过PV、UV和独立IP三个指标衡量;

用户粘性主要通过回访率、访问频率和访问深度三个指标衡量;

用户来源主要通过直接来源和站外来源两个指标衡量,其中站外来源常被分为搜索引擎和其他网站;

网站受众属性主要通过用户的性别、年龄、收入、职业以及地域分布等指标衡量;

网站内容属性主要通过最常访问内容、入口页和出口页三个指标衡量;

Phpwind小米渣:感谢代鹏精彩的讲解,以上您所谈的对于互联网产品,最基础的流量指标,也就是关键数据有哪些?请结合实例谈一下这些数据的重要性。

云统计高代鹏:

其实每个数据指标都有他的实际意义,而要说最基础、最关键的流量指标那应该是PV和UV。PV和UV是反映站点的用户规模,在很多时候与收入直接相关。这两个指标的重要性就不在过多描述了,也经常有人问起对这两个指标的分析频率和如何分析。

频率可能不同的网站、站长习惯不同,之前在给新浪和搜狐提供分析时,是需要每周、每月、每季度都提供分析报告,在遇到重大事件时更需要专项的数据分析。

以月的数据为切入点,介绍三种常用的分析思路:

首先分析PV/UV的比值同最近三个月的比较。如果发现这个比值明显下降,而UV变化不大,说明PV的下将主要是每个用户单次访问的页面数减少,这种情况下网站的内容或结构急需调整,不然等用户大量流失时已晚。

其次查看PV、UV的环比变化率,分析网站最近的运营是否稳定,是否保持持续的增长。

最后还要与行业对比,才能发现自己的状况是真的好,还是表象;如某个月你的用户规模增长了10%,但行业均值确增长15%,那我们要努力的地方还有很多。

Phpwind小米渣:嗯,刚才你谈到用户单次访问页面减少时可能需要进行网站内容或结构调整,那么 网站结构是否合理,具体通过什么样的数据指标去看?如何去分析用户关注的内容?

云统计高代鹏:

网站结构是指网站中页面间的层次关系;按性质可分为逻辑结构及物理结构。网站结构对网站的搜索引擎友好性及用户体验有着非常重要的影响。

小站初期往往希望更快地找到自身定位,除了站长自身的资源和优势,还需要我们通过数据找到用户最感兴趣的内容,并且最大限度地引导他们浏览、回复这些内容。

这就需要我们对网站内容和网站结构进行分析:例如可从以下几个角度分析首页的结构是否合理:

1、查看首页作为网站入口的比例;

2、查看首页流量在全站的比例;

3、查看首页的二跳率和弹出率;

4、查看首页带给其他版块或频道的流量。

经过几次这样的调整再分析的过程,最终找到最优的解决方法。 通过对用户最常访问内容的分析,更能发现运营中存在的问题。如果发现TOP5版块的主题量和流量占全站比例不足50%,或者TOP20页面的回复量和流量占全站比例不足50%,或者流量TOP20页面中有超过10个页面来自非主流版块等等,类似的数据表现都可以说明用户的关注点太过分散,网站没能有效的引导用户,网站的定位与用户的兴趣点存在偏差。

Phpwind小米渣:感谢分享,您刚才讲解的需要分析用户偏好,那么对于网站产品,一般的用户行为相关数据有哪些?怎样通过这些数据来分析用户进而分析网站产品?

云统计高代鹏:

用户在网站的每一次点击、回复乃至鼠标的每一次滑动,都是用户的访问行为;用户的访问行为是用户心理最直白的显现,更是我们网站产品设计的试金石。

从用户行为来讲,除了注册,登陆,其他数据会有访问深度、访问次数分布、访问停留时长分布、回访天数分布、每小时访问页数分布等等;通过分析网站用户各种行为的次数和人数数据,了解用户使用你的网站和产品情况,用户使用多的是哪种行为?是否符合产品原型的设计?

譬如,注册量是衡量新用户发展的一个数据;登陆是衡量用户使用网站和产品的一个主要活跃数据;评论次数反应你的网站用户互动情况,访问深度反映用户对网站内容的兴趣度等。

那究竟这些指标数值的多少代表什么?是否有衡量的标准?因不同行业、不同类型的网站、以及网站处于不同的发展阶段衡量的标准都不同,所以对这些指标要动态的分析;分享一下媒体型网站的相关数据,供大家参考。一个用户平均每天访问5-7次,每次访问8-10个页面,每次停留500秒左右,回访率在33%-38%之间。

Phpwind小米渣:古语有知己知彼百战百胜,网站最核心的价值是为用户提供服务,而用户属性是我们了解用户的一条渠道。那么请教代鹏一般网站产品的用户属性数据有哪些,能否结合实例数据图表等说明如何通过分析用户属性数据优化产品、协助运营?

云统计高代鹏:

用户属性数据一般包括用户所属的地域、用户的性别、年龄、收入、职业以及学历;通过对网站注册用户属性数据的分析,可帮助网站优化产品,协助运营,提升用户对网站的粘性;这里会用到网站数据分析的基本思想:细分;其实细分可于用户数据分析的方方面面,对发现的问题,都要层层拨开,找出事情的缘由,这就是细分的思想。

比如通过IP定位,知道哪些省份、城市以及哪个区域的用户在访问,不同地域的用户关注的内容是否有差异,通过对这个数据的分析,可指导市场部门具体选定在哪个城市做推广或者活动效果更好。

比如某个地方性的网站,在春节期间PV未降反而增长了20%,提供我们对这20%新用户的监测,发现IP地址都来源于本地,进而我们可以判断这20%的用户是从外地返乡的,我们在运营时,可为这 20%的新用户有针对性的提供信息;比如提供返城火车票的信息服务,提供儿童教育类商家的信息等等。【数据解析在线】

Phpwind小米渣:嗯,很赞同细分思想,数据运营要的就是针尖上跳舞的艺术,

《网站流量统计数据解析》
数据解析在线 第三篇

淘宝上什么是PV,什么是UV,什么是IP. 网店流量统计的各种数据!

pv流量 什么是PV?

解答:PV是指页面刷新的次数,每一次页面刷新,就算做一次pv流量。

PV高一定代表来访者多吗?

解答:不一定如此,一般来说,PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量,例如,同一个来访者通过不断的刷新页面,也可以制造出非常高的PV。

PV(page view),即页面浏览量,或点击量;通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标;当然,有时还会同时考察另外一个指标,即uv(unique visitor),指访问某个站点或点击某条新闻的不同IP地址的人数。

PV之于网站,就像收视率之于电视,从某种程度上已成为投资者衡量商业网站表现的最重要尺度。从长远看,很多网站也意识到,PV的追求需要和品牌的打造结合起来;但现代商业行为在投资者急功近利的评判压力下,往往无奈为了使PV提升而不择手段。

一条新闻发布以后,其PV便可以加以跟踪,通常是每5分钟统计一次。不同网站的不同频道,对其所发布新闻的PV表现有一个大致的评判尺度。新闻发布后,一般PV值总有一个上升的过程。可以从不同时段来计算PV的单位时间变化幅度,有经验的网络编辑,经过几个5分钟的数据积累,便能大致预料到这条新闻的PV峰值水平。如果这个水平不能令人满意,则编辑就要采取一些手段,如“优化”标题、增加图片、挪动位置等。一般来说,通过这样的“处理”,一条新闻的PV表现能有所改善,达到新的高峰。也就是说,网络新闻的编辑手段影响着PV值。

还有哪些因素对PV有影响呢?至少还有这些因素:新闻发布的时间。不同的时间段,上网的人数不同,访问该站点的人数也不同,因此,有时PV的涨落,其主要贡献,在于不同时段上网人数的自然波动。同样一条新闻,在不同的时段发布,PV就会有差别。

不同时段上网的人,其人口特征(性别、年龄、教育程度、阅读旨趣等)不同,所以,同样是一万个上网的人,甚至同样是对某个网站的一万次访问,不同时段,这一万次访问在不同频道/内容上的分布是有差别的。所以PV的变化,与这些因素导致的变化有关。

访问的周期。对于一些常浏览的网站,我们可能一天之中会访问几次,这中间有一定的时间间隔。这个间隔,很多时候和人们的现实工作节奏有关系。比如,不少人一上班会抽空浏览一下新闻,第二次再来看看又有什么新闻的时候,往往是上午中间休息时,甚至是午饭后的休息时间。因此,即使其他因素不变,由于人们回访网站的周期性,也会对新闻或网站的PV带来影响。当然,由于不同的人回访的周期长短不一、时段不一,这个影响因素未必会导致明显的波动,而可能分散在不同时段的PV表现中,但可以肯定的是,任何一个PV数据,也有这种回访周期的因素所起的作用。

搭便车因素。比如一些突发事件,会导致人们对某一网站的访问增加,但这些访问的初衷,本只是突发事件相关新闻。然而由于人们的新闻消费,往往具有不可预期性,所以常见的现象是,人们在看完想看的新闻后,还会顺带看看其他的。这一因素,也可能对某条新闻(与突发事件无关)的PV有所贡献。

最后,偶然因素也对PV有一定影响,比如天气因素,比如非典期间等等。

由此看来,一个简单的PV数据,其实是多种因素综合贡献的结果,所以有时的PV涨落,实在不是完全可以通过编辑手段来加以引导和影响的。知道这一点很重要,因为这告诉我们,盲目地、不加具体分析地以PV来衡量成败好坏,是不合理的。在社会科学研究中,这种区分不同因素对某一个现象的贡献,就是所谓的详析模式。很多看似不变的东西,其实内部构成比例上发生了很大的变化。而有些看似变化的东西,其相对关系其实没有什么变化,只是一种单纯的数量上的涨落。

UV

UV(独立访客):即Unique Visitor,访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。

雅虎统计指数(YSR):通过来源带来的PV、UV、IP,以及用户停留时间、访问情况、用户行为等因素综合分析按不同权重计算得到的,评判来源质量的指数,指数越高,表明来源质量越高。

现在大多数的统计工具只统计到IP和PV的层面上,因为在大多情况下IP与UV数相差不大。但由于校园网络、企业机关等一些部门的特殊性,IP已经很难真实的反映网站的实际情况,所以引入了更加精确的UV这个概念。

所有UV与PV对于是使用真实IP上网的用户,数值是相同的。

但是如果访问你的站点中有通过“网络地址转换”(NAT)上网的用户,那么这两个值就不同的。所有对于国内站长来说,这个UV值还是很有意义的。

那么什么情况下UV 会比IP少?

一般情况下,统计UV数应该大于等于IP数,但有些情况下,有可能UV数会小于IP数:

1) IP地址是绝对的,从TCP链路上取的,真实的,不唯一的;

2) UV设置的cookie,随机设置的,可重复的,只是重复概率足够小;

3) 移动笔记本不时的更换IP,可以导致这种问题;

4) 客户端禁用cookie或者客户端安全级别高会导致cookie设置不上,会出现这种问题;

5) 如果采用的图片统计,由于拿不到cookie会出现这种问题;

再多说一些东西:

雅虎统计指数(YSR):通过来源带来的pv、uv,ip,以及用户停留时间、访问情况、用户行为等因素综合分析按不同权重计算得到的,评判来源质量的指数,指数越高,表明来源质量越高。

新访客:某客户端首次访问为一个新访客。

最近访客:最近一段时间内访问您网站的客户端。目前显示50条。

当前在线人数:15分钟内在线访问的UV数。

24小时独立IP:指每小时独立的IP地址。因为该数据每个小时是独立的,所以叫24小时独立的IP。

例如192.168.1.1 0点-1点访问了您网站 在这个时段算一个IP。

如果192.168.1.1 0点-1点 再次访问您的网站 去重不计算IP。

如果192.168.1.1 1点-2点 又访问您的网站 在这个时段也算一个IP。

最高IP : 指选择时间段范围内,某日访问IP最多的数值。

最高PV:指选择时间段范围内,某日访问量最高的数值。

日均流量:指选择时间范围内,平均每日流量。 (日均流量=总访问量/总天数)

人均访问量:指选择时间范围内,每个访客访问网站的PV数。(计算公式:人均访问量=访问量/唯一访客数)。

访问过程:每个访问者从进入您的网站开始访问,一直到最后离开您的网站,整个过程中发生的一切点击访问行为,称为一次访问过程。

访问入口:每次访问过程中,用户进入的第一个页面为访问入口页面。

访问出口:每次访问过程中,用户结束访问,离开前点击的最后一个页面为访问出口页面。

平均停留时间:所有访客的访问过程,访问持续时间的平均值。

平均访问页数:所有访客的访问过程,连续访问页面数的平均值。

贡献用户数:每个访问来源带来的独立访客数,即UV数;

贡献IP数:每个访问来源带来的独立IP数。

贡献PV数:每个访问来源带来的访客的一切后续访问行为所产生的PV数。

本文来源:http://www.guakaob.com/news/453848.html

    热门标签

    HOT