数字期刊阅读量统计路径及方法初探
以龙源期刊网为例
作者:陈丹 杨萌
从20世纪90年代中期开始,个人电脑和互联网络在我国民众中迅速普及。据中国互联网信息中心(CNNIC)统计,截止到2011年6月底,中国网民规模达到4.58亿。这不仅仅体现了信息技术的发展,实际上,计算机网络应用的大众化正在悄然改变着人们获取信息、学习知识的途径,也深刻影响着人们的阅读习惯和思维方式。
龙源作为先行者之一,在中国传统期刊的数字化出版事业,尤其是互联网出版上积极实践、创新发展,自2005年起,定期发布期刊网络传播TOP100数据,并向各个合作刊社提供年度网络传播数据分析报告,已经形成了互联网时代期刊调研的有效途径。
与此同时,网络的蓬勃发展所形成的新的读者群和内容生态环境,给传统期刊带来的巨大的发展空间。根据中国新闻出版研究院发布的《2010-2011 中国数字出版年度报告》数据显示,2010年中国数字出版产业总体收入为1051.79亿,其中数字期刊为7.49亿,这说明数字期刊和期刊数字化阅读已为广大读者所接受。
在这一大背景下,出现了多家颇具规模的专业期刊网络传播平台和众多的个性化期刊数字化传播网站,许多期刊在进行传统出版的同时,也实现了数字化传播发行,一个新的内容产业已经形成。但是目前为止,在这个领域,还缺乏对数字期刊的发行统计规则,这对行业转型的把控、产业的估量、著作人的版权收益统计、内容编辑加工质量评估、传播的人群对象分析等一系列问题显得缺乏依据,已阻碍了中国数字出版发展的进程,因此需要尽快制定一个统一的标准,对数字期刊的阅读量进行科学的统计分析,以此促进各方的利益分成,以科学发展观推进数字出版。
一.数字期刊阅读量的提出
1.现有数字化产品浏览量的统计方法梳理
新闻出版总署2010年发布的《关于加快我国数字出版产业发展的若干意见》(新出政发[2010]7号 )文件提出:数字出版是指利用数字技术进行内容编辑加工,并通过网络传播数字内容产品的一种新型出版方式,其主要特征为内容生产数字化、管理过程数字化、产品形态数字化和传播渠道网络化。只要使用二进制技术手段对出版的各个环节进行操作,应该都属于数字出版的范畴。因此,数字出版是传统出版业在内容和形式上的延伸和扩展,不仅大大丰富了出版物的内容和形式,也改变了传统出版物的生产方式和消费理念,直接创造出一些新的出版媒体形式。
作为开展数字出版的主要平台,各种类型的网站成为目前较为典型的数字出版物。关于网页浏览量的统计指标和方法,目前主要有以下几种:①访问用户数(Users Reach),指通过Internet访问某个特定网站的人数。②页面浏览数(Page Views),是指用户访问了某个特定网站的多少个页面。如Alexa发布的排名结果的计算就主要取决于访问用户数(Users Reach)和页面浏览数(Page Views)。③UV(独立访客):Unique Visitor,访问网站的一台电脑客户端为一个访客,00:00-24:00内相同的客户端只会被计算一次。④IP(独立IP):指独立IP数,00:00-24:00内相同IP地址被计算一次。如雅虎统计指数(YSR)就通过PV、UV、IP,以及用户停留时间、访问情况、用户行为等因素综合分析按不同权重计算来评判来源质量的指数,指数越高,表明来源质量越高。此外还有流量:指网络上有多少资料正在被传递。浏览:指用户所用浏览器向服务器要求下载某一咨询时,每按下一次鼠标就浏览一次。这些指标和方法多用于评估网络广告。
但是,对于数字期刊浏览量以及阅读量的统计和评价,目前并没有较为科学和权威的标准。从2005年起,龙源期刊网用文本全文阅读的页面浏览量作为标准,衡量读者对龙源期刊网上内容的接受程度,并统计出每年的TOP100期刊和TOP100文章。但是,这种统计方法是否全面?数字化内容的浏览与阅读量之间有何关系,如何较为科学地统计数字期刊的阅读情况?本文,将以龙源期刊网为例对数字期刊的阅读量的统计路径和方式进行分析。
2.数字期刊阅读量的界定
阅读是从书面材料中获取信息的过程,是读者和文本的对话。阅读是一种主动的过程,是由阅读者根据不同的目的加以调节控制的。对于传统期刊的阅读,无论是发行者,还是广告商,都主要以该期刊的发行量为考量指标。同理,对于数字期刊的阅读,主要是考量阅读主体(读者)与数字化文本相互交流信息与知识的程度,也即数字期刊中数字内容被网民获取的信息量多少。因此,与前面涉及的网页浏览量相比,还是有所不同的。由于浏览包括主动、被动浏览(如自动弹出网页等),浏览时读者对呈现内容的接受程度也有所不同,因此,本文建议将“有效浏览量”与“阅读量”等同起来,如在读者进行数字期刊浏览时,只有进行有效的浏览量,才可以作为数字期刊阅读量进行统计。
通过前面的论述可知,目前对于如何统计网页的浏览量,已有一些较为公认的方法和指标,那么,如何对浏览的“有效”性进行考量,即对本文提出的“数字期刊阅读量”进行统计,是本文要研究的重点。数字期刊阅读量的统计,应以人们阅读数字期刊中的文章数为基本单位,包括对整本刊物(原貌版)的付费点击次数、对期刊中某篇文章(文章版)的付费点击次数、对其他类型(语音版、手机版等不同产品版本)的付费点击次数以及用户对期刊中某篇文章(文章版)的片段阅读次数、对整本刊物(原貌版)的浏览次数等各种要素。
二、龙源期刊网数字化阅读现状分析
1.龙源期刊网数字化阅读路径
作为国内数字期刊的领跑者之一,龙源期刊网积极参与、促进期刊的网络传播,依靠强大的技术支持,为3000多种合作期刊定期提供详细的内容传播数据。这些数据均来自于计算机网络系统对用户阅读行为自动进行的统计,科学、客观、真实。
龙源期刊网在向社会开放的内容具有丰富多彩的呈现方式,可以大大丰富读者的阅读体验。比如,原文原貌版,保留了杂志原有版式,用户可以翻页阅读,仿佛一册在手。另外还有文本版,文本版则将杂志中的文字还原到网页上,可以复制、粘贴,保留每一篇文章和重要的图标和图片,最适合边阅读、边收藏的网络读者。人声语音版充分利用网络多媒体的特色,聘请电台专业的播音员把优秀的杂志内容变成可用手机、MP3、MP4下载的有声杂志,可以向无暇上网的人以及盲人提供服务。此外,还有手机版和PAD版阅读。其中,用户在阅读原文原貌版时,可以进行浏览,也可以放大阅读。在龙源期刊网的显示数据中,放大阅读量即为用户付费整刊阅读量,浏览量是用户点击浏览杂志的数量(除封面外用户只能放大浏览四页)。用户在阅读文本版时,有文本全文阅读和片段阅读两种模式,与原貌版阅读类似,全文阅读也为付费阅读,片段阅读是用户对文章的一部分进行浏览(在龙源期刊网中,片段浏览字数是全文首字起到300字之后的第一个句号止)。手机版阅读则是指对期刊的付费阅读。
故用户在龙源期刊网上的阅读方式有两种:一种是用户在期刊网上付费点击的期刊次数,一种是读者点击浏览其中包括读者通过搜索引擎抓取的龙源相关页面从而进行点击的次数。其中,用户在龙源期刊网上付费阅读的期刊次数包括对整本刊物(原貌版)的付费点击次数、对期刊中某篇文章(文章版)的付费点击次数、以及对其他类型(语音版、手机版等不同产品版本)的付费点击次数。而用户在龙源期刊网上点击浏览的期刊次数包括对整本刊物(原貌版)的浏览,对期刊中某篇文章(文章版)的片段阅读次数。
同时,在龙源期刊网上还可以进行高级智能搜索,你可以通过不同的搜索功能搜索你感兴趣的文章,而不必阅读整本杂志。例如,你想阅读“家庭理财”或“数字出版”方面的相关文章,只要在网站上搜索关键词,所有杂志中的相关文章瞬间尽数集中在你眼前,帮助你跨越一本杂志的局限,进行全方位的立体化的阅读。
2.龙源期刊数字化阅读现状
(1)用户阅读类型多样化
我们对龙源期刊网提供的3618种期刊数据进行分析,其中包括综合894种,占全部期刊的25%;教育与学习类767种,占全部期刊的21%;专业刊物576种,占全部期刊的16%;文学文摘类421种,占全部期刊的12%;生活类413种,占全部期刊的11%;商业类330种,占全部期刊的9%;时政人物类151种,占全部期刊的4%;文化类66种,占全部期刊的2%。
从数据中我们可以看出,用户阅读内容的选择涉及多个领域,用户阅读类型呈现多样化。
(2)与全文文本阅读相比,某些杂志用户倾向于片段浏览
在龙源期刊网提供的3618种期刊数据中,超过八成期刊的片段浏览量大于全文阅读量。其中,教育与学习类、专业类期刊表现尤为明显,大多数的浏览量是片段浏览产生的,相关数据如下表所示:
表1:片段浏览量多于全文阅读量期刊占类型期刊数的比例
类型 | 期刊数 | 片段浏览量多于全文阅读量 | 占期刊数比例 |
综合 | 894 | 608 | 68.01% |
教育与学习 | 767 | 731 | 95.31% |
商业 | 330 | 290 | 87.88% |
生活 | 413 | 336 | 81.36% |
时政人物 | 151 | 118 | 78.15% |
文化 | 66 | 58 | 87.88% |
文学文摘 | 421 | 277 | 65.80% |
专业刊物 | 576 | 539 | 93.58% |
从数据中我们可以看出,对于教育与学习类、专业刊物类期刊,用户更倾向于浏览片段。进一步分析发现,某些期刊的片段浏览量远远多于全文阅读量。例如,《中国钓鱼》的片段浏览量为130678,但它的全文阅读量仅为236;《考试周刊》的片段浏览量为1166014,全文阅读量为83195,二者相差1082819之多。
(3)对于原貌版的阅读,用户热衷于浏览
我们对龙源期刊网提供的国内TOP100和国外TOP100期刊原貌版数据进行分析,结果发现,针对原貌版的阅读,在TOP100期刊中,所有的期刊浏览量均多于放大阅读量。为什么会出现这样的结果?因为放大阅读是要为整刊买单的,很多读者会在此却步。 前面我们提到,龙源期刊网是用文本付费阅读全文阅读的页面量统计TOP100排行的,这样会把一些原貌点击浏览量多而文本全文阅读量少的期刊排除在外,出现这样的结果也就不足为奇了。
正因为如此,我们才有必要提出一种更为全面的统计方法来计算数字期刊的阅读量。
三、数字期刊阅读量统计方法的构想
1.数字期刊阅读量统计要素组成
根据上面数据分析可以看出,不管是文本版阅读还是原貌版阅读,有很大一部分用户会选择片段阅读、期刊浏览。根据前面我们对数字期刊阅读量概念的界定,数字期刊阅读量主要是考量阅读主体(读者)与数字化文本相互交流信息与知识的程度,也即数字期刊中数字内容被网民获取的信息量多少。因此,除了全文阅读文本版期刊文章、整本下载阅读原貌版文章以及手机阅读文章的数量外,读者对期刊文本片段的阅读量以及对期刊原貌版的浏览量应该也成为数字化产品阅读量统计的有效组成部分。
2.数字期刊阅读量统计公式
前面提到,龙源期刊网目前统计数字化产品阅读量的方式是以付费与否为取舍标准的,这从TOP排行的角度,有一定的道理。但作为数字期刊的阅读量统计方式,我们有必要提出一种更为全面的统计方法来计算数字期刊的阅读量。
前面,我们已经提出数字期刊阅读量的概念。这里将对期刊阅读量的计算方法给予说明。
由于数字期刊阅读量以文章数为基本单位,对于龙源期刊网相关的换算,我们可以分为两类,一类是关于原貌版的换算,包括对整本刊物(原貌版)的付费点击次数、整本刊物(原貌版)的浏览次数进行换算,另一类是对文本版进行换算,即对某篇文章(文章版)的片段阅读次数进行换算。首先,我们对原貌版进行换算:
(1)对整本刊物(原貌版)的付费点击次数的换算
一本期刊一般会有40-50篇文章,但针对某一本期刊,文章数各不相同,我们用系数表示。
(2)对整本刊物(原貌版)的浏览次数进行换算
龙源期刊网上对于原貌版整本刊物的放大阅读除封面外只能有四页,把其换算成期刊数,应为4/期刊总页数。再根据我们对于原貌版整本刊物的换算方式,把原貌版浏览次数换算成数字期刊阅读量应该是4λ/期刊总页数。
(3)对某篇文章(文章版)的片段阅读次数的换算
龙源期刊网上的片段浏览字数是全文首字起到300字之后的第一个句号止,根据这一情况,我们取一个中间值350字。针对每一篇不同的文章,字数各不相同,所以我们用变系数来表示某篇文章片段阅读次数的换算:350/文章总字数。
另外,由于语音版的数据非常少,我们不将其作为计算数字期刊阅读量的组成成分。
那么,整本刊物(原貌版)的付费点击阅读与整本刊物(原貌版)的浏览次数之和换算成阅读文章数即为原貌版的有效阅读量,期刊中某篇文章(文章版)的付费点击次数与期刊中某篇文章(文章版)的浏览次数之和即为文本版的有效阅读量,二者之和再加上手机版的付费点击次数即为期刊的有效阅读量。
我们用字母表示数字期刊阅读量的计算方式:其中,
Q:数字期刊阅读量
A:期刊中某篇文章(文章版)的付费点击次数
B:期刊中某篇文章(文章版)的片段阅读次数
C:整本刊物(原貌版)的付费点击次数
D:整本刊物(原貌版)的浏览次数
E:手机版的付费点击次数
λ:对整本刊物(原貌版)的付费点击次数的换算系数
α:文章总字数
β:期刊总页数
由此我们得出数字期刊阅读量的计算方式为:
四、结语
本文以龙源期刊网为例,对其数据进行分析,从数字期刊的有效浏览量的角度,提出了数字期刊的阅读量的概念以及计算方法。这对于制定数字期刊阅读量的统计标准,具有一定的借鉴意义。标准化数字期刊阅读量,不仅可以扩大期刊营收的市场份额,同时也是期刊业走数字化出版之路的必然要求,它将是期刊在互联网环境下吸引新生代读者、保持对广告主吸引力的重要举措,对于吸引更多的广告主具有巨大的价值,也是自身发展、与时俱进的表现。