信源

科技工作者之家 2020-11-17

信源是产生各类信息的实体。信源给出的符号是不确定的,可用随机变量及其统计特性描述。信息是抽象的,信源则是具体的。例如,人们交谈,人的发声系统就是语声信源;人们看书、读报,被光照的书和报纸本身就是文字信源;常见的信源还有图像信源、数字信源等等。信号的产生(物)被称为信源,相对应的概念应该是信号的接受(物)被称为信宿。

定义信息传播过程简单地描述为:信源→信道→信宿。其中,“信源”是信息的发布者,即上载者;“信宿”是信息的接收者,即最终用户。在传统的信息传播过程中,对信源的资格有严格的限制,通常是广播电台、电视台等机构,采用的是有中心的结构。而在计算机网络中,对信源的资格并无特殊限制,任何一个上网者都可以成为信源。1

起源1949年,香农和韦弗提出了有关传播的数学模式。信源就是信息的来源,可以是人、机器、自然界的物体等等。信源发出信息的时候,一般以某种讯息的方式表现出来,可以是符号,如文字、语言等,也可以是信号,如图像、声响等等。

编码编码就是把信息变换成讯息的过程,这是按一定的符号、信号规则进行的。按规则将信息的意义用符码编排起来的过程就是编码过程,这种编码通常被认为是编码的第一部分。编码的第二部分则是针对传播的信道,把编制好的符码又变换成适于信道中传输的信号序列,以便于在信道中传递,如声音信号、电信号、光信号等等。如信息源产生的原始讯息是一篇文章,用电报传递的时候,就要经过编码,转换成电报密码的信号,然后才能经过信道传播。

信道就是信息传递的通道,是将信号进行传输、存储和处理的媒介。信道的关键问题是它的容量大小,要求以 最大的速率传送最大的信息量。

噪音是指信息传递中的干扰,将对信息的发送与接受产生影响,使两者的信息意义发生改变。

译码是对信息进行与编码过程相反的变换过程,就是把信号转换为讯息,如文字、语言等,这是第一步。第二步译码则是指将讯息还原为信息意义的过程。

信宿是信息的接受者,可以是人也可以是机器,如收音机、电视机等。

概念提出作为方法论,香农的这一信息系统模式可以被适用于许多系统,如通信系统、管理系统、社会系统等。传播学学者对这一模式进行改造之后,成为表述人类信息传播的基本模式之一,成为传播学领域最基本的研究范式,而信源、编码、译码、信宿等概念也成为传播学研究的基本概念。

香农的信息论为传播学领域提供了基本的范式,它使以前模糊的信息概念变得在数学上可以操纵。香农的信息论与维纳的控制论是相互影响的,维纳也是最早认识信息论价值的学者,并与香农共同发明了有关信息的熵度量法则。

定义漫谈产生消息(符号)、消息序列和连续消息的源,在数学上可以用随机变量、随机序列和随机过程来表示。信息是抽象的,信源则是具体的。例如人们谈话,人的发声系统就是语声信源;观看电视,被摄制的客观物体和人物就是图像信源。另外还有文字信源、数据信源、遥感信源等。

分类最基本的信源是单个消息(符号)信源,它可以用随机变量X及其概率分布P来表示。通常写成(X,P)。根据信源输出的随机变量的取值集合,信源可以分为离散信源和连续信源两类。对于离散信源

式中X为随机变量,其取值集合为A={x1,x2,…,xn},X取xi的概率为Pi。例如当时,二进制数据信源可表示为对于连续信源式中随机变量X取值于区间(ɑ,b),对应的概率密度为p(x)。

实际信源是由最基本的单个消息信源组合而成的。离散时,它是由一系列消息串组成的随机序列X1,X2,…,Xj,…,XL 来表示。电报、数据、数字等信源均属此类。连续时,它是由连续消息所组成的随机过程X(t)来表示。语声、图像等信源属于这类。对于离散随机序列信源,消息序列X的取值集合为AL,概率分布为PX(),记为(X,PX())。

离散序列信源又分为无记忆和有记忆两类。当序列信源中的各个消息相互统计独立时,称信源为离散无记忆信源。若同时具有相同的分布,则称信源为离散平稳无记忆信源。例如最简单的(设L=3)脉冲编码信源,当P0=P1=1/2时,

当序列信源中各个消息前后有关联时,称信源为离散有记忆信源。描述它一般比较困难,尤其当记忆长度很大时。但在很多实际问题中仅须考虑有限记忆长度,特别是当信源系列中的任一消息仅与其前面的一个消息有关联,数学上称它为一阶马尔科夫链。在马尔科夫链中,若其转移概率与所在位置无关,则称为齐次马尔科夫链。若同时还满足当转移步数充分大时与起始状态无关,则称它为齐次遍历马尔科夫链。例如数字图像信源常采用这一模型。

连续的随机过程信源,一般很复杂且很难统一描述。但在实际问题中往往可采用以下两类方法。最常见的处理方法是将连续的随机过程信源在一定的条件下转化为离散的随机序列信源;另一种方法则是把连续的随机过程信源按易于分析的已知连续过程信源处理。实际上,绝大多数连续随机过程信源都近似地满足限时(T)、限频(F)的条件。这时,连续的随机过程可以转化为有限项傅里叶级数或抽样函数的随机序列,而抽样函数表达式尤为常用。但这两种方式在一般情况下其转化后的离散随机序列是相关的,即信源是有记忆的。这给进一步分析带来一定的困难。另外一种是将连续随机过程展开成相互线性无关的随机变量序列,这种展开称为卡休宁-勒维展开。由于实现困难,这种展开除具有一定理论价值外,实际上很少被采用。直接按随机过程来处理信源受到分析方法的限制,人们还主要限于研究平稳遍历信源和简单的马尔科夫信源。

上述信源都是单一信源,又称为单用户信源。70年代以来又进一步引入多个相互不独立或相关的信源,称为多用户信源,其目的是研究多用户信源编码,以进一步压缩信源的信息率或达到某些其他目的。但这方面的研究还仅限于离散无记忆信源,这类问题是一个正在探索中的课题。

主要性质信源输出是随机的,因而它是概率性的。从概率统计观点看,概率分布是信源最基本、最完整的统计特性。对离散无记忆信源,信源消息序列是统计独立的,因此只要知道单个消息的概率分布就能完全决定整个消息序列的联合概率分布。对离散有记忆信源情况就不同了,它必须知道整个消息序列的联合分布,而求有记忆信源的联合分布是很困难的。只是在一些很特殊的情况下,已知分布类型和某些统计参量,如均值、协方差,才能求出分布。最典型的例子是具有有限维的正态分布,其概率分布决定于均值和协方差。

实际信源分布即使是一维的也往往是未知的,通常采用直方图统计量,以便为实际信源寻找出一个近似的概率分布。在求实际语声、图像分布时,常采用这种方法。利用概率分布,可以进一步引用信息熵H(X)来描述信源的统计特性。根据信息论可得出以下结论:对离散信源,当信源消息序列独立、等概率分布时,信息熵最大。对连续信源,只有在一定约束条件下才具有最大熵。例如当信号峰值功率受限制时,均匀分布信源的信息熵最大;而当信号平均功率受限制时,正态分布信源的信息熵最大。利用信息熵还可以很方便地描述有记忆信源的统计特性。根据熵的性质,无记忆的单个消息熵大于有记忆的单个消息熵,且记忆越长,单个消息熵就越小。实际信源多数是有记忆的,但是在传送信源消息时往往按无记忆考虑,因此信源存在着压缩的可能性。

实际信源图像和语声是最常用的两类主要信源。要充分描述一幅活动的立体彩色图像,须用一个四元的随机矢量场X(x,y,z,t),其中x,y,z为空间坐标;t为时间坐标;而X是六维矢量,即表示左、右眼的亮度、色度和饱和度。然而通常的黑白电视信号是对平面图像经过线性扫描而形成。这样,上述四元随机矢量场可简化为一个随机过程X(t)。图像信源的最主要客观统计特性是信源的幅度概率分布、自相关函数或功率谱。关于图像信源的幅度概率分布,虽然人们已经作了大量的统计和分析,但尚未得出比较一致的结论。至于图像的自相关函数,实验证明它大体上遵从负指数型分布。其指数的衰减速度完全取决于图像类型与图像的细节结构。实际上,由于信源的信号处理往往是在频域上进行,这时可以通过傅里叶变换将信源的自相关函数转换为功率谱密度。功率谱密度也可以直接测试。

语声信号一般也可以用一个随机过程X(t)来表示。语声信源的统计特性主要有语声的幅度概率分布、自相关函数、语声平均功率谱以及语声共振峰频率分布等。实验结果表明语声的幅度概率分布可用伽玛(γ)分布或拉普拉斯分布来近似。语声信号的自相关函数,根据实验也可以大致认为属于负指数分布类型,且样点间相关性很强,一般高达0.9以上。语声信号的平均功率谱的测试表明,语声主要能量集中在1千赫以下。语声的共振峰频率是语声功率谱的主要峰值。这样的峰值并非一个,而且它的值随音调的变化有一定的变动范围。人们对汉语、英语的共振峰分布已获得一定的测试结果。2

经典解读休眠效果即“睡眠者效果”,这是由霍夫兰提出的用来解释可信性效果变化的一个概念。根据艾宾豪斯的忘却曲线原理,人脑对信息的记忆量随时间的推移逐渐减少,而忘却是从信息的次要属性开始的。也就是说,由高可信度信源或低可信度信源发出的信息,由于人们对信源的信任感不同,其说明效果可能会分别大于或小于信息内容本身的说服力。而随着时间的推移,人们对信源与信息内容相联系的记忆会逐渐淡漠。这时,由信源居于主导地位的可信性效果趋于减弱或者消失,内容本身的说服力才能较为完全地发挥出来。

这种现象表明,低可信度信源发出的信息,由于信源可信性的影响,其内容本身的说明力不能马上得以发挥,处于一种“睡眠”状态,经过一段时间,可信性的负面影响减弱或消失,其说服效果才能充分表现出来。

信源的可信性问题它包括两个要素:第一是传播者的信誉(Credibility),包括诚实、客观、公正等品格条件;第二是专业权威性(Expertness),即传播者对特定问题是否具有发言权和发言资格。这两者构成了可信性的基础。对信源(传播者)的可信性与说服效果的关系进行了实证考察的是霍夫兰等人,他们提出了“可信性效果”的概念:一般来说,信源的可信度越高,其说服效果越大;可信度越低,说服效果越小。这个概念说明,对传播者来说,树立良好的形象争取受众的信任是改进传播效果的前提条件。

博客与信源博客是作为一个信源存在的,是集编码、译码、释码于一体的角色。博客利用自身掌握的各种信息资源,采用文字、图像、视频、音频等各种符号手段对信息和观点进行编码,通过各种网站平台进行传播。受众可以匿名,也可以通过评论或发表文章等对博客内容进行反馈和释码、译码,或者转换角色,成为新内容的编码者,如此循环往复,形成良性的互动传播。其次博客也是一个信道,一个信息和意见的集散地,众多的信息和观点可以由此传递,超链接功能帮助受众获得更多信息,在博客与博客之间、博客与非博客之间建立传播的介质和联系的通道。当然博客也是传播中的一种噪音,是传播的信宿,这一点在后面会论述。这样的一个过程,正好印证了上述的循环模型,同时也很大程度上突破了大众传播缺乏反馈性的弱点,增强了传播过程中双方的互动性和能动性,也使基于科学技术的现代传播能够更接近人际传播的本质和功能。在这个博客传播的循环过程中,信源是匿名和多样化的,具有“四零条件”:零技术、零成本、零编辑、零形式,进入门槛低,技术含量低,言论表达自由,这一信源具有平民性和普遍性,因而发展迅速。2005年7月,社科院社会发展研究中心发布的《2005年中国5城市互联网使用现状及影响调查报告》中显示,有29%的网民开始使用博客。信源的多样必然带来信宿的丰富,加上博客自由互动的特点,使得博客的影响力和信息价值增大,对社会和个人生活产生越来越重要的影响。

传播学者麦克卢汉在阐述“媒介即讯息”这一观点时指出:因为任何媒介与技术所包含的“讯息”,即意味着对它们引进人类生活中的尺度、进度、标准的改变。铁路并非将运动、运输、车轮或路轨引进人类社会,而是提高与扩张了以往人类活动的向度,由此创造出全新的城市,全新的工作与闲暇。[6]博客这一新的媒介也正逐渐改变着人们的工作与闲暇方式、思维与行为方式等,成为一种新的生活方式和潮流。伴随博客产生了许多新的事物,比如播客,是与主要依靠文字表达的博客互补的表达方式,用音频、视频等来表达自己的生活点滴、所思所想,即向全世界播放自己的声音。理论上讲,只要有一台上网电脑和一个话筒,你就可以掌握话语权,以自己独有的风格向全世界播音。播客的制作和接收没有技术、时间和地域限制,它改变了人们传统的收听模式,直接冲击着广播媒体。博客电影,指剧作来自博客群体,博客群体参与摄制,首映式在博客门户网络媒体发布的新影像。这与那些有着庞大的演职人员、精巧的编剧者和大投资拍摄的电影艺术是完全不同的概念,是一种反传统、反权威的力量。被称为博客2.0的“维客”,则是一个人人都可以编辑的百科全书,它只是一套可以任意编辑的网络白纸,任何人都可以在一段别人写过的内容上编辑加工,也能够按照一定技术规则和文化脉络组合模仿。这些以博客为代表的媒体,具有去中心化、去权威的力量,一种来自草根阶层的巨大力量,代表着一种话语权的解放,言论的自由和平等。王朔曾经说过,他所害怕的是具有全体写作能力的人民,似乎博客能给他带来这种恐惧。

匿名信源新闻采集的难度变大。匿名信源在正面报道中较少出现,它主要存在于中性和负面报道中,尤以负面报道居多。由于如今多数媒体编辑尤其是都市类报纸相对更欢迎负面报道,导致记者采写这些报道的频率增大。而对于知情者来说,很少有人愿意向媒体透露细节。为了及时交付稿件,记者不得不变通地采取“道听途说”的方式来报道。这尤以调查性报道居多。

信息量增大和时效性增强,使记者无暇采集详实的新闻素材。如今各类媒体越来越多,读者看报往往读个标题,看电视也常常只观大概,因此有人认为,传递确切的信息源好像不太重要。为了在第一时间让稿件见报,记者往往会在一些无关紧要的信息来源的时候,加以自己的揣测,“导演”一些诸如采访市民、采访业内人士等“新闻镜头”。通常情况下,记者是在确实了解这种情况的背景下,找到一个“存在但不确定”的第三方,用自己的嘴来代其说出。如今,信息量的增大逼迫着时效性一再增强。记者在采写一些较有难度的稿件时,紧张的时效与竞争已经容不得大家花太多的时间来进行所有的实名采访。

新闻的信源可以大致分为两类:一类是消息的主要来源。一般而言,这种对消息本身起着绝对性作用的信源必须是真实的。

另一类信源则是一些求证之类的辅助性信源。文中是否出现这类实名信源,对文章的主旨基本影响不大。在正规的新闻媒体中,匿名信源大都出现少数辅助信源当中。从实际采访过程和编辑好的新闻作品来看,文字媒体的匿名信源出现频率要远远高于需出现画面和声音的电视、广播等媒体。不过,电视、广播如今流行如凤凰卫视“锵锵三人行”之类的“新闻谈话”节目,匿名信源往往会在这里出现。

从匿名信源的产生原因中我们可以发现,虽然很多确是“事实”,但它以匿名的方式表现后,在读者心中就并不等同于“真实”了。这也或多或少对媒体的公信力产生不利影响。读者在试图从媒体了解事实时,他们也会理性地判断。网络与传统媒体有着许多区别,其中,网络信源可以是匿名的多对多传播,作者对发布的信息可不负责,同时互联网对信息的制作和传播过程非常快速而匆忙。传统媒体由于体制的种种原因,必然是担负着“喉舌”角色的负责任的实名传播,作者必须对撰写的稿件进行相对仔细的制作加工,并对传播的信息真实性负责。如果传统媒体也越来越多地掺杂了匿名的因素,那么它的公信力必然下降。诚然,匿名信源可以找出许多理由。一些公司出于上市等敏感因素考虑,要求记者在不出现具体公司名字的情况下接受对某问题的采访;个人因害怕打击、不良影响等种种原因,不愿在文中出现名字和身份。这也并非完全不可理解。但是,如果越来越多的对无伤大雅的出处故作神秘地进行隐匿,这就不太妥当。3

歧义⒈信源:通信过程中产生和发送信息的设备或计算机。

⒉信源,理解成信息的源泉,英文是feed。信息发布网站将网站全部或者部分信息整合到一个RSS文件中,这个文件就被称之为feed。信源中包含的数据都是标准的XML格式,不但能直接被其他站点调用,也能在其他的终端和服务中使用

本词条内容贡献者为:

鄢志丹 - 副教授 - 中国石油大学(华东)

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。