第一章 多媒体计算机概论
1.什么是媒体?按照ITU的定义,媒体是如何分类的?
媒体(Medium)是存储信息的实体;是信息的载体。在计算机领域中有两种含义: 1. 用以存储信息的实体,如磁带、磁盘、光盘和半导体存储器; 2. 信息的载体,如数字、文字、声音、图形 和图像。 2.什么是多媒体,多媒体有哪些关键特性?
通常所指的多媒体就是各种感觉媒体的组合,也就是声音、文件等各种媒体的组合。1.交互性 2.多样性 3.集成性3.信息载体的3个重要里程碑是什么? 启蒙发展阶段、标准化阶段、普及应用 启蒙发展阶段
多媒体计算机技术最早起源于20世纪80年代中期。1984年,Apple公司在研制Macintosh计算机时,为了改善人机交互界面,了位映射(bitmap)、窗口(window)、图符(icon)等技术,时鼠标作为交互设备配合GUI使用, 大大方便了用户的操作。1985年,Microsoft公司推出了Windows,它是一个多任务的图形操作环境。1985年,美国Commodore公司首先推出世界上第一台多媒体计算机采用Motorola M68000, 3个专用芯片: 图形处理芯片Paula83, 视频处理芯片Denise 8362。
Amiga机具有自己专用的操作系统, 能够处理多任务,功能
1986年,荷兰Philips公司和日本Sony公司联合出CD-ROM光盘的数据格式,这项技术对大容量存储设备光盘发展起着巨大的影响,认可成为国际标准。
大容量光盘出现为存储表示声音、文字、图形、视频等高质量的数字化媒体提供了有效的手段。 标准化阶段
1990年10月, 在微软公司召开多媒体开发工作者会议上提出1993年由IBM, Intel等数十家软硬件公司组成的多媒体个人计算机市场协会了多媒体个人机的性能标准MPC2.0。
图像、图形、动画、 4. 同步性 所带来的图形用户界面
AmigaAgnus 8370, 并具有下拉菜单、多窗口、图符等CD-I,同时公布了该系统所采用的MPC1.0标准。数据 、(GUI), 同CPU并经ISO
(MPMC)发布文字、
创造性地使用
系统。其音响处理芯片软件02 20033069 杜福滨出版1.1版 盗版必究 2
1995年6月, MPMC又宣布了新的多媒体个人机技术规范MPC3.0。 1996年以后, 新的个人机均支持基本多媒体功能。 4.多媒体数据具有哪些特征?
1. 数据量大 2.数据长度不定 3.多数据流 4.数据流的连续记录和检索
5.简述多媒体计算机的关键技术及其主要应用领域?
关键技术:
1..数据存储技术 4.多媒体数据库技术 主要应用领域: 1.娱乐 2.教育与培训7.各种咨询服务与广告宣传系统多媒体关键技术数据存储技术、术、多媒体信息检索、虚拟现实技术、第2、3章 多媒体计算机系统――硬件环境1、多媒体计算机的层次结构是什么?第一层多媒体计算机硬件系统。第二层是多媒体软件系统。第三层为多媒体应用程序接口。第四层为多媒体创作工具及软件。第五层是多媒体应用系统。2、简述显卡的工作原理。CPU将数据通过总线传送到显示芯片。显示芯片对数据进行处理,并将处理结果存放到显示内存中。显示内存将数据传送到RAM DAC3、光盘在存储多媒体信息方面具有什么特点?记录密度高、存储容量大互换 、多种媒体融合 2.多媒体数据压缩编码与解码技术 5.多媒体网络与通信技术
3. 多媒体办公系统 8.
多媒体数据压缩编码与解码技术、
RAM DAC(数模转换器)并进行数据到模拟信号的转换。VGA接口输送到显示器 、采用非接触方式读 、价格低廉 3.虚拟现实技术 6.智能多媒体技术 4.通信 5.工业和科学计算 多媒体网络与通信技术、
/写信息 、信息保存时间长
7.多媒体信息检索 6.医疗 多媒体数据库技 、不同平台可、 电子出版物
将模拟信号通过
软件02 20033069 杜福滨出版1.1版 盗版必究 3
4、光驱读取光盘有哪两种方式?各有哪些特点? CLV和CAV
CLV(Constant Line Velocity,恒定线速度)方式下 ,单位距离的光道上所储存的信息容量是相等的,光驱从内到外都是采用同样的读取速度,
光盘上每个部分的密度都是一样的,因而可以充分利用盘片的空间,增加了存储容量。 为了维持单位距离信息读取时间一致,内圈与外圈读取时间不同,内圈转速高,而外圈转速低。因此控制复杂,不便于随机存取,光驱耐用性也降低。
CAV(Constant Angular Velocity,恒定角速度)在CAV方式下,不管是内圈还是外圈,激光头始终以恒定的角速度旋转CD-ROM盘片。 CAV方式控制简单,便于随机存取。
由于光盘内外圈转动时角速度相同,单位距离信息读取时间不相等,圈到外圈慢慢变快,而读取速度会有一定,因此,只能内外光道只有采用不同的数据记录密度,光盘的存储空间没有充分利用。
PCAV(Partial Constant Angular Velocity)局部恒定角速度
P-CAV是CLV和CAV的结合,一开始在内圈时采用CAV,读取速度会慢慢上升,等达到最大读取速度时就改成CLV,此时读取速度固定而转速则会慢慢下降,更快达到最高速度,所以理论上平均速度会比较快。 一般情况下,高速光驱均采用CAV/PCAV方式工作。
5、只读光盘是如何记录信息?光盘读取信息的原理是什么?只读光盘记录信息的原理:是利用在盘上压制凹坑的机械办法,而凹坑和非凹坑的平坦部分记录 “0”,并使用激光来读出。光盘信息读取原理
在读出光盘信息时,就要把光盘上用凹坑和非凹坑代表的信息还原为原来的数据信息。光盘的读取过程是基于物理学的“光的反射”原理。凸面(回去,同时不会减弱光的强度;凹坑面(Pit)则将光线向四面发射出去,光强度会减弱。光驱就是靠光的“反射和发散”来识别数据 。 6、光盘的标准主要有哪些?各适用于哪些场合?
光盘的标准主要有CD-DA 标准、 CD-ROM标准、 CD-R标准、DVD与HD DVD
1、CD-DA也称为红皮书,数字式激光唱盘或CD唱盘,是用来存储数字化的高保真立体声
因此,读取速度会从内而因为P-CAV比Land)将激光按原路程反射 Video-CD、DVDCAV1”,
利用凹坑的边缘来记录 “ 、蓝光软件02 20033069 杜福滨出版1.1版 盗版必究 4
音乐。
2、CD-ROM标准从 CD-DA 发展而来,又称黄皮书标准,该标准定义了计算机数据在光盘上的物理存储的格式,使得光盘以统一的格式存储只读的信息 。
3、CD-R(Compact Disk Recordable:可刻录光盘)基于橙皮书的CD-R空白光盘实际上没有记录任何信息,一旦按照某 种文件格式并通过刻写程序和设备,可以将需要长期保存的数据写入空白的 CD-R 盘片上,这时的CD-R空白盘就可以变成CD-DA、CD- R 或 VCD光盘的形式。
4、Video CD(简称VCD)称之为,它用来描述光盘上存放采用像专家组)标准编码的全动态图像及其相应声音数据的光盘格式5、DVD采用波长更短的红色激光、度和位密度,并支持双层双面结构。它采用片、4.7GB~17GB的数据。
6、蓝光DVD技术采用蓝色激光波段,单层蓝光储50GB的数据,蓝光DVD提供了大的容量来容纳高清用蓝色激光,最高容量也达40GB,但由于其压缩标准采用压缩比和低专利费等优点。
7、计算机数据在光盘上的存储格式是如何定义的?分别是由哪些标准来定义的。物理格式: (黄皮书)
规定了如何将数据放在光盘上,包括帧格式、扇区的地址,数据类型,数据块的大小,错误检测和校正码等。 逻辑格式: (ISO9660)
文件格式,规定了如何将文件组织到光盘上以及指定文件在光盘上的物理位置,目录结构,文件大小以及路径表。
8、DVD光盘为什么能大幅度地提高存储容量?DVD采用波长更短的红色激光、更有效的调制方式和更强的纠错方法,具有更高的道密度和位密度,并支持双层双面结构。它采用4.7GB~17GB的数据。
为了提高存储容量,只读DVD盘刻分为单面单层、单面双层、双面单层、双面双层四种结构。
MPEG-2压缩技术的标准,可存放DVD
MPEG-2压缩技术的标准,可存放 MPEG-1(活动图
具有更高的道密488分钟影25GB的数据,双层可存HDDVD也是采WMV-HD和H.2,体现了高 包括文件的488分钟影片、更有效的调制方式和更强的纠错方法,盘可以存储 画质与音质。而软件02 20033069 杜福滨出版1.1版 盗版必究 5
9、DVD在音频和视频处理上采用了哪些技术?
对视频信号的处理,DVD采用的都是MPEG-2 压缩编码标准。对视频图像进行冗余量处理,以实现无明显失真的视频图像压缩。
在音频方面,既可是MPEG-1立体声、MPEG-2环绕立体声,也可是杜比(Dolby)AC-3。 10.蓝光DVD与普通DVD采用了哪些不同的技术?
以SONY、Philips,Panasonic等公司为核心的生产商联合发布了蓝光DVD(Blue-ray DIsc,BD)技术标准。而HD DVD是以日本东芝公司等开发的一种高清晰DVD光盘格式,它的激光规格与现行的DVD规格非常相似,较易与现行的DVD产品兼容。蓝光的原始分辨率为1920x1080;声音将以7.1声道为起点,最大可扩充至13.1个声道。
蓝光DVD技术采用蓝色激光波段,单层蓝光DVD盘可以存储25GB的数据,双层可存储50GB的数据,蓝光DVD提供了大的容量来容纳高清画质与音质。而HDDVD也是采用蓝色激光,最高容量也达40GB,但由于其压缩标准采用WMV-HD和H.2,体现了高压缩比和低专利费等优点。
11.光盘数据编码的基本原理是什么?
什么是EFM编码呢?就是Eight to Fourteen Modulation的缩写,即8至14调制。为什么会使用这样的编码对源数据进行“修改”呢?这还要从光盘的读取原理说起。光盘上的凹坑与平面并不直接代表0和1
光盘的读取是根据反射激光的强弱来进行逻辑1与0的分辨,但激光反射功率的强与弱并不直接代表1或0。反射功率强弱的突变点,也就是反射电平的翻转点,将被判断为逻辑值1,长时间的凹坑与平面则都是逻辑值0。
这样一来,如果是连续的1,那么就意味着凹坑与平面要突变多次,会占用更多的刻录空间,从而将影响有效的数据容积(或者说是信息量),而若以电平的高低 来代表1和0,如果连续的0或1很长,又很难判断有多少个1和0,0与1的转变也较难分辨,所以必须要加以一定的规则。这个规则可以借助某种编码方式 来禁止连续的1,并且又能把连续的0的长度在某种范围之内以利于识别,这就是所谓的“游程(RLL,Run Length Limited)编码规则”。
EFM就是这样的一种专用于信息记录的信道调制编码,它将原始数据重新进行编排,以保证不会有连续的1出 现,而连续的0则被控制在2至10个之间,可以表示为RLL(2,10)。也就是说,光盘上的信息中,两个逻辑1之间,最多有连续10个0,最少要有连续 两个0。这样,有了相应的规则后,再配合时钟计时信息(每个信道脉冲的时间长度),就可以准确的分辨出数据了。需要指出的是,当8bit数据重新编成 14bit数据后,两个14bit代码之间则还要符合RLL(2,10)的要求,因此还要根据相邻14bit代码的情况加入3bit的合并码 (Merging bit),从而使最终的编码长度变为17bit。
软件02 20033069 杜福滨出版1.1版 盗版必究 6
EFM调制编码示意图,为了保证两个14位编码之间仍符合RLL(2,10)的要求又加入了3位合并码,因此EFM其实是8至17编码。
第四章 多媒体音频信息处理
1、 音频信号的频率范围大约多少?话音信号频率范围大约多少? 频率范围为20 Hz~20 kHz的信号称为音频(Audio)信号;
人说话的信号频率通常为300~3000 Hz,人们把在这种频率范围的信号称为话音(speech)信号;
2、 声音有哪几种等级?它们的频率范围分别是什么?
频率小于20 Hz的信号称为亚音信号,或称为次音信号(subsonic); 频率范围为20 Hz~20 kHz的信号称为音频(Audio)信号;
人的发音器官发出的声音频率大约是80~3400 Hz,但人说话的信号频率通常为300~3000 Hz,人们把在这种频率范围的信号称为话音(speech)信号;
高于20 kHz的信号称为超音频信号,或称超声波(ultrasonic)信号。 3、 简述音频的数字化过程。
音频数字化过程涉及到音频的采样、量化和编码。
采样和量化的过程可由A/D转换器实现。A/D转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。
模拟信号的数字化过程 100101100011101 软件02 20033069 杜福滨出版1.1版 盗版必究 7
4、 什么叫做采样?采样频率根据什么原则来确定?
为实现A/D转换,把模拟音频信号波形进行分割,这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。
5、 什么叫做量化?什么叫做线性量化?什么叫做非线性量化?若量化位数为16,则能够表
示的声音幅度等级是多少?
对声波波形幅度的数字化表示称之为“量化” 均匀量化
采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化 非均匀量化
对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔。2的16次方
6、 什么是比特率?试分析比特率的含义?
比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,越好。作为一种数字音乐压缩效率的参考性指标,比特率表示单位时间(特数bps(bit per second,位/秒)的速度。 7、 什么叫做MIDI?它有什么特点?
MIDI 是数字音乐接口(Musical Instrument Digital Interface)的缩写。或者说,电子乐器相互连接,或将MIDI设备与电脑连接成系统的一种通讯协议。它使各家生产的乐器之间通过统一的MIDI交换信息及控制信号,从而完成音乐的合成。 1.容量小2.乐谱可视3.可编辑性
8、 用合成器产生电子音乐的方法有哪两种?各自的特点是什么? 频率调制合成器(FM合成器) 波表(Wave table合成器)。
FM合成: 通过多个频率的声音混合来模仿乐器的声音
波表合成: 是将乐器的声音样本存储在声卡波形表中, 播放时从波形表中取出来产生声音采用波表合成技术可以产生更逼真的声音. 10、简述声卡的主要功能部件和工作原理。
主芯片--数字信号处理器、混音芯片、音乐合成器、总线接口和控制器、外部输入声卡采用大规模集成电路设计,即将音频技术范围的各类电路以专用芯片形式集成在声卡上,并可直接插入计算机的扩展槽中使用。
11、常见的数字音频文件有哪些?各自的特点是什么?
1.PCM编码的WAV 特点:音质非常好,被大量软件所支持。 适用于:多媒体开发、保存音乐和音效素材。
2.MP3 特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。合用于比较高要求的音乐欣赏。
3. OGG 特点:可以用比mp3更小的码率实现比mp3更好的音质,高中低码率下均具有良好的表现。 适用于:用更小的存储空间获得更好的音质(相对MP3)
4 .MPC特点:中高码率下,具有有损编码中最佳的音质表现,高码率下,高频表现极佳适用于:在节省大量空间的前提下获得最佳音质的音乐欣赏。
5. WMA 特点:低码率下的音质表现难有对手 。适用于:数字电台架设、在线试听、低要求下的音乐欣赏
6. mp3PRO 特点:低码率下的音质之王 。适用于:低要求下的音乐欣赏还原后的音质就1秒)内传送的比MIDI是用来將/输出口。 适用于:适
. 。软件02 20033069 杜福滨出版1.1版 盗版必究 8
7. APE 特点:音质非常好。 适用于:最高品质的音乐欣赏及收藏
12、选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B) 存储量(B)=(采样频率HZ×采样位数bit×声道数×时间秒)/8
22050*16*3*2*60/8=15876000B; 15876000B/1024=15503.9KB/1024=15.14MB
第5-6章 数字图像、图形处理技术
1、 数字图像处理技术包括哪些主要内容?
图像的增强、图像的平滑、边缘锐化、图像的分割、图像的识别2、 什么叫做γ校正?使用校正非线性部件的输出与输入之间的关系,修改调整此功能可使画面中较暗的部份层次分明、细节清晰可辨,使色彩还原更自然3、 什么是真彩色、伪彩色和直接色?区别是什么?真彩色(true color)每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。伪彩色(pseudo color)定,而是把像素值当作彩色查找表一个显示图像时使用的直接色(direct color)换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的色称为直接色。它的特点是对每个基色进行变换。4、 分别用8和2位表示的一幅图像时,问该幅图像的颜色数目最多是多少?8位256色,2位45、 如果有一幅2568位
6、 什么是RGB模型?什么RGB模型:自然界常见的各种颜色,都可以由红(不同比例相配而成。CMY模型:采用青、品红、黄色三种基本颜色按一定比例合成颜色的方法。不同在于cmy色彩的产生不是直接来自于光线的色彩,光线。CMY色彩空间无法得到纯正的黑色7、 图像分辩率与显示分辩率有何区别?图像分辩率不同于显示分辩率,示分辨率,也无法真正改善图像的质量。8、 PAL制彩色电视使用什么颜色模型?像显示使用什么颜色模型?(1) PAL制彩色电视:(2) NTSC制彩色电视:(3) 计算机图像显示设备:9、 用YUV或YIQ模型来表示彩色图像的优点是什么?YUV表示法中亮度信号灰度图与用U、V信号构成的另外两幅单色图是相互的。由于可以对这些单色图分别进行编码。γ校正功能修改图像的图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决R,G,B值,用查找出的每个像素值分成
CMY模型?它们之间的差别是什么?
它实际上决定了图像的显示质量, YUV YIQ RGB
(Y)和色度信号
R,R,G,B分量,每个分量作为单独的索引值对它做变
NTSC制彩色电视使用什么颜色模型?计算机图
(U、V)是相互的,也就是值,图像会有什么变化。
,CLUT),B值产生的彩色称为伪彩色。 R)、绿(G而是来自于照射在颜料上反射回来的
图像校正、
R,G,B三个基色分量,
的表项入口地址,去查找
R,G,B强度值产生的彩 B)三种中颜色光按
也就是说,即使提高了显Y信号分量构成的黑白Y、U、V是的,所以 γ是指在组成一幅彩色图像的每个像素值中,有(color look-up tableG
色色的图像,问该图的颜色深度是多少?)、蓝(
软件02 20033069 杜福滨出版1.1版 盗版必究 9
亮度信号和色差信号分离可使彩色电视系统的信号与只对亮度敏感的黑白电视机亮度信号兼容 10、 在RGB颜色空间中,当R=G=B=0,显示的颜色是什么颜色?当R=G=B,且为任意数
值,显示的颜色是什么颜色? R=G=B=0黑色,R=G=B灰度颜色 11、 在CMY颜色空间中,当C=M=Y=0,显示的颜色是什么颜色? C=M=Y=0,显示的颜色是白色 12、 图像数字化过程的基本步骤是什么? 采样、量化、编码
采样的实质就是要用多少点来描述一张图像 ,采样的结果就是通常所说的图像分辨率。量化是指要使用多大范围的数值,来表示图像采样之后的每一个点。量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。量化位数越大,表示图像可以拥有更多的颜色,自然可以产生更为细致的图像效果。但是,也会占用更大的存储空间。数字化后得到的图像数据量十分巨大,必须采用编码技术来压缩信息的比特量。13、 如何理解图像的频率?
图像的频率体现了颜色或灰度的变化程度,反映了图像的细节程度。图像频率高,像是一副颜色变化剧烈、细节丰富的图像,图像频率较低,说明该图像是一副颜色均匀变化,细节不够丰富的图像。 14、 计算机图形与数字图像的主要区别是什么?
数据来源不同,处理方法不同,理论基础不同,用途不同 15、 常见的图像及图形的文件格式有哪些? Bmp,tiff,gif,jpeg,psd,png, swf,svg,wmf,emf,eps,dxf 16、 Photoshop软件的选区工具有哪些?各有什么特点?
17、 理解Photoshop的图层、通道、滤镜、蒙版等概念。
第7章 多媒体视频信息处理
1.什么是隔行扫描?什么是逐行扫描?各有什么特点? 逐行扫描:电子束从显示屏的左上角一行接一行的扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。
隔行扫描:电子束扫完第1行后回到第3行开始的位置接着扫,然后在第扫,直到最后一行;奇数行扫完后接着扫偶数行,这样就完成了一帧(隔行扫描画面清晰度稍差,有轻微的闪烁感,但其所占用的信号传输带宽较逐行扫描减少一半,解决了信号带宽的问题。
逐行扫描:图像垂直清晰度高,空间处理效果好,有利于电视转换和制式转换,能改善视频压缩效率,但是,其数码率高,行扫描频率增高,硬件难度加大。 2.电视机和计算机的显示器各使用什么扫描方式? 电视信号的发送与接收中采用隔行扫描。
新一代数字电视机和计算机显示器均采用逐行扫描
3.世界上主要的彩色电视制式是哪几种?简述其主要技术指标。我国电视信号使用的是什么制式?
说明该图5、7、……行上frame)的扫描。
软件02 20033069 杜福滨出版1.1版 盗版必究 10
1.NTSC彩色电视制式 、2.PAL彩色电视制式 、3.SECAM彩色电视制式 中国 PAL
4.如何实现黑白电视信号和彩色电视信号的兼容?
1.必须使亮度和色度信号分开传送,以便使黑白电视和彩色电视能够分别重现黑白和彩色图像;
2.应尽量压缩彩色电视信号的频带宽度,使其与黑白电视信号的带宽相同;3.除了新设置的色同步信号以外,应采用与黑白电视信号完全一致的行、场扫描以及消隐、同步等控制信号。
5.彩色电视信号为什么采用YUV颜色模型?
YUV的亮度信号Y和色度信号U,V是相互的,它可以与黑白全电视信号兼容。YUV空间还可以充分利用人眼对亮度细节敏感而对彩色细节迟钝的视觉特性,大大压缩色度信号的带宽。
我国的彩色电视信号的频带宽度是多少?亮度信号带宽、色度信号带宽、彩色副载波的频率及声音载波的频率各是多少?
我国目前规定的电视图像信号的频带宽度为6MHz
我国规定的亮度信号带宽为6MHz,而色度信号U、V我国彩色电视的副载波频率为4.43MHz
我国电视信号的声音载频为6.5MHz,伴音质量为单声道调频广播。6.什么是全电视信号?复合视频信号与S-Video信号的区别什么?全电视信号定义为包括亮度和色度与复合同步信号以及伴音信号的模拟信号。复合视频信号,即从全电视信号中分离出伴音后的视频信号,度信号的高端。240线左右的分辨率。
S-Video信号:是一种两分量的视频信号,它把亮度和色度信号分成两路的模拟信号,用两路导线分别传输并可以分别记录在模拟磁带的两路磁迹上。合视频信号相比,S-Video可以更好的重现色彩。 7.视频的数字化过程有哪些主要步骤?
1.视频信号的采样、2.量化、3.视频信号的压缩与编码 9.视频信号采样的基本要求是什么?
1》要满足采样定理。对于PAL制电视信号。视频带宽为信号的采样频率为13.5MHz ,色度信号为6.75MHz。2》采样频率必须是行频的整数倍。这样可以保证每行有整数个取样点,同时要使得每行取样点数目一样多,具有正交结构,便于数据处理。 3》要满足两种扫描制式。
1.3MHz。
这时的色度信号还是间插在亮水平分辨率可达4206MHz,按照CCIR601建议,亮度 采用的带宽分别仅为 线。与复
软件02 20033069 杜福滨出版1.1版 盗版必究 11
10.数字视频的采样格式有哪几种?各自的含义是什么? 两种。一种是使用相同的采样频率对图像的亮度信号和色差信号进行采样,另一种是对亮度信号和色差信号分别采用不同的采样频率进行采样。 11.视频数字化时,8比特量化是什么含义? 8比特量化有256个灰度等级 12.视频采集卡的工作原理。
视频采集卡可以汇集多种视频源的信息,如电视、影碟、录像机和摄像机的视频信息,对被捕捉和采集到的画面进行数字化、冻结、存储、输出及其它处理操作,如编辑、修整、裁剪、按比例绘制、像素显示调整、缩放功能等。
13.一幅YUV彩色图像的分辨率为格式采样时的样本数。首先计算每个像素点上的平均样本数:然后计算整副图像的样本数:14.数字视频文件格式有哪些?各有什么特点?流媒体视频文格式包括哪几种?适合本地播放的本地影像视频和适合在网络中播放的网络流媒体影像视频两类。网络:这种流式视频采用一种成视频流缓冲区后实时播放,同时继续下载,为接下来的播放做好准备。这种的方法避免了用户必须等待整个文件从第8章 计算机动画
1、简述视频与动画的区别。视频:就其本质而言,活动图像。
动画:动画是一个过程,同。
2、实现动画的主要技术与方法有哪些?1.关键帧动画 2.路径动画 7.人脸表情动画 8.运动捕捉3、什么是关键帧动画?所谓关键帧动画,就是给需要动画效果的属性,画序列中比较关键的帧中提取出来的,的插值方法计算得到,从而达到比较流畅的动画效果。4、什么是运动捕捉技术?运动捕捉技术是一种新的动画制作方法三维坐标,从而得到人体的运动参数,因此能够获得完全真实的人体动画。5. 理解Flash软件中的补间动画、引导层、遮罩等概念。
第9-10章 多媒体数据压缩与编码1、音频或图像信息为什么能进行压缩?压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息一种更接近信息本质的描述来代替原有冗余的描述。720×576。分别计算采用(4+2+2)/4=2 720×576×2=829440
“边传边播”的方法,即先从服务器上下载一部分视频文件,形Internet上全部下载完毕才能观看的缺点。
3.变形动画 4.动力学动画 5.粒子动画 9.三维扫描技术 准备一组与时间相关的值,而其他时间帧中的值,
,是通过分析人体运动序列图像来提取人体关节点的
4:2:2、4:1:1和所以视频又叫作运动图像或每个画面与其前面的一个不 6.群体动画这些值都是在动(可推知的4:2:0子采样
“边传边播”
采用特定),也就是用
就是其内容随时间变化的一组动态图像,它动态的产生一组物体的一系列画面,
可以用这些关键值, 软件02 20033069 杜福滨出版1.1版 盗版必究 12
2、什么是预测编码?分为哪两类?各自有什么特点? 预测编码是根据离散信号之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差进行编码。 帧内预测编码--反映了同一帧图像内,相邻像素点之间的空间相关性较强,因而任何一个像素点的亮度值,均可由它相邻的已被编码的像素点的编码值来进行预测。典型的压缩方法有DPCM(差分脉冲编码调制)和ADPCM(自适应差分脉冲编码调制)等,它们比较适合图像与声音数据的压缩。
帧间预测编码:运动图像各帧之间有很强的时间相关性。例如,在电视图像传送中,相邻帧的时间间隔只有1/30秒,大多数像素的亮度信号在帧间的变化是不大的,利用帧间预测编码技术就可减少帧序列内图像信号的冗余度。
3、对比说明预测编码、变换编码及统计编码的区别?
预测编码: 根据离散信号之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差进行编码。 变换编码: 变换编码先对信号进行某种函数变换,从信号的一种表示空间变换到信号的另一种表示空间,然后在变换后的域上,对变换后的信号进行编码统计编码: 主要针对无记忆信源(是指信源在不同时刻发出的符号之间是无依赖的,彼此统计的),根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。什么是有损编码?什么是无损编码?列举各自的例子。4、什么是时间冗余?什么是空间冗余?
(1)时间冗余: 当发送连接请求并等待回应时,通常会设置一个超时时间一定范围内容忍通信连接中的临时错误
(2)空间冗余: 多留出一些空间,在这个空间范围内以容忍超出空间范围的错误多媒体信息本身存在很大的冗余量,包括时间冗余和空间冗余等。像素点之间,大部分像素值的变化较少,即空间上相关性较强,因此,同一帧图像内的信息存在空间上的冗余。又如:在运动图像的各帧之间,相邻帧的时间间隔只有数像素的亮度信号在帧间的变化是不大的,有很强的时间相关性。的信息存在时间冗余。 5、
某信源符号及其概率如下:
a a1 a2 a3 a4 p(a) 0.1 0.22 0.2 0.08 求其Huffman编码,信息熵及平均码长。 某信源符号及其概率如下:
a a1 a2 a3 a4 p(a) 0.5 0.25 0.125 0.0625 0.0625 求其Huffman编码,信息熵及平均码长。 答:
信源 概率 huffman码 a1 0.5 1 a2 0.25 11 a3 0.125 111 a4 0.0625 1111 a5 0.0625 1111
.
,这个时间范围允许在如在同一帧图像内,因此,在运动图像的帧间 a5 0.4 a5 相邻秒,大多
1/30 软件02 20033069 杜福滨出版1.1版 盗版必究 13
信息熵H=-(0.5*log0.5+0.25*log0.25+0.125*log0.125+0.0625*log0.0625+ 0.0625*log0.0625);
平均码长=(1+2+3+4+4)/5=3;
例题请看PPT9-10章23
6. 设信源符号包含{00,01,10,11},概率分别为{0.1,0.4,0.2,0.3},当某消息序列的输入为:10,00,11,00,10,11,01,对其进行算术编码。
7、什么是统计编码的自适应模型?
在信息被输入之前对信息内容一无所知并假定每个字符的出现概率均等,随着字符不断被输入和编码,统计并纪录已经出现过的字符的概率并将这些概率应用于对后续字符的编码。适应模型在压缩开始时压缩效果并不理想,但随着压缩的进行,他会越来越接近字符概率的准确值,并达到理想的压缩效果。自适应模型还可以适应输入信息中字符分布的突然变化,可以适应不同的文件中的字符分布而不需要保存概率表。 8、说明DC系数与AC系数的含义。
DC系数:即直流系数,与空间域矩阵P的平均值有关。 AC系数:即交流系数,是像素变化的一种尺度。 如果P矩阵中所有的值都是一样的,则表示一幅只包含一种颜色没有任何变化的图像。的AC系数都为0。
如果P值中有一点小小的变化,则表示一幅颜色均匀变化而不太精细的图像。矩阵含许多值为0的AC系数。 如果P值中有很大的变化,它表示一幅小范围内颜色变化剧烈的图像,或实际上表示一幅有许多精密细节的图像。这时的AC系数值为0的将很少,或者都不为零 9、在JPEG压缩编码中采用Z型扫描的目的是什么?
采用该扫描能够实现高效压缩,因为在JPEG图像经过量化后,大量的DCT矩阵元素被截成自所有T将包0,
软件02 20033069 杜福滨出版1.1版 盗版必究 14
且通常是从左上角开始沿着对角线方向分布的,对这些0值采用形成编码算法RLE沿着Z型路径可有效地积累图像中的0的个数,提高压缩效率 11、详述JPEG静态图象压缩算法实现的主要步骤。
一.颜色模式转换及采样:先将RGB颜色模型表示的图像数据,转换为YCbCr颜色模型表示的数据,然后进行采样;
二.DCT变换:把YCbCr的每个分量的样本数据分成8x8样本矩阵,分别对其作DCT变换,将空间矩阵P变换为频率矩阵T,经过DCT变换后,其低频分量集中在左上角,高频分量分布在右下角,低频分量包含了图像的主要信息。
三.量化:在JPEG标准中采用线性均匀量化器。量化定义为,对个DCT变换系数除以量化步长后四舍五入取整。量化器步长是量化表的元素,量化表元素也包含DCT变换系数一一对应。由于在量化表中左上角的值较小,右下角的值较大,可以达到保持低频分量,抑制高频分量的目的;量化表分为亮度量化表和色度量化表,化,对色度采用粗量化,以进一步提高压缩比。 四.编码:
1、对DC系数用DPCM编码;
2、在采用Z形扫描后,对AC系数采用RLE行程编码。3、为进一步达到压缩数据的目的,对于DC码和AC行程编码的码字再做基于统计特性的熵编码。JPEG建议使用两种熵编码方法:霍夫曼编码和自适应二进制算术编码。12、对某图像的一个8*8子块进行DCT变换后的AC系数(57,45,0,0,0,0,23,0,-30,-8,0,0,1,0,0,0, 0 , 0 ,0 , 0,..,0) 根据JPEG的基本编码步骤对其进行编码。 已知AC系数的部分Huffman编码表为:
04-----1011 05-----111011 06-----111000 07-----10011
15-----11111110110 16-----111100011 17-----11110010011 21-----11011 25-----111100001
45-----1111111110011001 EOB---1010
11、什么是I图、P图和B图?哪种图像的压缩率最高?哪种图像的压缩率最低?(1) I图(帧内图Intra Picture)
(a)I图是对整幅图像采用JPEG编码的图像,它是一个的帧,采用帧内编码方式,不依赖其他帧,同时是解码的基准帧。 (b)I帧图像的压缩倍数相对较低。
(c)I帧图像是周期性出现在图像序列中的,出现频率可由编码器选择,它也是随机存取的入点。
(2) P图(前向预测帧Predicted Picture)
(a)P图参照前一幅I或P图像做运动补偿编码。
(b)P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。(c)P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,个元素,与对亮度采用细量 (63个)为:
也可以是
软件02 20033069 杜福滨出版1.1版 盗版必究 15
帧内编码。
(3) B图像(双向预测 Bidirectional Prediction)
(a)它参照前一幅和后一幅I或P图像做双向运动补偿编码。 (b)B帧图像采用双向时间预测,可以大大提高压缩倍数。
(c)由于B帧图像采用了未来帧作为参考,因此MPEG-1编码码流中图像帧的传输顺序和显示顺序是不同的
(4) B帧图像的压缩率最高, I帧图像的压缩率最低
12、在MPEG-1编码码流中,图像帧的传输顺序和显示顺序各是什么? I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。I帧主要用于接收机的初始化和信道的获取,以及节目的切换和插入,相对较低。I帧图像是周期性出现在图像序列中的,出现频率可由编码器选择。图像采用帧间编码方式,即同时利用了空间和时间上的相关性。测,可以提高压缩效率和图像质量。个宏块可以是前向预测,也可以是帧内编码。缩倍数。值得注意的是,由于图像帧的传输顺序和显示顺序是不同的13、什么是运动补偿技术?
14.简要说明MPEG-1的P
15.MPEG-1, -2, -4和-7的基本特点是什么?(1)MPEG-1, -2的最主要的目标是通过数据压缩技术传输
(2)MPEG-4目标在于采用现代图像编码方法从轮廓到纹理的思路出发,支持基于视觉内容的交互功能(3) MPEG-7的目标是根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例,较低抽象层将包括形状、对于音频的较低抽象层包括音调、调式、音速、音速变化、音响空间位置。最高层将给出语义信息:如“这是一个场景:一个鸭子正躲藏在树后并有一个汽车正在幕后通过。MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。
第11章 多媒体作品的制作与程序设计
1.多媒体创作工具包括哪些类型?具有哪些特点?(1)基于流程图的创作工具、它将流程图作为作品的主线,把各种数据或事件元素(例如图像、声音或控制按钮)以图标的形式逐个接入流程线中,并集成为完整的系统。间线为基础的创作工具 、所制作出来的节目,是以可视的时间轴来决定事件的顺序和对象上演的时间的。(3)基于页面或卡片的创作工具的工作环境。一页或一张卡片便是数据结构中的一个结点,袋内的一张卡片。(4)基于可视化编程语言的多媒体创作工具。比较高级的“宏”命令,其灵活性不一定能满足系统的全部功能。要在项目设计上有很高的
P帧图像中可以包含帧内编码的部分,即B帧图像采用双向时间预测,B帧图像采用了未来帧作为参考,因此 B图的编码过程?
,利用人眼的视觉特性尺寸、纹理、 、提供一种可以将对象连接于页面或卡片P帧图像只采用前向时间预,实现数字音频,,抓住图像信息传输本质
颜色、运动(轨道)
它类似于教科书中的一页或数据创作工具使用的命令通常是I帧图像的压缩倍数PP帧中的每一可以大大提高压MPEG-1编码码流中和位置的描述。 (B帧, 2)以时帧和图和 视频数据的有效存储和
”
软件02 20033069 杜福滨出版1.1版 盗版必究 16
灵活性和创造性,就应采用编程语言作工具,这需要对语言及开发环境有相当的了解和较丰富的编程经验。
2.简述一个你熟悉的多媒体创作工具的基本功能及特点。
3.根据自己的实践经验,谈谈你是如何完成一个多媒体作品的制作。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igbc.cn 版权所有 湘ICP备2023023988号-5
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务