公务员期刊网 论文中心 正文

数字电视图书馆电子书籍内容适配问题

前言:想要写出一篇引人入胜的文章?我们特意为您整理了数字电视图书馆电子书籍内容适配问题范文,希望能给你带来灵感和参考,敬请阅读。

数字电视图书馆电子书籍内容适配问题

摘要:越来越多的广电运营商部署数字电视图书馆业务,但由于广电系统对于电子书籍内容不具备天然的适配能力,因此需要对电子书籍类内容进行针对性的适配。本文主要对数字电视图书馆电子书籍内容的适配问题进行归纳与研究。

关键词:数字电视图书馆;电子书;格式适配

1引言

随着数字化技术的发展,图书馆业务数字化是大势所趋。越来越多的广电运营商开始部署数字电视图书馆业务,充分发挥有线电视网络的覆盖优势和传输优势,将海量的图书、视频、音频内容直接送到用户家中。目前全国部署数字电视网络图书馆业务的广电运营商已经超过11家。而作为数字电视业务载体的广电机顶盒通常是针对视、音频内容业务而设计,里面包括浏览器、中间件、播放器等软件组件对视、音频内容支持良好,但对数字电视图书馆业务的电子书籍内容支持却并不友好,因此数字电视图书馆业务在实施时需着重考虑对电子书籍内容格式的支持与适配,否则电子书籍内容将可能无法在机顶盒上正常处理及呈现,极大影响数字电视图书馆业务的用户体验。针对上述问题,本文对数字电视图书馆电子书籍内容的适配问题进行归纳与研究。

2电子书籍格式归纳

目前电子书籍的种类多样,但所适用的场景各不一样,某些格式针对的场景较局限,某些格式需要专门的软件甚至配套硬件设备进行解码才能阅读。因此需要归纳出适合数字电视场景下的电子书格式。(1)书籍扫描图片内容提供商通过对书籍的页面进行扫描,形成一系列图片的集合。优点:广电的机顶盒的浏览器基本都具有图片处理及呈现能力,因此数字电视场景下支持良好。缺点:非文本格式,无法进行排版、格式调整;进行放大、缩小等操作会因为图片分辨率的限制出现内容模糊的问题;由于是非文本,无法对书籍中的内容进行识别,因此无法支持如书籍内容搜索、书籍内容语音转换等操作。(2)TXT纯文本优点:体积小,适用于大多数设备。缺点:内容排版不适配机顶盒浏览器。不支持分章节、不支持图片、不支持封面。(3)HTML优点:最适配机顶盒浏览器的格式,可支持分章节、图片、封面等书籍呈现要求。在业务上可以对内容搜索、语音转换等操作进行支持。缺点:一般电子书籍内容并无HTML格式,因此需要从别的格式进行转换。(4)PDF优点:提供最好的排版效果,适用于复杂排版的电子刊物,创建和排版的软件专业读和功能性都很强。缺点:广电机顶盒中间件通常没有集成PDF格式的解析工具,因此需要广电机顶盒中间件进行二次开发集成PDF解析器。(5)ePub排版基于HTML技术,能提供接近PDF格式的功能。优点:常见电子书格式,体积相对较小,对阅读呈现设备的性能要求较低。排版效果良好,支持分章节、图片、封面等书籍呈现要求。在业务上可以对内容搜索、语音转换等操作进行支持。缺点:广电机顶盒中间件通常没有集成ePub格式的解析工具,因此需要广电机顶盒中间件进行二次开发集成ePub解析器。(6)其他格式AZW3格式由Amazon公司推出,主要应用于Amazon自己研发的阅读器Kindle上。CAJ格式是中国学术期刊全文数据库中文件的一种格式。必须使用CAJ浏览器来阅读。这一类电子书籍通常需要专门的阅读器来进行阅读,不适宜用于数字电视图书馆业务。

3数字电视图书馆系统电子书内容适配难点

3.1机顶盒中间件、浏览器对内容格式的不适配

传统广电机顶盒所定位的应用场景通常以数字电视信号的接收、处理、解码相关。即使进入了双向化的广播电视网络时代,出现了更多基于IP的双向化业务,例如直播电视时移回看、SP专区内容互动点播、个性化主页,并且这类业务在行业内逐渐占据主导地位,但这类业务的业务核心都是视、音频内容的处理和呈现。因此,广电机顶盒的中间件通常是根据视、音频内容业务的需求进行设计,浏览器也会为了适配视、音频的内容做定制化的裁剪,例如机顶盒的中间件都会内置有视频播放器。但是对于电子书籍内容的处理,广电机顶盒的适配性则较差。例如对于PDF及ePub格式,由于机顶盒浏览器中没有内置PDF及ePub对应的解析器,因此机顶盒无法处理PDF及ePub格式的内容,同时机顶盒的浏览器通常是定制化开发,无法在用户侧安装第三方解析器,因此想要让机顶盒具备PDF或ePub格式文件的处理能力,只能由机顶盒软件开发商定制集成PDF或ePub格式的处理模块,并对机顶盒进行软件升级。

3.2机顶盒性能原因

由于成本原因,广电机顶盒的配置一般逊色于主流电子产品,例如内存容量为512M~1G的机顶盒是广电机顶盒的主流。机顶盒浏览器在加载处理较大文件时性能会出现性能瓶颈。在数字电视图书馆的业务中,若电子书的内容为扫描图片时,机顶盒浏览器需要加载整张图片,如果图片过大,则会使加载时间过长,影响用户体验,甚至导致机顶盒卡机。而如果电子书内容为PDF或ePub格式,若浏览器将整份文件下载到本地再通过浏览器加载,同样会导致加载时间过长及卡机的问题。

3.3内容安全方面考虑

广电网络作为意识形态的阵地、党的宣传喉舌,广电网络在内容安全方面需要高度把控。因此,广电运营商在进行内容建设时通常要求内容提供商将内容注入到广电运营商的内部CDN上,实现对内容的可管可控。对于视音频类的内容资源,广电运营商在内部通常已经实现了包括转码、存储、推流等配套服务系统,视频类业务的对接非常简单。但对于数字电视图书馆的电子书籍类内容,广电运营商内部通常缺乏对接系统,需要为其部署专门的实现存储、内容预处理、书籍内容页码索引等服务系统。

3.4用户体验方面考虑

在用户角度,除了获取书籍中的内容之外,还需考虑内容排版方式、页码定位、目录索引、字体清晰度、操作便利性能。不同的电子书籍格式,将会带来不通的用户体验。例如对于书籍扫描图片,排版固定,并不能针对电视端呈现的效果进行自适应优化。当用户进行放大操作时,图片内容可能会模糊。此外由于是非文本,无法提取书籍的文本内容,无法实现内容检索、语音转换等功能。对于纯TXT格式,则不支持分章节、不支持图片、不支持封面。用户体验同样不佳。

4数字电视图书馆电子书籍内容适配建议

实施部署数字电视图书馆业务时,需针对字电视图书馆系统电子书内容适配难点,通盘考虑,从内容格式的遴选、前端预处理、终端适配等角度进行针对性的部署。建议选取扫描图片、TXT、ePub格式的电子书内容源,并在头端针对各种格式进行预处理并转化为HTML;对于图片的预处理包括图片压缩、目录索引建立;对于TXT格式的预处理包括文本提取、目录索引建立、排版设置;对于ePub格式,由于ePub基于HTML格式,因此转化比较简单,亦可使用开源工具进行解析后转换。预处理并转换后采用HTML格式进行传输。机顶盒浏览器解析HTML并最终呈现给用户。数字电视图书馆电子书籍内容适配过程示意图如图1所示。

5结语

数字电视网络馆是助推全民阅读活动,打造新型的阅读阵地,构建新型的现代化数字阅读体系的有力举措,建设好数字电视图书馆将成为广电运营商新的业务发力点。而做好内容适配工作则是发展数字电视图书馆业务的基础、前提,只有做好这项前提工作,才能不断丰富数字电视图书馆的内容,提高操作便利性,为用户提供更好的阅读体验,让数字电视图书馆蓬勃发展。

参考文献

[1]马倩.浅析电子书发展现状及未来趋势[J].农业图书情报学刊,2018(9):120-124.

作者:朱泽智 向燕冰 班毅 李歆昕 单位:广西广播电视信息网络股份有限公司