首 页       用户登录  |  用户注册
设为首页
加入收藏
联系我们
按字母检索 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
按声母检索 A B C D E F G H J K L M N O P Q R S T W X Y Z 数字 符号
您的位置: 5VAR论文频道论文中心计算机论文计算机理论
   开源软件对电子文件格式选用的影响      ★★★ 【字体: 】  
开源软件对电子文件格式选用的影响
收集整理:佚名    来源:本站整理  时间:2012-07-06 19:46:21   点击数:[]    

[本篇论文由5var5VAR论文频道为您收集整理,5VAR论文频道http://paper.5var.com将为您整理更多优秀的免费论文,谢谢您的支持]【内容提要】开源软件运动由志愿者发起,已经在计算机软件界形成一种潮流。电子文件格式的源代码公开,有利于增强文件格式的适用性和可靠性,有利于减少信息丢失风险和降低保存费用。本文分析了两种主流的文件格式PDF和DjVu和国外的其他一些文件格式,在文件流通和文件保存两个环节比较了它们那各自的特点和在开源运动中所处的地位。在此基础上,本文指出支持开源程度将成为今后选用电子文件格式的主要考虑因素。 
 
【关 键 词】开源软件/电子文件/文件格式选用 
 
 

    1.引言
    本文所述的电子文件,指在文件管理体系中起到传送、鉴定和保存作用的以页面形式显示的数字文件。电子文件广泛应用于图书出版、档案管理、电子商务、电子政务等领域。目前,普遍接受的两种的电子文件格式是PDF和DiVu。PDF(Portable Document Format,便携式文档格式)是由Adobe公司开发的格式。DjVu格式是由AT&T实验室开发的格式。从实现上来说,PDF和DjVu分别是有代表性的基于图形的格式和基于图像的格式。常见的电子文件格式还有微软的CHM和LIT、华康WDL、方正CEB、超星PDG、书生SEP等。
    字处理文件格式有时也起到电子文件的作用,如RTF、微软DOC、金山WPS等;扩展标记语言XML经常用于信息的共享和交换,在附加样式单或经过转换后也能够以页面形式显示。因为使用它们的主要方式有所不同,本文的讨论将不涉及这些格式。
    开源软件的历史不长,但是已经形成了一种潮流。开源软件对电子文件管理产生了显著的影响。向大众开放文件格式的源代码(包括读写、转换、加密等),有利于这种格式增强适用性和可靠性,有利于这种文件格式获得广泛接收。选用开源的文件格式有助于文件的长期保存,减少信息丢失的风险。
    本文以PDF和DjVu为研究对象,对照国外的其他一些格式,从文件流通和文件保存两个方面比较它们各自的特点和在开源软件运动中所处的地位。本文指出支持开源的程度,将成为今后用户选用电子文件格式时的考虑的主要因素。
    第2节分析文件格式的开源情况。第3节和第4节分别讨论开源软件对文件流通和文件保存环节的影响。第5节是对其他国外格式的一个简单调查。第6节是结论。
    2.开源情况
    开源软件(Open Source Software),也称为自由软件(Free Software),其中的“Free”指自由地使用、学习、修改和分享软件。分享开源软件的自由意味着人们可以使用和翻译这些软件而不用支付任何费用。有些可以免费使用的软件,如共享软件(shareware)和免费软件(freeware),不能被用来研究、修改和分享,所以不是开源软件。
    开源软件由一些志愿者发起,已经开发出了OS、GUI以及大量的应用程序。Linux是开源软件的典型代表,在质量、外观和健壮性上都能与私有软件(如Windows)媲美。著名的开源软件社区有SourceForge(http://www.sourceforge.org)等。像IBM和Sun这样的大型计算机公司也支持和开发开源软件。
    越来越多的欧美地区的管理部门已经制定或正在制定提倡使用开源软件代替私有系统的政策。这不仅使它们不再依赖于商业软件供应商,而且也帮助扶持了自己的软件开发产业。由于开源软件成为潮流,而且质量上乘,许多政府选择开源软件进行本地化,为政府信息化服务。
    PDF是商业公司开发的一种文件格式,已经有很长的历史。PDF的规范是公开的,如最新的PDF1.5规范可以网上免费获取。Adobe公司的电子文档阅读器Acrobat Reader是免费的。但是,处理PDF文件的主要应用软件Acrobat、Distiller、Designer等是商业软件,价格比较昂贵。
    由于PDF格式非常复杂,特别是使用了对象技术,开发PDF应用是一项复杂的工作。KPDF是Unix/Linux的第三方阅读器。一些免费的PDF库,如PDFlib和xpdf,是二进制的,而且功能不够完整。这就形成了一个技术壁垒。国内只有很少的商业公司有能力开发PDF应用软件。
    近年来,随着开源运动的发展,出现了很多开源的PDF项目。其中,规模较大的是iText,它是一个由Java编写的开源的PDF库,带有简单的GUI。同时,这个项目组用C#编写了iTextSharp,供Windows.NET平台上的用户使用。iText对PDF的读写提供了全面的支持。
    比较而言,DjVu最初是由实验室开发的,设计的出发点就支持开源。DjVu的主要资源网站有http://djvu.org等。DjVu的参考库包含了由C++编写的解码程序和部分编码程序,其中解码程序具有基于Qt技术的GUI以及NS浏览器插件,编码程序是一些命令行子程序。另外,Windows平台上开源项目WinDjView是一个小巧的DjVu阅读器,功能较完善,并提供Visual C++的源代码。
    AT&T实验室把DjVu的商业开发权利转让给了 LizardTech公司(http://www.lizardtech.com)。LizardTech的主要DjVu产品有免费DjVuSolo,收费的Document Express Editor和Document Express Enterprise。DjVuSolo支持由图像制作单个DjVu文件。Document Express Enterprise是一个工作流式的制作工具,目前最新的版本是5.1。它能够从图像文件或PDF/PS文件批量制作DjVu文件。另外,它支持中英文的OCR,以及添加数字水印。
    3.文件流通
    电子文件的流通,是指电子文件在机构业务活动中的发文、文件流转和收文等过程。在电子文件的生命周期中,文件的流通是很重要的环节。在现实中,各机构使用的平台和软件多种对样。如果发送方与接收方的软件不兼容,那么即使文件传送成功,接收方也未必能读取信息,为此,需要选择一种通用的文档格式,使电子文件能实现无障碍流通。
    PDF文档由一系列的页面组成,每幅页面都包括正文、字形、边缘、版面、图形和背景等数据。PDF文件能够在各种软件中生成,并保留原有文件的内容和外观。PDF文档显示风格一致,能够满足政府、法律、财经和IT等行业对于文档或表单的严格规范要求。
    PDF支持动态表单系统,提供加注释标记或数字签章的功能,为文件收发双方针对电子文件的交互流动提供了可能,适用于机构内部公文呈转或在线交易。PDF提供不同级别的安全控制,有利于文件的安全管理。PDF提供比较、鉴定工具,有利于确认文件的真实性、完整性。不过,这些功能只有Adobe的软件才能很好地支持。
    DjVu格式将图像分为背景层(纹理和图片)、前景层(文本和线条)和掩码层(形状库)。DjVu用高分辨率来还原文字,从而最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。DjVu采用分层显示,而不是等到整幅图片都被解码之后才显示,使得图片显示的速度有很大提高。
    DjVu具有与PDF类似的超链接、注释、元数据功能。DjVu的前景层能够被OCR识别,识别的结果被插入到可搜索的隐藏文本层中。目前,OCR引擎没有包含在DjVu的开源代码中。由于尚缺乏中文OCR的开源代码,这将成为DjVu进入中文市场的一个不利因素。
    DjVu格式能够与数字水印系统相结合,保证数字文件的真实性和在网络上被合法使用。可以将一个标识图像与宿主图像数据进行叠加,形成带可见水印的图像,或者将一个特定的序列号经过加密算法嵌入宿主图像数据得到不可见水印。
    开源对文件的流通和使用有下面两个方面的影响:
    (1)适用性。开源软件能够按照具体的业务需求进行定制或进行有效的二次开发。Adobe公司并没有提供PDF的开源代码,因此相当长时期内PDF的定制就显得非常困难。需要指出的是,DjVu的开源代码数学性很强,修改起来并不容易。DjVu代码的可读性和可修改性都有提高的必要。
    (2)可靠性。源代码对于理解文件格式的工作原理和修补文件格式的错误是很重要的。PDF是一种复杂的结构化文件格式,有理由对它的安全漏洞和“后门”问题给予更多的关注,特别是在敏感的应用场合。国内用户有时更愿意选择类似PDF的国产格式,如方正CEB等。
    4.文件保存
    电子文件格式的选

[1] [2]  下一页


Tags:


文章转载请注明来源于:5VAR论文频道 http://paper.5var.com。本站内容整理自互联网,如有问题或合作请Email至:support@5var.com
或联系QQ37750965
提供人:佚名
  • 上一篇文章:关于注重护生入科指导,提高实习质量

  • 下一篇文章:软件工程和质量保证
  • 返回上一页】【打 印】【关闭窗口
    中查找“开源软件对电子文件格式选用的影响”更多相关内容 5VAR论文频道
    中查找“开源软件对电子文件格式选用的影响”更多相关内容 5VAR论文频道
    最新热点 最新推荐 相关新闻
  • ››中小企业办公自动化系统的设计与实...
  • ››未雨绸缪:关于我国电子商务税收对...
  • ››网上书店为钱做秀 行业走势两极分...
  • ››Win2000索引服务的WEB应用
  • ››宽带化――电信发展的必由之路务
  • ››电子商务中x种错误思路和做法
  • ››网络营销与传统营销相比有何优势
  • ››Internet的下一个热点 从内容走向服...
  • ››基于CNAPS的流水号管理方法
  • ››网络时代的财务与会计:管理集成与...
  • ››开源软件对电子文件格式选用的影响...
  •   文章-网友评论:(评论内容只代表网友观点,与本站立场无关!)
    关于本站 - 网站帮助 - 广告合作 - 下载声明 - 网站地图
    Copyright © 2006-2033 5Var.Com. All Rights Reserved .