整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

PDF转HTML转换器有哪些?你还不知道的宝藏软件

PDF转HTML转换器有哪些?你还不知道的宝藏软件

日常工作中,我们通常处理的文件格式是PDF,这是因为PDF文件具有传输方便、体积小、储存方便、在不同设备上打开不会出现格式混乱和乱码等优点。但是,有时候我们需要将PDF文件转换成其他格式,以满足不同的工作需求。其中,HTML文件是一种超文本文件,通常只能通过浏览器打开。那么,你知道有哪些PDFHTML转换器吗?今天,我将为大家介绍几款PDF转换器,让我们轻松解决这一问题。

新ABBYY FineReader 14于2017年1月正式发布,它将文档转换、PDF管理和文档对比功能结合到单一的现代界面,提供了一体化商业解决方案,通过基于纸质的PDF文件和扫描文件优化了日常工作任务。安装ABBYY FineReader 14之前,先要了解一下这个版本对系统的要求都有哪些:

注意:ABBYY FineReader 14对系统的要求相对ABBYY FineReader 12来说有所不同。

ABBYY FineReader 14系统要求:

?Microsoft Windows 10 / 8.1 / 8 / 7 。

?Microsoft Windows Server 2016 / 2012 / 2012 R2 / 2008 R2 。

?界面语言要求Windows支持相应的语言。

?1GHz或者SSE2指令集支持的更快的x86 或 x64处理器。

?1GB内存(建议4GB内存)。

?1.2GB硬盘空间用于标准程序安装,1.2GB自由空间用于优化程序运行。

?监视器要求:1024x768分辨率或更高

?激活产品时需要联网。

?键盘、鼠标或其他指示设备。

知识补充:ABBYY FineReader 14支持的文件格式:

1、输入文件格式:

?PDF文档,包括PDF/A。

?图像格式—TIFF、JPEG、JPEG 2000、JBIG2、PNG、BMP、PCX、GIF、DjVu、XPS(需要Microsoft .NET Framework 4.0)。

?可编辑的格式(要从可编辑的格式创建PDF文件,要求电脑上安装Microsoft Office或Apache OpenOffice)—DOC(X)、XLS(X)、PPT(X)、VSD(X)、HTML、RTF、TXT、ODT、ODS、ODP。

2、保存格式:

?PDF(可搜索、仅图像、文本和图像),包括PDF/A (1a、1b、2a、2b、2u、3a、3b、3u)。

?图像格式—TIFF、JPEG、JPEG 2000、JBIG2、PNG、BMP、PCX、DjVu。

?可编辑格式—DOC(X)、XLS(X)、PPT、HTML、RTF、TXT、CSV、ODT。

?电子书格式—EPUB、FB2。

更多有关ABBYY FineReader 14的内容,可点击ABBYY下载(http://www.abbyychina.com/xiazai.html),安装最新版本获取更多信息。

语管理应用

术语管理工具指用于管理术语数据的软件程序,借助专业的术语管理工具可以进行有效的术语管理。但研究发现国内语言服务企业存在术语管理价值重视程度不足,术语工具普及度较低等问题。本文将从实际应用的角度出发,介绍术语管理工具通常具备的几大功能以及相关工具。



术语转换

术语数据转换功能是指将非结构化的扫描文件转换为计算机可以识别的、编辑的数据文件,或者从一种特定的数据格式转换为其他格式。术语管理工具通常可以将术语数据导入或导出为指定的术语格式。


相关工具:

1. Déjà Vu

在Déjà Vu的术语管理模块中,可以将分隔符分隔的文本文件、Access术语文件、ODBC数据库术语文件、Excel术语文件以及MultiTerm术语文件导入为DéjàVu术语库格式文件(.dvtdb),也可将Déjà Vu术语库格式文件(.dvtdb)导出为分隔符分隔的文本文件、Access术语文件、ODBC数据库术语文件、Excel术语文件以及MultiTerm术语文件,从而实现了分隔符分隔的文本文件、Access术语文件、ODBC数据库术语文件、Excel术语文件、MultiTerm术语文件以及Déjà Vu术语库格式文件(.dvtdb)之间的相互转换。

Déjà Vu术语转换页面


2. SDL MultiTerm Desktop

SDL MultiTerm Desktop支持将术语数据导出为XML、HTML、HTM、RTF、TXT格式的术语文件。用户可以在导出时设置自己的术语数据导出方式,例如,定义导出哪些条目、导出哪些字段,以及如何进行标记。

但SDL MultiTerm仅可从MultiTerm XML文件导入数据。若要从其他格式导入术语数据,可以使用其产品包自带的组件SDL MultiTerm Convert将数据转换成 MultiTerm XML格式。SDL MultiTerm Convert支持的文件格式有:XLS、*.mtw、 TXT、CSV、TBX、*.XML 、*.tdb 文件以及*.mdb 文件。

SDL MultiTerm Convert转换格式选择


3. Trados Glossary Converter

Trados Glossary Converter也是SDL旗下的一个应用程序,是相对SDL MultiTerm更简单轻便的一个术语转换工具。用户只需进行简单操作,便可实现在不同的词汇表格式(包括各种Excel样式,TBX和UTX)和MultiTerm术语库(XTD和XML)之间进行转换。


4. memoQ

在memoQ的资源控制台中也可实现术语表的转化,可导入的文件类型有TBX、CSV和XLSX,可导出的文件类型有CSV、XLSX和Multiterm XML。

memoQ创建术语库界面

术语标注

术语标注通过自动化的术语管理工具在翻译文件中自动查找库中出现过的术语,并以批注的方式插入到文本编辑器中,这是常见的术语标注方法。翻译之前,可利用术语工具完成术语自动标注工作,从而大大减少术语查询工作量,提升翻译效率。


相关工具:

当前国内代表性的术语标注工具有火云术语语帆术语宝等。以语帆术语宝为例,选择术语标注上传要进行标注术语的文档或者术语要标注的文本,选择术语库,就可以在该段文字中将术语标注出来。

语帆术语宝自动标注界面
(图源:公众号“语帆术语宝”)


术语提取

术语提取是从术语收集过程中所得材料或数据中分析并识别术语的过程。根据工作主体不同,术语提取可分为人工手动提取和机器自动提取。机器自动提取术语的方法主要包括基于词典、基于统计、基于语言规则、基于机器学习的方法以及结合其中若干种方法。基于词典的方法进行提取的机制是匹配专业词典中的词条。基于统计的方法利用的是术语的统计属性,以此进行术语识别,从而完成提取。基于语言规则的方法则结合外部信息(即术语上下文)和内部信息(即术语的内部组成成分)来识别术语,完成提取。基于机器学习的方法如利用统计模型(如隐马尔科夫模型)进行识别中文术语。


相关工具:

此类工具包括计算机辅助翻译工具中自带的工具,如memoQ、Déjà Vu、Wordfast等,以及独立型工具,如AntConc、SDL MultiTerm、SynchroTerm、TermoStat Web、Lexterm、VocabGrabber、TerMine、Fivefilters Term Extraction、语帆术语宝 (Termbox) 等。下图展示的是语帆术语宝提取术语和自动翻译的过程。此类工具可将相应格式的单语或双语文件导入,工具自动提取词组,根据词频高低排列。有些工具可以根据内置数据库或第三方资源对术语进行自动翻译,供译员选择和确认。

语帆术语宝提取术语和自动翻译界面

(图源:王华树,王少爽,2019)

今天公众号的副推文还介绍了Trados、memoQ和语帆术语宝的术语提取方法,感兴趣可移步阅读~

术语应用

术语应用泛指在术语数据库或术语系统中进行术语的搜索、识别和编辑等功能。在创建术语库的时候,通常会明确术语库的使用对象、使用范围、语言对、术语结构、设计字段、定义层级结构以及项目其他属性等信息。在翻译的时候,系统可以自动识别译文中的相应的术语,并根据设置的规则,相应地插入到译文区。用户也可以在单独的一个或多个术语库中进行串行或并行搜索,快速找到所需要的专业术语。用户也可针对某个术语或批量的术语进行术语编辑操作,比如,修改术语状态、标记术语级别、删除术语信息等。


相关工具:

各大术语管理软件均有较完备的术语应用功能,用户可在使用时多加摸索。以SDL MultiTerm为例,该应用程序支持模糊搜索、通配符搜索、全文搜索、多术语库搜索、同形异义词搜索等多种检索方式,最大程度地满足用户的需求;还支持术语的批量编辑,更简便地确保术语一致性。


术语质量保障

术语质量保障分为两个方面。第一,术语入库质量机制保障,根据专门的流程,确保术语各项属性信息遵从项目的术语规范或术语风格指南。第二,对翻译项目中术语质量的验证,通过设置术语质量标准,加载核实的术语库,对项目中的术语进行验证。在 SDL Trados Studio 中,在翻译项目完成之后,通过“术语验证器”进行全局术语质量验证。


小结

术语管理对语言服务企业管理的改进和个人翻译质量和效率的提升都具有重大意义。随着语言服务的集群化、规模化和信息化发展,社会化分工程度逐渐加深,语言服务人才趋向多元化,术语管理人才的社会需求也会越来越大。为此,译者注重术语管理能力培养,对个人业务能力提升和职业发展都有积极意义。



参考文献:

[1] 王华树. 中国语言服务企业术语管理调研:问题与对策[J]. 中国翻译, 2018, 39(4): 67-72.

[2] 王华树,王少爽. 翻译场景下的术语管理:流程、工具与趋势[J]. 中国科技术语, 2019, 21(3): 9-14.

[3] 王华树,张静. 信息化时代口译术语管理及其技术应用研究[J]. 外文研究, 2017, 5(4): 72-77, 105-106.

[4] SDLTrados.2021 开工必读 | SDL MultiTerm 最全技术方案(更新版).Trados,2021,https://mp.weixin.qq.com/s/OcJSmH2pu8SMcyontBcTjA.

[5] 语帆术语宝.语帆术语宝,一站式术语管理!.语帆术语宝,2021,https://mp.weixin.qq.com/s/ksgXh9guh32-3UK3hZ8Nfw.


关注微信公众号“语言服务行业”,“翻译技术教育与研究”,了解更多语言服务行业与翻译技术相关的资讯和洞察~