Term_Extractor

上海创凌翻译服务有限公司 (https://www.linguitronics.com/) 开发了一款名称为 Term_Extractor 的工具,功能是从 SDLXLIFF 文件的简体中文 Source 句段中提取名词词性的备选术语。

运行环境

需要 .NET Framework 4.6.1

下载

Term_Extractor 1.0.0.1

使用方法

已注册过 MT Normalizer 的用户把自己的 license 文件放在 Term_Extractor.exe 所在文件夹便可运行该工具。没有注册过 MT Normalizer 的用户请访问MT Normalizer 查看如何注册该工具

腾讯官网上注册账号(注意账号必须要经过实名认证),随后在“控制台”->“访问管理”->“访问密钥”->“API密钥管理”界面中新建密钥并保存 Secret ID 和 Secret Key。在自然语言处理界面中开通 NLP 服务

  • 在 Folder Containing SDLXLIFF Files 文本框中输入 sdlxliff 文件所在的文件夹的路径,在 Secret ID 文本框中输入 Tencent Secret ID,在 Secret Key 文本框中输入 Tencent Secret Key
  • 指定术语出现的最少次数,指定术语的长度(字符数)
  • 点击 Ok 按钮,运行后将在 sdlxliff 文件所在的文件夹中生成一个 XML 表,该表可用 Excel 直接打开。其中第1列为名词词性的备选术语,第2列为上下文,第3列为术语出现的次数,第4列为术语的字符数

注意事项

  • 此工具仅支持简体中文 Source 的 SDLXLIFF
  • 术语出现的最少次数和术语的长度(字符数)都必须大于 1