Term_Extractor
上海创凌翻译服务有限公司 (https://www.linguitronics.com/) 开发了一款名称为 Term_Extractor 的工具,功能是从 SDLXLIFF 文件的简体中文 Source 句段中提取名词词性的备选术语。
运行环境
需要 .NET Framework 4.6.1
下载
使用方法
已注册过 MT Normalizer 的用户把自己的 license 文件放在 Term_Extractor.exe 所在文件夹便可运行该工具。没有注册过 MT Normalizer 的用户请访问MT Normalizer 查看如何注册该工具
在腾讯官网上注册账号(注意账号必须要经过实名认证),随后在“控制台”->“访问管理”->“访问密钥”->“API密钥管理”界面中新建密钥并保存 Secret ID 和 Secret Key。在自然语言处理界面中开通 NLP 服务
- 在 Folder Containing SDLXLIFF Files 文本框中输入 sdlxliff 文件所在的文件夹的路径,在 Secret ID 文本框中输入 Tencent Secret ID,在 Secret Key 文本框中输入 Tencent Secret Key
- 指定术语出现的最少次数,指定术语的长度(字符数)
- 点击 Ok 按钮,运行后将在 sdlxliff 文件所在的文件夹中生成一个 XML 表,该表可用 Excel 直接打开。其中第1列为名词词性的备选术语,第2列为上下文,第3列为术语出现的次数,第4列为术语的字符数

注意事项
- 此工具仅支持简体中文 Source 的 SDLXLIFF
- 术语出现的最少次数和术语的长度(字符数)都必须大于 1