多语言知识库
构建支持多语言的国际化知识库,实现翻译辅助、术语管理、跨语言检索。
适用场景
- 阅读外文文献资料,需要翻译辅助
- 管理多语言版本的笔记(中/英/日等)
- 建立专业术语库,保持翻译一致性
- 跨语言知识检索和关联
前置准备
必需插件
| 插件 | 用途 | 安装方式 |
|---|---|---|
| Text Generator | AI 翻译生成 | 社区插件市场 |
| Translator | 快速翻译 | 社区插件市场 |
| LanguageTool | 语法检查 | 社区插件市场 |
推荐插件
| 插件 | 用途 |
|---|---|
| Dictionary | 多语言词典 |
| Various Complements | 多语言自动补全 |
AI 模型推荐
翻译质量排序:
1. GPT-4 / Claude 3.5 - 最佳翻译质量
2. DeepSeek V3 - 中文翻译优秀
3. Qwen 2.5 - 中英互译优化
4. Llama 3.2 - 本地翻译(隐私优先)双语笔记模板
markdown
---
title: {{title}}
lang: bilingual
original: en
translated: zh
---
# {{title}}
## English
[Original content]
## 中文
[Translated content]
## 术语对照
| English | 中文 |
|---------|------|
| term1 | 术语1 |
| term2 | 术语2 |
## 备注
<!-- 翻译笔记、文化差异说明 -->翻译 Prompt
markdown
# 专业翻译
## 任务
将以下内容翻译成中文。
## 原文
{{content}}
## 领域
{{domain}} # 技术/学术/商业/通用
## 要求
1. 保持原文语气和风格
2. 专业术语保留原文(首次出现附中文)
3. 人名、地名保留原文
4. 添加必要的译者注
5. 使用规范的中文表达
## 输出格式[翻译内容]
术语对照:
- Term1:术语1
- Term2:术语2
译者注: [如有必要]
text
详细操作步骤
步骤一:创建术语库
markdown
---
title: 术语库 - {{领域}}
type: terminology
---
# 术语库
## 计算机科学
| English | 中文 | 缩写 | 备注 |
|---------|------|------|------|
| Machine Learning | 机器学习 | ML | |
| Deep Learning | 深度学习 | DL | |
| Natural Language Processing | 自然语言处理 | NLP | |
| Large Language Model | 大语言模型 | LLM | |步骤二:配置翻译工作流
yaml
# Text Generator 配置
Prompt Templates:
- name: "专业翻译"
prompt: |
将以下{{domain}}领域的内容翻译成中文。
参考术语表:{{terminology}}
要求:
1. 专业术语首次出现用"中文(English)"格式
2. 保持原文段落结构
3. 添加必要的译者注
原文:{{content}}步骤三:使用 QuickAdd 自动化
javascript
// QuickAdd 脚本:创建双语笔记
async function createBilingualNote(title, originalContent, lang) {
// 1. 翻译内容
const translated = await textGenerator.generate(
`翻译以下${lang}内容为中文:\n${originalContent}`
);
// 2. 提取术语
const terms = await textGenerator.generate(
`从以下内容提取专业术语:\n${originalContent}`
);
// 3. 创建笔记
const template = `---
title: ${title}
lang: bilingual
original: ${lang}
---
# ${title}
## 原文 (${lang})
${originalContent}
## 中文翻译
${translated}
## 术语对照
${terms}
`;
await app.vault.create(`笔记/${title}.md`, template);
}高级技巧
1. 段落级双语对照
markdown
## 概念介绍
**English**: Machine learning is a subset of artificial intelligence...
**中文**: 机器学习是人工智能的一个子集...
---
<!-- 使用注释分隔,阅读时可折叠 -->2. 多语言标签系统
markdown
---
tags:
- lang/en # 原文语言
- lang/zh # 翻译语言
- domain/AI # 领域
- level/advanced # 难度
---3. 跨语言关联
markdown
# 中文笔记
相关英文资料:
- [[English Version - Machine Learning Basics]]
- [[Paper - Attention Is All You Need]] (English)
翻译笔记:
- [[翻译笔记 - Transformer 架构解析]]4. Dataview 多语言查询
dataview
TABLE
title as "标题",
original as "原文语言",
date as "翻译日期"
FROM #lang/bilingual
WHERE original = "en"
SORT date DESC常见问题
Q1: 翻译质量不好,专业术语错误?
解决方案:
- 建立领域术语库,在 Prompt 中引用
- 使用更强大的模型(GPT-4 / Claude)
- 分段翻译,人工校对关键术语
markdown
# 优化后的翻译 Prompt
参考以下术语表翻译,保持术语一致性:
术语表:
- Transformer -> Transformer(保留原文)
- Attention -> 注意力机制
- Token -> 词元
原文:{{content}}Q2: 如何批量翻译多篇笔记?
方案一:使用 Templater 脚本
javascript
<%*
// 批量翻译当前文件夹下的所有英文笔记
const folder = app.vault.getAbstractFileByPath("Papers");
const files = app.vault.getMarkdownFiles().filter(f =>
f.path.startsWith("Papers") &&
app.metadataCache.getFileCache(f)?.frontmatter?.lang === "en"
);
for (const file of files) {
const content = await app.vault.read(file);
const translated = await textGenerator.generate(
`翻译为中文:\n${content}`
);
// 保存翻译版本
await app.vault.create(
file.path.replace(".md", "-zh.md"),
translated
);
}
_%>方案二:使用 Python 脚本
python
import os
from openai import OpenAI
client = OpenAI()
def translate_file(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
response = client.chat.completions.create(
model="gpt-4",
messages=[{
"role": "user",
"content": f"翻译为中文:\n{content}"
}]
)
return response.choices[0].message.contentQ3: 如何管理多语言版本?
方案:使用 frontmatter 标识
markdown
---
title: Machine Learning Basics
lang: en
lang_version: original
translations:
- zh: [[机器学习基础]]
- ja: [[機械学習の基礎]]
---实际案例
案例:阅读英文论文并生成中文笔记
markdown
## 工作流程
1. 导入 PDF,使用 PDF 插取文本
2. AI 分段翻译,保留原文结构
3. 提取关键术语,加入术语库
4. 生成中文摘要和笔记
5. 建立中英文双向链接效率提升
- 阅读速度提升 50%(有翻译辅助)
- 术语一致性 95%+(术语库管理)
- 检索效率提升 3 倍(跨语言检索)