一款开源PDF文档翻译神器,翻译后完整保留排版,支持私有化部署
大家好,今天给大家分享一个PDF 文档翻译及双语对照工具PDFMathTranslate
,它能够在保持原有格式与排版的基础上翻译 PDF 论文和电子书。
项目介绍
PDFMathTranslate
基于AI布局分析和PDF指令流分析,能够在保持原有格式与排版的基础上翻译PDF论文和电子书。
PDFMathTranslate
不仅能翻译PDF文档的内容,还能完整保留LaTeX数学公式、PDF索引目录、图表样式等文档内容,使译文PDF在内容和版式上与原文保持高度一致。
功能特点
保留排版:PDFMathTranslate能完整保留PDF文档中的公式、图表和目录结构,确保翻译后的文档与原文版式一致。
支持多种翻译服务:内置Google翻译、DeepL、Azure、OpenAI和Ollama等多种翻译服务,用户可根据需求选择免费或付费的翻译引擎,并支持最新的大语言模型翻译。
全文与部分翻译:支持全文翻译,也可指定页面范围进行部分翻译,提高翻译效率。
批量处理:提供批量处理功能,可一次性翻译多份PDF文档,省时省力。
双语对照:支持生成双语对照文档,方便用户对照原文和译文。
命令行与图形界面:虽然本质上是一款命令行工具,但也提供了Web页面操作,降低了使用难度。用户可以通过命令行工具快速执行翻译指令,也可以通过启动图形界面在浏览器中完成各种操作。
应用场景
学术研究:对于包含大量数学公式的学术论文,PDFMathTranslate能输出高质量的翻译结果,帮助学者快速理解外文文献。
考研与深造:快速翻译专业书籍,让外文资料不再是学习障碍。
文档批量翻译:在处理大量PDF文档时,PDFMathTranslate的批量翻译功能能让工作事半功倍。
安装使用
安装
命令行工具
确保安装了版本大于 3.8 且小于 3.12 的 Python,安装命令:
pip install pdf2zh
便携式安装
无需预先安装 Python 环境
下载 setup.bat 并双击运行。
容器化部署
拉取 Docker 镜像并运行:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
使用
命令行
执行翻译,生成文件位于 当前工作目录:
pdf2zh document.pdf
更多高级选项:
图形界面
启用服务:
pdf2zh -i
如果您的浏览器没有自动启动并跳转,请用浏览器打开:http://localhost:7860/
效果预览
总结
PDFMathTranslate是一款专为解决学术研究和科学交流中的语言障碍而设计的开源PDF文档翻译工具。它能够保留原文排版,包括公式、图表和目录结构,支持全文及部分文档的双语对照翻译,并兼容Google、DeepL、Ollama、OpenAI等多种翻译服务。可通过命令行工具或Web页面操作进行快速翻译,适合科研人员和学生使用。
项目地址
https://github.com/Byaidu/PDFMathTranslate