大家好,今天给大家分享一个PDF 文档翻译及双语对照工具PDFMathTranslate,它能够在保持原有格式与排版的基础上翻译 PDF 论文和电子书。

项目介绍

PDFMathTranslate基于AI布局分析和PDF指令流分析,能够在保持原有格式与排版的基础上翻译PDF论文和电子书。

PDFMathTranslate不仅能翻译PDF文档的内容,还能完整保留LaTeX数学公式、PDF索引目录、图表样式等文档内容,使译文PDF在内容和版式上与原文保持高度一致。

功能特点

保留排版:PDFMathTranslate能完整保留PDF文档中的公式、图表和目录结构,确保翻译后的文档与原文版式一致。

支持多种翻译服务:内置Google翻译、DeepL、Azure、OpenAI和Ollama等多种翻译服务,用户可根据需求选择免费或付费的翻译引擎,并支持最新的大语言模型翻译。

全文与部分翻译:支持全文翻译,也可指定页面范围进行部分翻译,提高翻译效率。

批量处理:提供批量处理功能,可一次性翻译多份PDF文档,省时省力。

双语对照:支持生成双语对照文档,方便用户对照原文和译文。

命令行与图形界面:虽然本质上是一款命令行工具,但也提供了Web页面操作,降低了使用难度。用户可以通过命令行工具快速执行翻译指令,也可以通过启动图形界面在浏览器中完成各种操作。

应用场景

学术研究:对于包含大量数学公式的学术论文,PDFMathTranslate能输出高质量的翻译结果,帮助学者快速理解外文文献。

考研与深造:快速翻译专业书籍,让外文资料不再是学习障碍。

文档批量翻译:在处理大量PDF文档时,PDFMathTranslate的批量翻译功能能让工作事半功倍。

安装使用

安装

命令行工具

确保安装了版本大于 3.8 且小于 3.12 的 Python,安装命令:

pip install pdf2zh

便携式安装

无需预先安装 Python 环境

下载 setup.bat 并双击运行。

容器化部署

拉取 Docker 镜像并运行:

docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh

使用

命令行

执行翻译,生成文件位于 当前工作目录:

pdf2zh document.pdf

更多高级选项:

图形界面

启用服务:

pdf2zh -i

如果您的浏览器没有自动启动并跳转,请用浏览器打开:
http://localhost:7860/

效果预览

总结

PDFMathTranslate是一款专为解决学术研究和科学交流中的语言障碍而设计的开源PDF文档翻译工具。它能够保留原文排版,包括公式、图表和目录结构,支持全文及部分文档的双语对照翻译,并兼容Google、DeepL、Ollama、OpenAI等多种翻译服务。可通过命令行工具或Web页面操作进行快速翻译,适合科研人员和学生使用。

项目地址

https://github.com/Byaidu/PDFMathTranslate