首先想到的肯定是翻译软件,比如有道,谷歌翻译等,最好的办法就是直接把PDF扔进去,然后整齐的拿出来!!!
可是,我想多了,扔进去之后,结果却是这样的……
我怕这个会被退回重做,而且翻译完成后不知道在说什么。这里我决定自己一段一段地翻译,或者说是一块一块地翻译。我采取的解决办法如下:
软件大致是这样的(可以参考下面链接下载,其实我选择这几个软件是因为我电脑里一般都有,但是我一般都是单独用)
天若OCR文字识别()
DeepL翻译:世界上最准确的翻译
数学公式识别工具——Mathpix Snip – 知乎()
首先看一下目标文章:
你可以看到有很多公式,然后是图标,然后是两列。我选择从左到右、从上到下进行翻译。
1. 使用OCR进行识别
但是你应该知道deepl是可以直接输入文字的,为什么不用deepl呢,因为我发现如果用deepl的话,复制是一行一行的,比如我们用鼠标选中一段文字,然后复制,就会发现是一句一句的,如下图所示
这里我复制了一个完整的段落,但是一行一行的粘贴到 deepl 中,这样会影响翻译的准确率,也会对我们的切分造成一定的干扰。如果我们用 OCR 识别同一个段落,其实除了一些英文连接词外,基本没有断开的地方。所以当我们直接复制到 deepl 中,就会得到我们想要的结果。
可以看出,这是一幅非常完整的画。
2. 使用 deepl 进行翻译
复制进去输入翻译框就行了,这个跟网络有关系,网络好的时候很流畅,基本没问题。
3. 使用 mathpix 进行公式识别
打开用他的截图工具选择公式,就可以识别公式了。
这里可以使用copy to word来复制适用于word的文本
粘贴到Word中,效果如下,是可编辑状态
当然你也可以选择其他格式粘贴
比如我用axmath编辑公式,可以复制然后修改。
以上就是我用到的工具,翻译这篇文章大概用了一个小时,最终的Word文本有22页。
这里补充几句:谢谢大家的建议。我发现 mathpix 一个月只能识别 50 个公式,所以如果想增加识别数量,你还是得成为会员。我该怎么办?我口袋里没那么多钱!
别慌,我又发现了一个识别工具,也挺好用的,网址如下:
进入之后我们这里选择图像识别
然后我们把公式截图并粘贴进去。
可以看到这里输出的是LaTeX语法,所以我们不能直接复制到Word中,这就需要我们在Word中做一些修改了,具体可以参考网上的一些教程,还是很多的,这里就不细说了,我还是使用我的公式编辑器,直接复制过来: