Paper2Any:论文丢进去,PPT 和架构图先给你拆出来

写论文有时候烦的不是正文。

是后面那些零碎活。

一张模型架构图,论文里明明有,偏偏改不了。截图糊,颜色不对,模块名还要换。你想动一根箭头,最后发现还不如重画。

PPT 也差不多。

PDF 一个窗口,PPT 一个窗口,旁边再开画图工具、表格、截图软件。来回切几次,人就开始烦了。

最近刷到一个开源项目,Paper2Any。

名字很直,页面上写的也直:把 paper、text、topic 这些东西,转成可编辑的科研图、技术路线图和演示文稿。不是只生成一张图糊上去,而是往可编辑方向走。

我第一眼多看的是它的 Paper2Figure。

论文里的图最麻烦的一点,不是看懂。

是复刻。

原图是死的。想把 encoder 那块挪一下,想把某个模块改成中文,想把颜色统一成组会 PPT 的风格,基本都是重新画。

Paper2Any 这块做的是从论文 PDF、截图或者文字里拆结构,再生成可编辑的模型图、技术路线图、实验图。后面可以继续改,不是截图放大。这个差别挺关键。

对话式修改也有。

比如让某个模块靠左一点,路线图压短一点,箭头少两条。能不能每次都准,另说。至少这个动作,不用一上来就把 PowerPoint 里的形状一个个拖。

PPT 也是类似的路子。

论文丢进去,先出一版演示文稿。标题页、方法、实验、结论这些骨架先铺出来。

别指望生成完直接去答辩。

学术 PPT 这种东西,最后肯定还得自己改。尤其是公式、实验数字、图注,AI 只要错一个地方,就很要命。

但初稿能先出来,还是少一轮脏活。

项目里还放了海报、视频脚本、审稿回复、引用关系追踪这些东西。

这些我没打算展开。

学术工具做到后面,经常会变成一个大抽屉,什么都往里塞。真用的时候,反而只记得住一两个动作。

Paper2Any 我会记住的动作就是:

论文 PDF 到可编辑图。

再到 PPT。

这个够具体。

组会前一天,答辩前两天,导师突然说“这个图换个表达”,你就知道这种工具为什么会有人点开。

GitHub地址: https://github.com/OpenDCAI/Paper2Any

返回分类列表