写论文有时候烦的不是正文。
是后面那些零碎活。
一张模型架构图,论文里明明有,偏偏改不了。截图糊,颜色不对,模块名还要换。你想动一根箭头,最后发现还不如重画。
PPT 也差不多。
PDF 一个窗口,PPT 一个窗口,旁边再开画图工具、表格、截图软件。来回切几次,人就开始烦了。
最近刷到一个开源项目,Paper2Any。
名字很直,页面上写的也直:把 paper、text、topic 这些东西,转成可编辑的科研图、技术路线图和演示文稿。不是只生成一张图糊上去,而是往可编辑方向走。
我第一眼多看的是它的 Paper2Figure。
论文里的图最麻烦的一点,不是看懂。
是复刻。
原图是死的。想把 encoder 那块挪一下,想把某个模块改成中文,想把颜色统一成组会 PPT 的风格,基本都是重新画。
Paper2Any 这块做的是从论文 PDF、截图或者文字里拆结构,再生成可编辑的模型图、技术路线图、实验图。后面可以继续改,不是截图放大。这个差别挺关键。
对话式修改也有。

比如让某个模块靠左一点,路线图压短一点,箭头少两条。能不能每次都准,另说。至少这个动作,不用一上来就把 PowerPoint 里的形状一个个拖。
PPT 也是类似的路子。
论文丢进去,先出一版演示文稿。标题页、方法、实验、结论这些骨架先铺出来。
别指望生成完直接去答辩。
学术 PPT 这种东西,最后肯定还得自己改。尤其是公式、实验数字、图注,AI 只要错一个地方,就很要命。
但初稿能先出来,还是少一轮脏活。
项目里还放了海报、视频脚本、审稿回复、引用关系追踪这些东西。

这些我没打算展开。
学术工具做到后面,经常会变成一个大抽屉,什么都往里塞。真用的时候,反而只记得住一两个动作。
Paper2Any 我会记住的动作就是:
论文 PDF 到可编辑图。
再到 PPT。
这个够具体。
组会前一天,答辩前两天,导师突然说“这个图换个表达”,你就知道这种工具为什么会有人点开。
GitHub地址: https://github.com/OpenDCAI/Paper2Any
