Google TimesFM:时间序列也被做成“大模型”了

TimesFM 这个项目,我第一眼不是看参数。

2 亿参数,放在今天的模型圈里,真不吓人。

真正让我停了一下的,是它的用法。

给一段历史数据,先跑一个预测结果出来。不用先为零售训一套,为电力训一套,为库存再折腾一套。时间序列以前麻烦就麻烦在这里,场景一换,模型、参数、验证,全得重新来一遍。

很多团队卡的不是没数据。

是懒得每次都重新搭。

Google Research 这次做的 TimesFM,走的是时间序列基础模型这条路。论文进了 ICML 2024。官方说,它拿 1000 亿个真实世界 time-points 做了预训练,主打 zero-shot forecasting。

不微调,先预测。

这四个字对做业务的人挺现实的。跨境电商看爆单,供应链看库存,能源看负荷曲线。尤其现在 AI 数据中心一多,电力这块的波动也被放大了。

以前你要认真做预测,基本绕不开一堆前处理和模型选择。

现在至少可以先把 TimesFM 拉下来跑一遍。

仓库里给了代码、checkpoint,也有 Hugging Face 入口。Apache 2.0 协议。Star 已经到 17.3k 左右。

我更在意的是它不像那种“论文很漂亮,代码离你很远”的项目。

你真的能点开 README,装环境,丢自己的序列进去试一下。结果不一定神,至少不是空看。

当然,它不是预言机。

股票、加密货币、库存、用电曲线,全部塞进去,然后等它告诉你未来,这种想法还是太省事了。时间序列里那些脏东西还在:数据断点、周期漂移、节假日、突发事件。该坑还是坑。

Google 自己说得也没那么满。

它强调的是 out-of-the-box 的 decent forecast。

这个措辞我反而觉得靠谱。不是包赢,不是包准,是先给你一个能看的起点。

对小团队来说,这已经够了。

以前可能连时间序列模型都懒得试,现在多了一个入口。先跑一版,图画出来,看曲线有没有点意思。

GitHub 地址: https://github.com/google-research/timesfm

返回分类列表