包含时间序列的数据怎么划分训练集和测试集,以及如何进行C_V

老师,您好,现在我的特征数据集合里面包含时间序列,比如五月份到七月份的用户对商品的各种交互行为数据,这样的数据集应该怎么划分训练集和测试集,老师,可以给我一点思路或者参开资料吗,谢谢

绿树

赞同来自: 舟遏怒江 邹博

一般使用“某一时刻”之前的数据作为训练集,之后的数据作为验证集;“某一时刻”可以选择在时间序列中平移。这样你就获得了多组训练-验证集,这可以用于预测模型的交叉验证。如果有其他需求(如统计),在时间序列中随机采样也可以生成训练集和验证集。

要回复问题请先登录注册