如果我们参加天池或者Kaggle竞赛,原始数据集会公开提供给各参赛方。但现实中公司不会在下发一个预测任务的同时就为你准备好数据集,所以准备数据的第一步是数据采集。假设公司下发了一项任务:给某电商平台的用户推荐商品,从而提高平台销售业绩。这个时候,我们首先应该思考3个问题,即预测任务究竟是什么?什么样的数据可能与预测任务密切相关呢?这些数据是否可以获取,获取的方式是什么?在上面的例子中,我们的预测任
如果我们参加天池或者Kaggle竞赛,原始数据集会公开提供给各参赛方。但现实中公司不会在下发一个预测任务的同时就为你准备好数据集,所以准备数据的第一步是数据采集。假设公司下发了一项任务:给某电商平台的用户推荐商品,从而提高平台销售业绩。这个时候,我们首先应该思考3个问题,即预测任务究竟是什么?什么样...