云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > Python程序设计与实践 大作业实验报告 陆阳 孙勇 裘升明

Python程序设计与实践 大作业实验报告 陆阳 孙勇 裘升明

  • 62 次阅读
  • 3 次下载
  • 2025/7/8 5:56:33

浙江工商大学计算机与信息工程学院 《Python程序设计与实践》大作业报告

专 业: 计科 班 级: 1404 姓 名: 陆阳,孙勇,裘昇明 指导教师: 蒲飞

学 号:1412190416、1412190415、1412190413

2015 年 6 月 28 日

题目介绍:

在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这个商品子集上的行为数据,往往还需要利用更丰富的用户行为数据。定义如下的符号: U——用户集合 I——商品全集 P——商品子集,P ? I

D——用户对商品全集的行为数据集合

那么我们的目标是利用D来构造U中用户对P中商品的推荐模型。

数据说明:

竞赛数据包含两个部分。第一部分是用户在商品全集上的移动端行为数据(D),表名为tianchi_mobile_recommend_train_user,包含如下字段:

字段 user_id item_id behavior_type 字段说明 用户标识 商品标识 用户对商品的行为类型 提取说明 抽样&字段脱敏 字段脱敏 包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4。 user_geohash item_category time 用户位置的空间标识,可以为空 商品分类标识 行为时间 由经纬度通过保密的算法生成 字段脱敏 精确到小时级别

第二个部分是商品子集(P),表名为tianchi_mobile_recommend_train_item,包含如下字段:

字段 item_id item_ geohash item_category 字段说明 商品标识 商品位置的空间标识,可以为空 商品分类标识 提取说明 抽样&字段脱敏 由经纬度通过保密的算法生成 字段脱敏

训练数据包含了抽样出来的一定量用户在一个月时间(11.18~12.18)之内的移动端行为数据(D),评分数据是这些用户在这个一个月之后的一天(12.19)对商品子集(P)的购买数据。参赛者要使用训练数据建立推荐模型,并输出用户在接下来一天对商品子集购买行为的预测结果。

大作业报告内容包括以下几个部分

1、数据分组统计:

可统计有多少用户、商品、商品类别等信息,甚至每天各种行为的统计数。如图:

还有,在给出的用户行为数据中,有些用户在整个11-18日至12-18日对商品有浏览行为记录,但是从未产生过购买行为,这些用户会否在12月19号购买商品实难预测,因此,我们去除这些无购买行为的用户信息,认为这些用户在12月19号还是不会购买任何商品。

贴关键代码 import time

import pandas as pd

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

浙江工商大学计算机与信息工程学院 《Python程序设计与实践》大作业报告 专 业: 计科 班 级: 1404 姓 名: 陆阳,孙勇,裘昇明 指导教师: 蒲飞 学 号:1412190416、1412190415、1412190413 2015 年 6 月 28 日 题目介绍: 在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这个商品子集上的行为数据,

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com