Skip to content

2021科大讯飞基于用户画像商品建模挑战赛top10%解决方案,baseline 0.71

Notifications You must be signed in to change notification settings

zxhjames/IFlyTek_UPR_baseline

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 

Repository files navigation

比赛&&数据集地址https://challenge.xfyun.cn/topic/info?type=user-portrait&ch=dc-web-20

思路:

将用户的基本特征与行为序列特征分开考虑,在这里基本特征由于比较少,我直接使用了最简单的one-hot,行为特征的构建首先要经过一层词向量模型的训练,这里可以用word2vec,fasttext(bert感觉用不上,这里的词表都是不规则的数字脱敏后处理的),接下来可以使用GRU,RCNN,Transformer这类去做,最好的是GRU+Attention,这个能上0.7+,排名也能上10%,前排大佬可能有更好的比如对抗训练或者数据增强的方法,模型没有融合,可以再一步优化

可以看我的公众号写过的一篇对这个赛题分析的文章 https://mp.weixin.qq.com/s/zlFfYV-45EAORjaF0YzZOw

image

About

2021科大讯飞基于用户画像商品建模挑战赛top10%解决方案,baseline 0.71

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages