您正在查看: 2020年5月

TensorFlow 2.0实战Deep&Cross

Overview 之前的文章,我们记录了如何用TensorFlow 2.0中的Keras模块实现DeepFM算法,TensorFlow 2.0实战DeepFM。本文继续用TensorFlow 2.0来实现另一个常见的深度学习推荐算法Deep&Cross。 1. 加载并处理数据 依然沿用之前的1,000,000条criteo数据。 import numpy as np import ...阅读全文>>

TensorFlow 2.0实战DeepFM

Overview 推荐系统最核心的部分在于排序算法,也就是我们说的CTR预估问题。这部分算法在最近几年发展迅速,我们这篇文章,希望用经典的criteo数据集,和TensorFlow 2.0中的Keras模块,来演示一下DeepFM是怎么做CTR预估的。 1. 准备数据 在这里下载criteo数据集:Download Kaggle Display Advertising Challenge ...阅读全文>>

增量学习的主流实现

Overview 之前的文章介绍了一些推荐系统的理论知识,理论虽然很容易理解,但是实际项目当中会有一些细节问题是需要我们去解决的。比如在很多流量很大的电商以及资讯网站的推荐系统中,每天的数据其实是增长很快的,所以模型迭代的频率也是非常高的,甚至于需要每天更新。那么我们就要面临一个很现实的问题,我们每天更新模型,那么每次都要用全量数据去训练模型吗?显然这是不可能的。一来耗费资源,二来时间也不...阅读全文>>

内容相似推荐实现

Overview 内容相似推荐算法,是推荐系统当中的一个常用的算法。假设我们做的是文章推荐,那么,我们该怎样求两篇文章的相似度呢?本文将记录几个常用工具的使用方法。 1. jieba分词工具 可以说是当前最好用的中文分词组件。我们拿到文章的标题、摘要、全文之后,可以用jieba提取关键词,然后去另一篇文章当中做Doc2Vec,把另一篇文章转化为一个向量,可以用平均或者加权平均的方式得到一个...阅读全文>>

TensorFlow 2.0使用RNN和LSTM进行文本分类

Overview 本篇文章我们记录一下怎么用TensorFlow 2.0当中的Keras模块来进行RNN和LSTM文本分类。 1. 加载IMDB评论数据 import tensorflow_datasets as tfds import tensorflow as tf from tensorflow.keras import models, layers, losses, optimiz...阅读全文>>