2024年度总结
时间过得真快,转眼已经到了三月,终于能抽出一点时间补一下2024年的年终总结。
之所以很长时间没更新,是因为去年下半年遇到了很多事。
人对于那些给自己带来极端重压和不确定性的事情和境遇是不愿意多写的。
有什么好写的呢?给别人做心理按摩是容易的,给自己做心理按摩是困难的。
有那么一些时刻,任何文字和言语的力量都是羸弱和虚浮的,只是凭着每天的惯性,在现实生活中,一日一日地度过。
在那些最晦暗的日子里,任何其它人的境遇,任何思想、信念,都无法替自己做出抉择,无法代替自己承担那些压力和不确定性。
归根结底,人生无常,好运歹运,想太多没用,只能靠自己和家人去实实在在地面对。
如果真的有什么经验可以跟分享的话,那就是一定一定要重视自己和家人的健康。
道理都懂,但是文字的力量,终究有...
推荐算法实战-14-评估与调试
本文是推荐算法实战系列第14篇文章。
前面文章包括:
推荐系统简介
特征工程
embedding
精排
召回(1):传统召回以及召回中的loss设计
召回(2):word2vec召回、FM召回和双塔召回
召回(3):图卷积
粗排
重排
多任务与多场景(1)
多任务与多场景(2)
冷启动(1):多臂老虎机
冷启动(2):对比学习
本文介绍评估与调试。
1、离线评估
1.1、评估排序算法
1.1.1、AUC
评估排序模型最重要的指标是AUC。二分类算法的输出是一个概率值,通过阈值判断是正例还是负例。给定一个阈值,可以计算False Positive Rate,作为横轴,True Positive Rate,作为纵轴。改...
推荐算法实战-13-冷启动(2)
本文是推荐算法实战系列第13篇文章。
前面文章包括:
推荐系统简介
特征工程
embedding
精排
召回(1):传统召回以及召回中的loss设计
召回(2):word2vec召回、FM召回和双塔召回
召回(3):图卷积
粗排
重排
多任务与多场景(1)
多任务与多场景(2)
冷启动(1):多臂老虎机
本文继续介绍冷启动。
1、对比学习
1.1、对比学习的基本原理
对比学习(Contrastive Learning,CL)发源于图像识别领域,是一种针对少样本的自监督学习算法。
在少样本学习中,只有少量样本被标注,不足以训练出一个高质量的图片分类器。
CL的解决思路是,把分类任务分成两步,第一步特征编码,第二步分类。...
如何构造一只债券基金组合
1、为什么需要配置债券
配置债券类资产的目的,是为未来的权益类投资储备子弹,以及分散风险。
作为打工人,我们的子弹不是无限的,十分珍贵。同时我们的现金流来自于出卖劳动力,需要时间积累。
我们倡导闲钱投资,而闲钱是慢慢积累出来的。
积累闲钱的过程也是储备子弹的过程。
作为散户,我们投研的深度比不上机构和大V,所以必须要求更严格的安全边际。必须耐心等待足够好的机会才出手。这就导致大部分时间,我们可能都是在积累子弹。
一般人,往往账户里有点闲钱就手痒痒。我们应该给闲钱设定一个安稳的去处。
存银行定期,赎回不方便,可能错失权益投资机会。
直接放在货币基金,收益率有点低。
投资权益类基金,无论是主动基金还是指数基金,与我们的未来投资标的相关性太强,一荣俱荣,一损俱损。
一个比...
投资没有充分条件,就像人生没有上岸一样
最近,断断续续两个月,差不多20个小时,在微信读书上看完了《段永平投资问答录(下)》。
段永平早年创办步步高,在消费电子领域大获成功。后来,他在步步高的老部下,陈明永和沈炜,分别创立了OPPO和VIVO品牌。
段永平在2000年左右就退居幕后,远赴美国,成为投资人。
他在投资领域的成名作是,在网易濒临退市时,逆势买入,最后大赚100多倍。后来,又先后投资苹果、茅台,均大获成功。
他以网名“大道无形我有形”在网上十分活跃。
这本书是雪球编辑出版的段永平在博客、雪球等平台上的文章以及与读者的互动。
由于是问答录,且时间跨度大,有很多重复的内容。但是,同样的道理反复讲,也能加深印象。而且,出现反复也说明作者的底层逻辑前后一致。
本书主要讲投资“道”的层面的东西,很少讲“术”的层...
推荐算法实战-12-冷启动(1)
本文是推荐算法实战系列第12篇文章。
前面文章包括:
推荐系统简介
特征工程
embedding
精排
召回(1):传统召回以及召回中的loss设计
召回(2):word2vec召回、FM召回和双塔召回
召回(3):图卷积
粗排
重排
多任务与多场景(1)
多任务与多场景(2)
本文介绍冷启动。
冷启动是指针对较少行为信息的新用户、新物料的推荐。推荐算法赖以存在的基础是用户-物料的交互信息,但是对于新用户、新物料,缺乏相应数据,算法陷入“巧妇难为无米之炊”的境地。很多经典的算法从原理上就不支持新用户、新物料。例如,Item2Vec对在训练集中未出现的物料无法获得其embedding;DIN/SIM要对用户行为序列做Attenti...
推荐算法实战-11-多任务与多场景(2)
本文是推荐算法实战系列第11篇文章。
前面文章包括:
推荐系统简介
特征工程
embedding
精排
召回(1):传统召回以及召回中的loss设计
召回(2):word2vec召回、FM召回和双塔召回
召回(3):图卷积
粗排
重排
多任务与多场景(1)
本文介绍多场景。
1、 多场景与多任务的异同
多场景主要关注推荐场景下不同的消费模式。它们之间既有差异性也有共性,如何在不同场景间进行信息的共享与迁移,同时避免相互干扰是多场景建模的主要目标。
同一个APP,“单列模式”与“双列模式”是不同的场景,两种产品模式下用户的行为模式有差异。
同一个APP,不同国家用户的消费模式有差异。
同一个APP,不同生命周期和活跃...
推荐算法实战-10-多任务与多场景(1)
本文是推荐算法实战系列第10篇文章。
前面文章包括:
推荐系统简介
特征工程
embedding
精排
召回(1):传统召回以及召回中的loss设计
召回(2):word2vec召回、FM召回和双塔召回
召回(3):图卷积
粗排
重排
本文开始介绍多任务与多场景。
自从2018年Google提出MMOE之后,多任务与多场景成为大厂推荐算法的标配。
推荐模型涨分的几大法宝无外乎:
更贴合业务场景,融入更多先验知识的特征工程
更丰富的样本
通过多任务引入更多监督信号
通过多场景引入更多样本信息并对样本纠偏
多任务与多场景既有共性—有些模型,例如MMOE既可以用在多任务也可以用在多场景—也有差异性。
二者的核心是 ...
共计 17 篇文章,3 页。