无趣之人写的博客


  • 首页

  • 分类

  • 标签

ALS算法求解隐语义模型

发表于 2020-06-12
LFM的各种版本
阅读全文 »

推荐系统基础知识

发表于 2020-06-05 | 分类于 推荐系统
参考文献 推荐系统 协同过滤 隐语义模型 概览 基于内容推荐利用物品或内容的元数据(静态)衡量物品的相似度,给用户推荐相似的物品。 只考虑了对象的本身性质,将对象按标签形成集合,如果消费了集合中的一个,则推荐该集合中的其他对象。 协同过滤推荐先协同,再过滤 充分利用了集体智慧:在大量的人群的 ...
阅读全文 »

tfidf模型构建文章查重系统

发表于 2020-06-04 | 分类于 NLP , 推荐系统
引子想象一个场景:现在有近九万条新闻(如下图所示),其中一部分新闻来自于新华社,还有一部分新闻来自其他媒体,如何判断其他媒体是不是抄袭了新华社的新闻呢? 其中关键在于衡量文章的特征,以及两篇文章特征的相似关系,而在文本数据中常见的特征就是关键词。因此我们可以采取以下办法 分词:按照一定规则进行提 ...
阅读全文 »

计算机网络基础知识

发表于 2020-05-30 | 分类于 计算机网络
[TOC] OSI七层模型 例子以公司A和公司B的一次商业报价单发送为例,看每一层具体做了什么。 应用层:要发送的商业报价单,就是应用层提供的一种网络服务,当然,老板也可以选择其他服务,比如说,发一份商业合同,发一份询价单,等等 表示层:由于公司A和公司B是不同国家的公司,他们之间的商定统一用英语 ...
阅读全文 »

apriori算法对购物篮关联分析

发表于 2020-05-27 | 分类于 推荐系统
mlxtend库的使用
阅读全文 »

踩坑记--win10安装ubuntu虚拟机

发表于 2020-05-15 | 分类于 踩坑
[TOC] 下载VMware虚拟机下载时选择”免费产品试用版和演示板块”的”Workstation Pro”,安装好后再进行激活。 安装时全部默认”下一步”,最后一步输入产品密钥(请自行百度),输入完成激活。 下载Ubuntu官网下载速度可能比较慢,推荐阿里开源镜像源 在VMware中安装Ubunt ...
阅读全文 »

数据可视化(一)

发表于 2020-05-10 | 分类于 数据可视化
本文参考课程大数据可视化 [TOC] 可视化的研究内容科学可视化研究带有空间信息和几何信息的三维测量数据,如计算模拟数据、医学影像数据的可视化。其核心挑战是挖掘数据中几何、拓扑和形状特征。 信息可视化研究非结构化、非几何的抽象数据,如社交网络和文本的可视化。其核心挑战是针对大尺度的高维数据,尽可 ...
阅读全文 »

CNN对CIFAR10图像分类

发表于 2020-05-07 | 分类于 深度学习
CNN概念卷积:探测上一层特征的局部连接,即使得原信号特征加强,并降低噪音。 卷积核:可以看成是一个权值矩阵窗口,它会在二维输入数据上”滑动”,对当前输入元素做点积运算。 特征图:卷积操作后的图像就是特征图。 多通道卷积:每个卷积核都是一种特征提取方式,因此可以对每个通道添加一个卷积核以提取该通道 ...
阅读全文 »

深度学习入门

发表于 2020-05-03 | 分类于 深度学习
人工智能发展 符号主义人工智能(解决定义明确的逻辑问题) 机器学习 深度学习 机器学习在预先定义好的假设空间中,利用反馈信号的指引来寻找输入数据的有用表示。 概率建模 概率建模最有名的一个算法是朴素贝叶斯算法,这是一类基于贝叶斯定理的机器学习分类器,它假设输入数据的特征都是独立的,这是一个很强的 ...
阅读全文 »

条件随机场对句子标注词性

发表于 2020-04-29 | 分类于 机器学习
引子  条件随机场,简称CRF,是一种判别式概率模型,常用于分析序列资料,如标注自然语言。 实战理论
阅读全文 »
<i class="fa fa-angle-left"></i>123<i class="fa fa-angle-right"></i>
LiangL

LiangL

小时候真傻,居然盼着长大

26 日志
12 分类
16 标签
GitHub E-Mail
© 2020 LiangL
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4