[LDA工程实践之算法篇-2] SparseLDA算法 | 火光摇曳

[LDA工程实践之算法篇-2] SparseLDA算法 | 火光摇曳. [LDA工程实践之算法篇-2] SparseLDA算法 2014/10/27机器学习、自然语言处理perplexity、sparseldaxueminzhao 2 SparseLDA算法 本章将介绍一种Gibbs Sampling算法的加速算法——SparseLDA [9],它主要利用LDA 模型的稀疏性,来达到加速以及节省内存的目的,是一种精确算法(没有近似)。 2.1 背景 q(z)=ntk,¬i+βnk,¬i+βV(nkm,¬i+αk)(1)   在介绍具体的算 [more...]

IR、NLP入门指南 — 苏绥

IR、NLP入门指南 —苏绥(信息检索实验室) 自然语言处理(Natural Language Processing, NLP)技术是信息检索的基础,它大致可以分为以下四个步骤: 1)文本预处理 如网页正文信息提取、去噪等。 2)句法分析 如中文分词、词性标注等。 3)语法分析 分析句子的句法结构,如一个句子中的主谓结构、动宾结构等语法成分,常用依存文法分析器就是一个语法分析工具。 4)语义 [more...]

初学者如何查阅自然语言处理(NLP)领域学术资料_刘知远THU_新浪博客

初学者如何查阅自然语言处理(NLP)领域学术资料_刘知远THU_新浪博客.   初学者如何查阅自然语言处理(NLP)领域学术资料 (2013-07-31 12:57:59) 转载▼ 标签: it 昨天实验室一位刚进组的同学发邮件来问我如何查找学术论文,这让我想起自己刚读研究生时茫然四顾的情形:看着学长们高谈阔论领域动态,却不知如何入门。经过研究生几年的耳濡目染,现在终于能自信 [more...]

雅虎收购“自然语言处理”(NLP技术)初创公司SkyPhrase_Yahoo! 雅虎_cnBeta.COM

雅虎收购“自然语言处理”(NLP技术)初创公司SkyPhrase_Yahoo! 雅虎_cnBeta.COM. 财大气粗的雅虎(梅姐)再次购入了一家公司,其名为SkyPhrase,是一家致力于发展自然语言处理技术的初创公司。对于本次收购的大多数细节,雅虎选择了沉默。当然,所有人最关注的是——雅虎为之付出了多少钱?不过它确实提到了SkyPhrase的NLP方面,使其成为了合理的假设与焦点所在。 作为交易的另一 [more...]

Neural Networks, Manifolds, and Topology — colah’s blog

Neural Networks, Manifolds, and Topology — colah’s blog.   Posted on April 6, 2014 topology, neural networks, deep learning, manifold hypothesis   Recently, there’s been a great deal of excitement and interest in deep neural networks because they’ve achieved breakthrough results in areas such as computer vision.1 However, there remain a number of concerns about them. One is that it can be quite challenging to understand what a neural network is really doing. If one t [more...]

谱聚类

如果说 K-means 和 GMM 这些聚类的方法是古代流行的算法的话,那么这次要讲的 Spectral Clustering 就可以算是现代流行的算法了,中文通常称为“谱聚类”。由于使用的矩阵的细微差别,谱聚类实际上可以说是一“类”算法。 Spectral Clustering 和传统的聚类方法(例如 K-means)比起来有不少优点: 和 K-medoids 类似,Spectral Clustering 只需要数据之间的相似度矩阵就可以了,而不必像 [more...]

谱聚类算法(Spectral Clustering) – 文赛平 – 博客园

谱聚类算法(Spectral Clustering) – 文赛平 – 博客园.  谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似,而子图间距离尽量距离较远,以达到常见的聚类的目的。其中的最优是指最优目标函数不同,可以是割边最小分割——如图1的Smallest cut(如后文的Min cut), 也可以是分割规模差不多且割边最小 [more...]

围猎深度学习——初创公司、科技巨头、研究机构在角力

深度学习是大数据下最热门的趋势之一,这项技术将对自然语言处理和图像识别等前沿领域提供支持。Gigaom.com网站整理了一个指南:深度学习领域的快速发展,鼓舞着越来越多在自然语言处理和图像识别等领域的初创企业去研究它。同时,包括Google、微软、Facebook和雅虎在内的科技巨头,在深度学习方面的投入也在提高。也有不少高校的研究机构也在该领域在做着前沿的研究 [more...]

个性化阅读新玩法,初创公司“享志”借助“Keyword Graph”打造学习型推荐引擎 | 36氪

个性化阅读我们已经提到过很多了,比如基于社交网络数据挖掘的“今日头条”,比如利用社交分享机制推荐内容的“指阅”等等,现在,这个领域又多了一名玩家。 这家公司叫“享志”,是一个提供个性化阅读内容的移动app,并且他们选择了一个新角度来诠释“个性化阅读”。 “我们借用 Google 模式来重构个性化内容。”联合创始人 Johnny(李仲论) 这么跟我解释:“就像 Googl [more...]

Facebook人工智能掌门谈深度学习-搜狐IT

  12月13日,本周早些时候,社交网络巨头Facebook宣布聘请纽约大学教授扬•乐康(Yann LeCun)掌管其新建的人工智能实验室,他将利用自己擅长的“深度学习”技术帮助Facebook更好地“读懂”用户行为。这位法国裔科学家日前接受了《连线》(Wired)杂志的独家专访,畅谈了深度学习技术和人工智能的未来发展。   扬•乐康教授已经在人工智能领域探索了30年,他设计的“ [more...]