NLP

自然语言处理

自然语言处理nlp好课

0

自然语言处理nlp好课 一个中国小姐姐讲python自然语言处理的课程,真的讲得太好了,强烈推荐。 一、概述 数据科学应该掌握的三种技能: 数据的两种格式: 二、英语 profanity n. 亵圣; 对神灵的亵渎; (亵圣的) 诅咒语 corpus n. (书面或口语的) 文集,文献,汇编; 语料库; Dreyfus model 德雷福斯模型 potty train 对(幼儿)作坐便训练……

如何求语词的相关性(PMI)

0

如何求语词的相关性(PMI) 待处理文本: 郭富城方发声明否认炒作,真的是这样吗?我发布了头条文章:《罗生门:六小龄童上春晚究竟谁炒作?从这开8并怀念当年那美好的西游》 除夕还剩几天时间,这几天“猴哥”#六小龄童#突然成为网络热搜词,朋友圈全是“帮猴哥上春晚”的帖子。在充当“自来水”的同时,有人开始反思,“大圣”热闹上春晚话题是不是一种“……

试用AIpatent

2

试用AIpatent 今天在网上找资料的时候发现了http://www.52nlp.cn/开发的一个翻译工具,AIpatent(http://fanyi.aipatent.com/),抱着好奇的心注册了一个账号,试用了一下,不过效果和Google 翻译比,还有很大的距离。 从上面可以看出,对深交所、肖金峰这样的名称,AIpatent都无法识别。 另外,翻译水平也比不上google.

TensorFlow教程

0

TensorFlow教程 一、教程使用的神经网络架构 为什么不是每一次卷积之后都跟MaxPool? 为什么第一次fc有Relu,第二次没有? 二、可视化神经网络架构 CONV 特征提取 RELU 特征加强 relu(x)= max(0,x) 小于0显示0,大于0不处理,相当于对图片作一个二值化(黑白化)处理。 POLL 维度降解 100*100 的图片 经过pooling2 --> 50*50,其实就是……

nltk book

0

nltk book 一、首先确保你安装了book里面的内容。 二、看看nltk.book有些什么东西 输入text1就可以显示书名 >>> text1 <Text: Moby Dick by Herman Melville 1851> >>> text2 <Text: Sense and Sensibility by Jane Austen 1811> >>> 三、搜索 执行的结果是这样的: >>>……

NLP的构想

0

NLP的构想 要想实现机器生成文章。 需要以下几点: 必须以句子为单位进行文章的构建,那么首先需要的功能: 1、将文章分割成为以句子为单位的形式。 2、必须对句子进行主题归类,即当前的句子说的是什么主题. 3、必须对句子在文章中出现的位置进行归类。 中文的范式一般是: 以什么的精神(要求)下,如何做(how),我们要达……

python nltk中文试用手记

0

python nltk中文试用手记 安装: pip install nltk 安装后打算用了,没相到出现如下的错误: Resource 'corpora/gutenberg' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download() 然后再执行以下代码: import nltk nltk.download() 会弹出一个界面,让你选择所需要安装的包,如果选择安装所有……

Word2vec应用第一次手记

0

Word2vec应用第一次手记 测试环境: win7 ultimate(en) Anaconda 3 一、安装Word2vec Word2vec需要使用第三方gensim模块, gensim模块依赖numpy和scipy两个包,因此需要依次下载对应版本的numpy、scipy、gensim。 不过如果你使用Anaconda的话,前两个包已经安装好了,可能直接使用pip命令安装第三个包即可。 二、下载训练数据 下载地址如下:http……

分词系统的标注集

0

分词系统的标注集 一、HanLP开源分词系统 二、ansj分词 作者说arrays.dic是使用结巴分词的。 经过核实,ansj分词可能用的是新版的北大标注集。 《现代汉语语料库加工规范——词语切分与词性标注》词性标记 代码名称 帮助记忆的诠释 例子 及 注解 1 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 绿色/n  似/d  锦/Ag ……

Page: 1 of 2 1 2