NLP

自然语言处理

nltk book

0

nltk book 一、首先确保你安装了book里面的内容。 二、看看nltk.book有些什么东西 输入text1就可以显示书名 >>> text1 <Text: Moby Dick by Herman Melville 1851> >>> text2 <Text: Sense and Sensibility by Jane Austen 1811> >>> 三、搜索 执行的结果是这样的: >>>……

NLP的构想

0

NLP的构想 要想实现机器生成文章。 需要以下几点: 必须以句子为单位进行文章的构建,那么首先需要的功能: 1、将文章分割成为以句子为单位的形式。 2、必须对句子进行主题归类,即当前的句子说的是什么主题. 3、必须对句子在文章中出现的位置进行归类。 中文的范式一般是: 以什么的精神(要求)下,如何做(how),我们要达……

python nltk中文试用手记

0

python nltk中文试用手记 安装: pip install nltk 安装后打算用了,没相到出现如下的错误: Resource 'corpora/gutenberg' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download() 然后再执行以下代码: import nltk nltk.download() 会弹出一个界面,让你选择所需要安装的包,如果选择安装所有……

分词系统的标注集

0

分词系统的标注集 一、HanLP开源分词系统 二、ansj分词 作者说arrays.dic是使用结巴分词的。 经过核实,ansj分词可能用的是新版的北大标注集。 《现代汉语语料库加工规范——词语切分与词性标注》词性标记 代码名称 帮助记忆的诠释 例子 及 注解 1 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 绿色/n  似/d  锦/Ag ……

密码保护:中文伪原创工具

0

密码保护:中文伪原创工具 自己做的一个中文伪原创工具。 原稿: 中央政法委近日印发《关于学习宣传方金刚同志先进事迹的通知》,号召全国政法机关和全体政法干警,结合学习贯彻党的十九大精神和习近平新时代中国特色社会主义思想,结合推进“两学一做”学习教育常态化制度化,深入开展学习宣传方金刚同志先进事迹活动,在推进“四个全面”的征程中,不……