互联网

关于互联网络的七七八八。

nltk book

0

nltk book 一、首先确保你安装了book里面的内容。 二、看看nltk.book有些什么东西 输入text1就可以显示书名 >>> text1 <Text: Moby Dick by Herman Melville 1851> >>> text2 <Text: Sense and Sensibility by Jane Austen 1811> >>> 三、搜索 执行的结果是这样的: >>>……

NLP的构想

0

NLP的构想 要想实现机器生成文章。 需要以下几点: 必须以句子为单位进行文章的构建,那么首先需要的功能: 1、将文章分割成为以句子为单位的形式。 2、必须对句子进行主题归类,即当前的句子说的是什么主题. 3、必须对句子在文章中出现的位置进行归类。 中文的范式一般是: 以什么的精神(要求)下,如何做(how),我们要达……

python nltk中文试用手记

0

python nltk中文试用手记 安装: pip install nltk 安装后打算用了,没相到出现如下的错误: Resource 'corpora/gutenberg' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download() 然后再执行以下代码: import nltk nltk.download() 会弹出一个界面,让你选择所需要安装的包,如果选择安装所有……

分词系统的标注集

0

分词系统的标注集 一、HanLP开源分词系统 二、ansj分词 作者说arrays.dic是使用结巴分词的。 经过核实,ansj分词可能用的是新版的北大标注集。 《现代汉语语料库加工规范——词语切分与词性标注》词性标记 代码名称 帮助记忆的诠释 例子 及 注解 1 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 绿色/n  似/d  锦/Ag ……

密码保护:中文伪原创工具

0

密码保护:中文伪原创工具 自己做的一个中文伪原创工具。 原稿: 中央政法委近日印发《关于学习宣传方金刚同志先进事迹的通知》,号召全国政法机关和全体政法干警,结合学习贯彻党的十九大精神和习近平新时代中国特色社会主义思想,结合推进“两学一做”学习教育常态化制度化,深入开展学习宣传方金刚同志先进事迹活动,在推进“四个全面”的征程中,不……

分割文件的源码

0

分割文件的源码 可以将一个大的txt文件分割成N个txt文件,可以自己设定每个文件的行数,非常实用。 源码如下: #coding:utf-8 #将大文本文件分割成多个小文本文件 import os sourceFileName = "test.txt" #定义要分割的文件 def cutFile(): print u"正在读取文件..." sourceFileData = open(sourc……

selenium(python)教程

0

selenium(python)教程 今天试用了一下selenium。 一、首先通过pip命令安装,非常顺利。 二、然后执行py文件的时候,出现下面的错误提示: Message: 'chromedriver.exe' executable needs to be in PATH. Please see https://s ites.google.com/a/chromium.org/chromedriver/home 三、下载chromedriver 淘宝镜像:http://npm.taobao.org/mirrors……

采集微信环境安装

0

采集微信环境安装 一、安装安卓模拟器 这里以海马玩模拟器为例 。 1.到官网下载windows版本 官方网站地址:http://droid4x.haimawan.com/ 2、安装海马玩模拟器 3、安装微信 这一步的时候我用海马玩模拟器应用市场中的微信直接安装,没想到后来注册微信账号的时候,提示版本过低,所以我后来又重新下载了一个微信来安装,终于注册成功了。 ……

Python更新WordPress(xmlrpc)

0

Python更新WordPress(xmlrpc) 今天试用了xmlrpc更新wordpress的功能,备忘一下。 #!/usr/bin/env python #-*- coding: utf-8 -*- from wordpress_xmlrpc import Client, WordPressPost, WordPressTerm from wordpress_xmlrpc.methods.posts import GetPosts, NewPost from wordpress_xmlrpc.methods.users import GetUserInfo from wordpress……