02,03,2018
|
dengwen168 |
最近重装了一下自己的wordpress博客,发现uploads文件夹下面生成好多缩略图。原来wordpress默认为上传的图片生成三张缩略图:
生成的缩略图很占空间,如果想要关闭wordpress上传图片自动生成缩略图功能,只需要点击“设置”选项卡下的“媒体”选项,进入媒体选项设置界面,全部设置为零,保存即可。
设定之后,我们再发布一篇文章,后台只有上传的图片,并没有生成相对应的缩略图。但是前端的文章缩略图还在 ...
02,03,2018
|
dengwen168 |
使用方法:
python wp.py username pass.txt https://www.xxs.com
#!/usr/bin/env python
# -*- coding: gbk -*-
# -*- coding: utf-8 -*-
# Date: 2015/4/29
# Created by 独自等待
# 博客 http://www.waitalone.cn/
import os, sys, time
import urllib2
def usage():
os.system(['clear', 'cls'][os.name == 'nt'])
print '+' + '-' * 50 + '+'
print '\t Python WordPress ...
01,03,2018
|
dengwen168 |
今天在使用Python requests.get的时候老是报错,我也没有找出具体原因,在网上看到一个原因是:
http的连接数超过最大限制,默认的情况下连接是Keep-alive的,所以这就导致了服务器保持了太多连接而不能再新建连接。
我以为是我之前采集某API的时候使用requests.get太多的原因,也有人说可能安装shadowsock后不小心设置了全局代理的原因,反正我使用requests.get的时候老是出现如下的错误:
requests.e ...
13,02,2018
|
dengwen168 |
转贴自:v2ex.com
adsense 收入截图,终于是要走出去了
2011 年本科毕业,物理专业,靠你懂得才能毕业,大学捣鼓网络赚钱项目,上不了台面,却也不违法不违反道德
浑浑噩噩三四年,2015 年自学 php+前端+一些平面设计,技术渣都算不上,因为我曾尝试在程序里集成一个前端文本编辑框,搞了两天愣是不会;想自己在程序里面集成 paypal 的付款接口,也不会;
2015 年 9 月上线第一个英文站,效果不错,三个 ...
12,02,2018
|
dengwen168 |
一、首先确保你安装了book里面的内容。
二、看看nltk.book有些什么东西
输入text1就可以显示书名
>>> text1
<Text: Moby Dick by Herman Melville 1851>
>>> text2
<Text: Sense and Sensibility by Jane Austen 1811>
>>>
三、搜索
执行的结果是这样的:
>>> text1.concordance("monstrous")
Displaying 11 of 11 matches:
ong ...
12,02,2018
|
dengwen168 |
要想实现机器生成文章。
需要以下几点:
必须以句子为单位进行文章的构建,那么首先需要的功能:
1、将文章分割成为以句子为单位的形式。
2、必须对句子进行主题归类,即当前的句子说的是什么主题.
3、必须对句子在文章中出现的位置进行归类。
中文的范式一般是:
以什么的精神(要求)下,如何做(how),我们要达到什么目的。
所以我们可以将句子也归为这三类,另外还有一些成语、短句之类,什 ...
12,02,2018
|
dengwen168 |
安装:
pip install nltk
安装后打算用了,没相到出现如下的错误:
Resource 'corpora/gutenberg' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download()
然后再执行以下代码:
import nltk
nltk.download()
会弹出一个界面,让你选择所需要安装的包,如果选择安装所有包的话,速度巨慢,所以还是要用哪个包就安装哪一个吧。
一、查看nltk有什么语料
...
12,02,2018
|
dengwen168 |
测试环境:
win7 ultimate(en)
Anaconda 3
一、安装Word2vec
Word2vec需要使用第三方gensim模块, gensim模块依赖numpy和scipy两个包,因此需要依次下载对应版本的numpy、scipy、gensim。
不过如果你使用Anaconda的话,前两个包已经安装好了,可能直接使用pip命令安装第三个包即可。
二、下载训练数据
下载地址如下:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2
三 ...
12,02,2018
|
dengwen168 |
一、HanLP开源分词系统
二、ansj分词
作者说arrays.dic是使用结巴分词的。
经过核实,ansj分词可能用的是新版的北大标注集。
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
代码名称
帮助记忆的诠释
例子 及 注解
1
Ag
形语素
形容词性语素。形容词代码为a,语素代码g前面置以A。
绿色/n 似/d 锦/Ag ,
2
a
形容词
取英语形容词adjective的第1个字母
[重要/a 步伐/n]NP ,
...
12,02,2018
|
dengwen168 |
项目地址:
https://github.com/super-l/superl-url
运行环境:python 2.x
运行结果:
运行后会生成一个“关键字.txt”的文件,打开就可以看到:
不过好像不支持中文关键字?
Page: 129 of 229 1 ...
127 128 129 130 131 ...
229