07,03,2018
|
dengwen168 |
省略了手工导出数据的麻烦,而且爱站说还要VIP会员才能导出。
自己能用就行,代码写得很渣。
import urllib.request
from lxml import etree
import time
import os
os.environ['NO_PROXY'] = 'aizhan.com/'
for x in range(1,51):
url = "https://baidurank.aizhan.com/baidu/huangye88.com/product/0/"+ str(x) +"/exp/-1/"
request = urllib.request.Request(u ...
05,03,2018
|
dengwen168 |
Updated on Feb-11-2021:
一、知识点
(一)直接在vs code中输入sql,就可以出现自己已经保存的代码片段。
(二)在阿里云服务器的脚本上连接数据库,直接用localhost即可。
con = pymysql.connect(host='localhost', user='root', password='1xxxx4', database='article', charset='utf8')
二、方法
(一)利用navicat快速新建字段
其中id记得选择自动增加,并设定为主键。
int(m) 4个字节 ,有符号 ...
02,03,2018
|
dengwen168 |
最近重装了一下自己的wordpress博客,发现uploads文件夹下面生成好多缩略图。原来wordpress默认为上传的图片生成三张缩略图:
生成的缩略图很占空间,如果想要关闭wordpress上传图片自动生成缩略图功能,只需要点击“设置”选项卡下的“媒体”选项,进入媒体选项设置界面,全部设置为零,保存即可。
设定之后,我们再发布一篇文章,后台只有上传的图片,并没有生成相对应的缩略图。但是前端的文章缩略图还在 ...
02,03,2018
|
dengwen168 |
使用方法:
python wp.py username pass.txt https://www.xxs.com
#!/usr/bin/env python
# -*- coding: gbk -*-
# -*- coding: utf-8 -*-
# Date: 2015/4/29
# Created by 独自等待
# 博客 http://www.waitalone.cn/
import os, sys, time
import urllib2
def usage():
os.system(['clear', 'cls'][os.name == 'nt'])
print '+' + '-' * 50 + '+'
print '\t Python WordPress ...
01,03,2018
|
dengwen168 |
今天在使用Python requests.get的时候老是报错,我也没有找出具体原因,在网上看到一个原因是:
http的连接数超过最大限制,默认的情况下连接是Keep-alive的,所以这就导致了服务器保持了太多连接而不能再新建连接。
我以为是我之前采集某API的时候使用requests.get太多的原因,也有人说可能安装shadowsock后不小心设置了全局代理的原因,反正我使用requests.get的时候老是出现如下的错误:
requests.e ...
13,02,2018
|
dengwen168 |
转贴自:v2ex.com
adsense 收入截图,终于是要走出去了
2011 年本科毕业,物理专业,靠你懂得才能毕业,大学捣鼓网络赚钱项目,上不了台面,却也不违法不违反道德
浑浑噩噩三四年,2015 年自学 php+前端+一些平面设计,技术渣都算不上,因为我曾尝试在程序里集成一个前端文本编辑框,搞了两天愣是不会;想自己在程序里面集成 paypal 的付款接口,也不会;
2015 年 9 月上线第一个英文站,效果不错,三个 ...
12,02,2018
|
dengwen168 |
一、首先确保你安装了book里面的内容。
二、看看nltk.book有些什么东西
输入text1就可以显示书名
>>> text1
<Text: Moby Dick by Herman Melville 1851>
>>> text2
<Text: Sense and Sensibility by Jane Austen 1811>
>>>
三、搜索
执行的结果是这样的:
>>> text1.concordance("monstrous")
Displaying 11 of 11 matches:
ong ...
12,02,2018
|
dengwen168 |
要想实现机器生成文章。
需要以下几点:
必须以句子为单位进行文章的构建,那么首先需要的功能:
1、将文章分割成为以句子为单位的形式。
2、必须对句子进行主题归类,即当前的句子说的是什么主题.
3、必须对句子在文章中出现的位置进行归类。
中文的范式一般是:
以什么的精神(要求)下,如何做(how),我们要达到什么目的。
所以我们可以将句子也归为这三类,另外还有一些成语、短句之类,什 ...
12,02,2018
|
dengwen168 |
安装:
pip install nltk
安装后打算用了,没相到出现如下的错误:
Resource 'corpora/gutenberg' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download()
然后再执行以下代码:
import nltk
nltk.download()
会弹出一个界面,让你选择所需要安装的包,如果选择安装所有包的话,速度巨慢,所以还是要用哪个包就安装哪一个吧。
一、查看nltk有什么语料
...
12,02,2018
|
dengwen168 |
测试环境:
win7 ultimate(en)
Anaconda 3
一、安装Word2vec
Word2vec需要使用第三方gensim模块, gensim模块依赖numpy和scipy两个包,因此需要依次下载对应版本的numpy、scipy、gensim。
不过如果你使用Anaconda的话,前两个包已经安装好了,可能直接使用pip命令安装第三个包即可。
二、下载训练数据
下载地址如下:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2
三 ...
Page: 132 of 232 1 ...
130 131 132 133 134 ...
232