互联网

关于互联网上七大姑,八大姨的一些九卦。

采集会计网备忘

采集会计网备忘 一、xmlrpc.client.Fault: Fault 500: '项目需要一个名字。' 今天采集数据,写入本地wordpress数据库的时候,报下面的错误: File "C:\ProgramData\Anaconda3\lib\xmlrpc\client.py", line 656, in close raise Fault(**self._stack[0]) xmlrpc.client.Fault: Fault 500: '项目需要一个名字。' 在网上搜索了一下……

百度知道及Levenshtein.ratio

百度知道及Levenshtein.ratio 采集百度知道问答方法就不说了。看了以前的博客肯定都会。就是几个脚本和火车头设置的交叉使用 模式仿的爱福窝的。主域名+community/detail/12713840/ 采集百度知道后生成问答聚合详情页的流程初期思路篇 1、文章分词 2、分出来的词有核心词的建立标签页 3、有同样标签的问答放在一个页面里 4、标题使用第一个问答的标题 ……

逆冬SEO笔记

逆冬SEO笔记 课程是2019年的。 12、秒排 域名最好十多年,高PR,高SR(搜狗) 15、如何快速提高权重 https://data.chinaz.com/ 找爆涨的词 17、网站主题定位 如何确定首页的关键词:百度的相关图谱+同行观察。 18、刷百度相关图谱 1.选搜域名 2.再搜“黑帽SEO” 3.再搜“老实人” 19、中文分词的字符匹配 1)正向最大匹配法(由左到右的方……

正则与beautifulsoup

正则与beautifulsoup 一、正则 (一)几个使用正则的实例 1.查找 比如:要从“共200页,到第', '页”里面取出200这个数字, pagenum=re.findall(r'\d',str) #取到的是一个列表['5', '0', '0'] x = soup.find_all('p') #找到所有p标签 2.替换 sub三个必选参数:pattern, repl, string, repl,就是replacement,被替换成的字符串……

利用Python进行百度站长平台推送

0

利用Python进行百度站长平台推送 一、 事件的缘起 因为懒,所以一直没有搞这个百度站长平台的API提交功能,最近新弄了一个网站,还是弄一个看看有没有效果。 (一)为什么要使用API推送功能? 1.及时发现:可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录 2.保护原创:对于网站的最新原创内容,使用API推送功能可以快速……

采集wordpress

0

采集wordpress 目标网站:https://kinsta.com/knowledgebase/what-is-taxonomy/ 一、如何同时采集h2,h3,p标签? 使用下面的方法可以,不过如果使用get_text(),连p标签也去掉了。 from urllib.request import urlopen #获取请求打开网页的库 from bs4 import BeautifulSoup #获取解析网页的库 def get_detail(url): # artitl……

自然语言处理nlp好课

0

自然语言处理nlp好课 一个中国小姐姐讲python自然语言处理的课程,真的讲得太好了,强烈推荐。 一、概述 数据科学应该掌握的三种技能: 数据的两种格式: 二、英语 profanity n. 亵圣; 对神灵的亵渎; (亵圣的) 诅咒语 corpus n. (书面或口语的) 文集,文献,汇编; 语料库; Dreyfus model 德雷福斯模型 potty train 对(幼儿)作坐便训练……

Page: 1 of 59 1 2 3 4 5 6 7 8 9 ... 59