采集会计网备忘

一、xmlrpc.client.Fault: Fault 500: '项目需要一个名字。' 今天采集数据,写入本地wordpress数据库的时候,报下面的错误: File "C:\ProgramData\Anaconda3\lib\xmlrpc\client.py", line 656, in close raise Fault(**self._stack[0]) xmlrpc.client.Fault: Fault 500: '项目需要一个名字。' 在网上搜索了一下,没有找到解决方法,这是一个非常少见的报错。 试着排查: 我以为是文章标题的问题 ...

百度知道及Levenshtein.ratio

采集百度知道问答方法就不说了。看了以前的博客肯定都会。就是几个脚本和火车头设置的交叉使用 模式仿的爱福窝的。主域名+community/detail/12713840/ 采集百度知道后生成问答聚合详情页的流程初期思路篇 1、文章分词 2、分出来的词有核心词的建立标签页 3、有同样标签的问答放在一个页面里 4、标题使用第一个问答的标题 这里有几个问题: 1、标签页名称 2、标题怎么写 3、怎么知道同样标签的问答内容和标 ...

逆冬SEO笔记

课程是2019年的。 12、秒排 域名最好十多年,高PR,高SR(搜狗) 15、如何快速提高权重 https://data.chinaz.com/ 找爆涨的词 17、网站主题定位 如何确定首页的关键词:百度的相关图谱+同行观察。 18、刷百度相关图谱 1.选搜域名 2.再搜“黑帽SEO” 3.再搜“老实人” 19、中文分词的字符匹配 1)正向最大匹配法(由左到右的方向); 2)逆向最大匹配法(由右到左的方向); 3)最少切分(使每一句中切出的词数 ...

正则与beautifulsoup

一、正则 (一)几个使用正则的实例 1.查找 比如:要从“共200页,到第', '页”里面取出200这个数字, pagenum=re.findall(r'\d',str) #取到的是一个列表['5', '0', '0'] x = soup.find_all('p') #找到所有p标签 2.替换 sub三个必选参数:pattern, repl, string, repl,就是replacement,被替换成的字符串的意思 pagenum=re.sub(r'\D','',str) #取的是500这个数字。即将所有非数字替换 ...

私募基金

一、私募基金知识 2016.7.15私募新规之后,对投资人有了更加明确的要求:单个投资人购买私募基金的最低金额必须不少于100万元,并且不能拆分。 我国《私募投资基金募集行为管理办法》规定,私募基金必须向特定投资者(合格投资者)募集,不得公开宣传。如果准入门槛过低,参与人数过多,将变质为公募产品而失去私募性质。 私募基金属于信托的一种。目前信托规模较大,直接融资功能实际上已经成为银行信贷 ...

利用Python进行百度站长平台推送

0
一、 事件的缘起 因为懒,所以一直没有搞这个百度站长平台的API提交功能,最近新弄了一个网站,还是弄一个看看有没有效果。 (一)为什么要使用API推送功能? 1.及时发现:可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录 2.保护原创:对于网站的最新原创内容,使用API推送功能可以快速通知到百度,使内容可以在转发之前被百度发现 (二)API推送可以推多少条链接? 答 ...

采集wordpress

0
目标网站:https://kinsta.com/knowledgebase/what-is-taxonomy/ 一、如何同时采集h2,h3,p标签? 使用下面的方法可以,不过如果使用get_text(),连p标签也去掉了。 from urllib.request import urlopen #获取请求打开网页的库 from bs4 import BeautifulSoup #获取解析网页的库 def get_detail(url): # artitle = [] # html = getHTMLText(url) print("正在获取文章详情页的信 ...

股坛密笈(三)

0
交易的第一重境界: 缠即一切,一切即缠 走势必完美。 趋势、盘整。 中枢 股市成功的三个方面:技术、资金管理、情绪控制。 交易的第二重境界: 股坛密笈(二) 交易的第三重境界: 交易只需要掌握这8个字足矣:开仓、平仓、止损、加仓。将这8个字弄明白,基本上可以说入了交易之门了。 不过加仓是锦上添花的事情,搞懂了开仓、平仓、止损就可以盈利了。 不要预测行情。 分仓。 http://www.snailtoday.co ...
Page: 1 of 150 1 2 3 ... 150