词库应用(2)

产生流量的来源关键词60%~70%都是有规律可循。所以我强烈的认为,挖掘关键词的本质是为了找到这种规律,然后快速的制造大量的、较优质的页面。 对于没规律的词咋办?搜索量高就留着人工编辑做专题,如:“住房公积金如何提取”;至于没搜索量的,直接删掉。 有规律的关键词基本就3种:“{词前缀}..+词根+..{词后缀}” 、“{词前缀}..+词根” 、“词根+..{词后缀}” ,如何快速准确的从挖掘的关键词中找到这种规律 ...

SEO如何处理采集内容(3)

采集内容上线逻辑 有基友问采集的内容怎么分类,抓取的词怎么分类。其实很简单,做个小网站就都明白了,本渣渣在此科普下 采集内容清洗后是要入库的,入库就得有逻辑,所以在采集一开始就得想到这点,并设计采集到上线的流程 每个站点情况都不一样,但最最基础的模式类似下面这种: 确定要做的主题,从这个主题里选几个词根,一个词根或几个词根就代表一个内容分类 用词跟去扩展,挖出要做的流 ...

Python常用代码(三)

一、csv @@@@ 写入并生成csv文件 @@@@ # coding: utf-8 import csv csvfile = file('csv_test.csv', 'wb') writer = csv.writer(csvfile) writer.writerow(['姓名', '年龄', '电话']) data = [ ('小河', '25', '1234567'), ('小芳', '18', '789456')] writer.writerows(data) csvfile.close() @@@@ 读取csv文件 @@@@ # coding: utf-8 import csv csvfile = file('csv ...

文章原创度检测

一、原理 1.先把一篇文章,按逗号分隔成一个一个句子。(有点缺陷,比如如果句子中是冒号,分号,它认为是一句话。) 2.然后计算每个短语的字数,取字数最多的两句话。 3.拿上面两句话去百度搜索,并分别计算每句话在百度第一页搜索结果中的次数,然后加总。出现次数最少的文章,我们认为它的原创性要高一些。 因为若一个文章被其他网站大量转载,那么随便提取该文章中一个短语,都能在百度搜索出完全重复 ...

采集shopify

一、代码 import requests,bs4,csv,os,re,time '''采集商品url''' def shopifylist(url): while True: try: res=requests.get(url,timeout=30) res.encoding = res.apparent_encoding print('请求',url,'状态',res.status_code) res.raise_for_status()#如果返回状态不是200,则抛出异常 break except: ...

没户口没房如何在广州上学

无户口有房产 没有广州户口,即使在广州有房,也是不能在广州读公办学校的,可以通过积分入学、交赞助费、入户广州——入个人户的方式读公办学校。 那户口和房产,哪个更重要呢? 1.幼升小 学位房和广州户口都很重要。 符合“人户一致”的原则,就能对口入读小学,一般都能入读自己满意的学校。当然如前文所说的,有户口没房或“人户不一致”也能统筹入学,至于学校能不能让自己满意就说不定了。 2.小升初 目前 ...

《黑天鹅》

塔勒布的书,知识点很多,信息密度超高,读起来不容易。不过,本文可以终结你的困惑。塔勒布的思想体系里,“非线性”是最核心的内容。我们下面建立一个简单的模型来帮助理解,这个模型的输入是X,输出是Y,中间是一个黑匣子,特点如下: 1、在一部分时间里,X和Y是线性的,可预测的,因果关系可以逻辑化描述,比如X增加,Y也会相应增加。Y的线性区间是+100到-100。 2、在另外一部分时间里,X和Y是非线性 ...

生活小常识

1.米虫 预防:用布包裹大蒜、花椒、生姜、干桔子皮,放入米中。 除虫:放冰箱中、太阳晒。 2. 我最怕自己变成只对着电脑算数字的财务经理,我需要与各个部门不断沟通,与他们建立良好的关系,了解他们的需求,才能更好地支持业务。 很多情况下,专业财务出身的人都有非常强的责任心和使命感,觉得做财务就一定要管控,否则就是不负责任,就是没有职业道德。结果就导致现实当中为了管控而忽略了最起码的要 ...
Page: 3 of 154 1 2 3 4 5 ... 154