SEO

搜索引擎优化的相关知识

TF-IDF关键词提取(Python)

TF-IDF关键词提取(Python) 一、TF-IDF算法介绍 TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次……

搜索引擎Json格式的搜索结果

搜索引擎Json格式的搜索结果 一、百度 https://www.baidu.com/s?wd=%E6%87%92%E4%BA%BA%E7%A8%8B%E5%BA%8F&rsv_bp=0&ch=&tn=json&bar=&rsv_spt=3&ie=utf-8&rsv_sug3=3&rsv_sug=0&rsv_sug1=2&rsv_sug4=161&inputT=1793 简化版本: https://www.baidu.com/s?wd=%E6%96%B0%E4%BF%A1%E6%81%AF&pn=50&rn=50&tn=json 参数说明: wd:关键词 pn : 查询偏移……

词库应用(2)

词库应用(2) 产生流量的来源关键词60%~70%都是有规律可循。所以我强烈的认为,挖掘关键词的本质是为了找到这种规律,然后快速的制造大量的、较优质的页面。 对于没规律的词咋办?搜索量高就留着人工编辑做专题,如:“住房公积金如何提取”;至于没搜索量的,直接删掉。 有规律的关键词基本就3种:“{词前缀}..+词根+..{词后缀}” 、“{词……

SEO如何处理采集内容(3)

SEO如何处理采集内容(3) 采集内容上线逻辑 有基友问采集的内容怎么分类,抓取的词怎么分类。其实很简单,做个小网站就都明白了,本渣渣在此科普下 采集内容清洗后是要入库的,入库就得有逻辑,所以在采集一开始就得想到这点,并设计采集到上线的流程 每个站点情况都不一样,但最最基础的模式类似下面这种: 确定要做的主题,从这个主题里……

文章原创度检测

文章原创度检测 一、原理 1.先把一篇文章,按逗号分隔成一个一个句子。(有点缺陷,比如如果句子中是冒号,分号,它认为是一句话。) 2.然后计算每个短语的字数,取字数最多的两句话。 3.拿上面两句话去百度搜索,并分别计算每句话在百度第一页搜索结果中的次数,然后加总。出现次数最少的文章,我们认为它的原创性要高一些。 因为若一个……

百度知道及Levenshtein.ratio

百度知道及Levenshtein.ratio 采集百度知道问答方法就不说了。看了以前的博客肯定都会。就是几个脚本和火车头设置的交叉使用 模式仿的爱福窝的。主域名+community/detail/12713840/ 采集百度知道后生成问答聚合详情页的流程初期思路篇 1、文章分词 2、分出来的词有核心词的建立标签页 3、有同样标签的问答放在一个页面里 4、标题使用第一个问答的标题 ……

逆冬SEO笔记

逆冬SEO笔记 课程是2019年的。 12、秒排 域名最好十多年,高PR,高SR(搜狗) 15、如何快速提高权重 https://data.chinaz.com/ 找爆涨的词 17、网站主题定位 如何确定首页的关键词:百度的相关图谱+同行观察。 18、刷百度相关图谱 1.选搜域名 2.再搜“黑帽SEO” 3.再搜“老实人” 19、中文分词的字符匹配 1)正向最大匹配法(由左到右的方……

GoGo闯SEO视频笔记

1

GoGo闯SEO视频笔记 一、进度 第1章 已经完成 第2章 已经完成 May-20-2020 第3章 已经完成 第4章 已经完成 第5章 已经完成 第6章 python入门 全部学完 第7章 全部学完 第8章 全部学完 第9章 已经完成。 第10章 已经完成。 第11章 已经完成。 从5月8日购买课程,到5月21日全部学完,几乎花了半个月的时间,不过学到……

SEO中H2标签的使用

0

SEO中H2标签的使用 一、 H2s类似于书籍章节,描述了您将在本文各节中介绍的主要主题。 比如一篇文章中的小标题,就可以用H2 来源:https://www.searchenginejournal.com/header-tags-seo-best-practices/261835/#close 二、Jing 我的目标站,JingS也是使用的h1,h2,h3这样的标题形式。

Page: 1 of 6 1 2 3 4 5 6