1. 您的位置:首页 > seo技术 >内容

如何使用机器学习(如果无法编写代码)来帮助您进行关键字研究

之前我曾写过关于关键字研究为何还没有结束的文章。 我不断提出的一个关键主题是,关键字分类非常有用,以便有用,这样您就可以针对主题和分类而不是单个关键字进行优化。

我的关键字研究文档通常超过20k-50k关键字,这些关键字通常分为两类,三类或有时更多类,以反映所讨论的站点分类法。

如您所见,我将关键字分为4个可过滤的列,这些列使您可以选择某个“主题”并查看一组关键字的集体搜索量。 您看不到的是有超过8k个关键字。

几年前,我曾经尽可能地使用一些简单的公式来对此进行手动分类。 花了很多年。 因此,我做了一个关键字分类工具来帮助我。 它是使用php构建的,并且仍然很初级,但是它花了我一些时间来进行关键字研究并将其分类从几天到12-15小时不等,具体取决于有多少个关键字。

我很喜欢潮流。 因此,所有SEO都开始大声喊着Python到底有多出色,当然我是在浪潮中。 我的目标是进一步简化关键字研究流程,我喜欢学习这种适应性强的语言。 但是后来我看到了David Sottimano的这段视频,他将BigML引入了我的生活。 想象一下在线“拖放”机器学习服务; 几乎任何人都可以使用的系统。 这是BigML。

我仍在追求精通Python的最终目标,但与此同时,BigML为我提供了一些非常有趣的见解,这些见解已经加速了我的关键字分类。 本文的目的是为您提供一些有关利用现有的(免费)技术使之更智能地工作的想法。

在深入研究之前,请快速注意一下,BigML是一种免费增值工具。 如果您想处理大量数据或想要添加功能(例如一次有多个帐户,则需要每月支付)。 但是,要达到本文的结果,免费套餐将绰绰有余。 实际上,除非您是一位认真的数据科学家,并且需要分析很多变量,否则免费套餐将永远足以满足您的需求。

步骤1 –获取训练数据

在此示例中,我们假设我们正在为River Island做关键字研究,该公司是英国的一家大型服装零售商,为我在池塘边的所有朋友提供服务。 (如果您正在阅读本文并为River Island工作,那么我将不会进行完整的关键字研究。)

如果查看River Island的站点分类法,则会看到以下内容:

出于本指南的目的,我们将仅针对男性进行关键字研究,并将重点放在以下几项产品上:

假设,我想将关键字分为以下类别和子类别:

上衣>大衣和外套

> T恤和背心

下装>牛仔裤

>裤子和斜纹棉布裤

我们将首先进行“下装”。

获取River Island的“牛仔裤” URL,并将其插入SEMRush:

按前20个关键字过滤并导出:

我之所以选择前20名,是因为通常情况下,您会开始为一些不相关且有时很奇怪的关键字排名。 是的,River Island在本学期排名第58:

我们不希望这些术语影响我们的培训模型。

对于“牛仔裤”,当我们过滤掉位置1-20中的关键字并导出时,我们得到900个奇数关键字。 将它们拖放到电子表格中,并添加标题“类别1”和“类别2”。 然后,将“底部”放入类别1,将“牛仔裤”放入类别2,并填写以下内容:

这是您的机器学习“训练数据”的开始。 这里可能已经有足够的数据,但是我想更透彻一些,因此,我还将从我知道的公司中获取所有关键字,这些公司在每个基于服装的关键字(ASOS)中都排名很高。

我将为他们的牛仔裤页面重复该过程:

从SEMRush导出结果排名关键字后,将它们添加到我的电子表格中,将类别下拉并删除列表中的重复数据,我为Bottoms> Jeans有1300个关键字。

我将重复以下过程:

下装>裤子和斜纹棉布裤

上衣>大衣和外套

上衣> T恤和背心

对于这3个关键字,我并没有为将River Island域放入SEMRush中而烦恼,因为ASOS对这么多关键字进行排名,因此有足够的数据用于我的训练模型。

快速查找并替换以消除品牌关键字后:

在重复数据删除方面,我剩下将近8,000个关键字,这些关键字在第一层分别分类为“底部”和“顶部”,在第二层分类为“ Jeans”和“ Trousers / Chinos”。

提示–您可能需要使用修整功能在查找和替换后消除所有空格,否则当我们将其用作训练数据时,此工作表将错误上传:

到目前为止所花费的时间: 5分钟

您当然要对所有River Islands产品并根据需要将其分类。 如果您正在做男女装,那么他们很可能是第一类。 然后,您可能会有第四类,将“夹克”之类进一步细分为“河豚夹克”和“皮夹克”。

如果您正在努力形象化您可能需要的类别,那么我很快也会在此发表文章。 有时候,这只是常识,但是如果您需要的话,还有一个机器学习程序可以为您提供帮助:

步骤2 –训练您的机器学习模型

太棒了–我们列出了8,000个未分类的关键字,这些关键字在5分钟内得到了分类。

将文件另存为CSV,然后转到BigML并注册。 免费。

现在,我们将执行以下非常简单的步骤,以训练机器学习程序对关键字进行分类。

  1. 转到“来源”标签并上传您的训练数据:
  1. 加载后,单击文件以打开设置:
  1. 单击“配置数据源”,并确保类别设置为“类别”:

在大多数情况下,其余设置都可以。 如果您想了解所有设置的更多信息,建议您在此处观看BigML的教育性YouTube频道。

  1. 关闭“配置源”设置,然后单击“配置数据集”按钮。 然后取消选择“类别2”:

点击“创建数据集”按钮:

尽管在执行操作之前,将“数据集名称”重命名为ML Blog Data(类别1)。

  1. 在“数据集”标签中选择新数据集:
  1. 现在,它已“标记化”所有关键字。 从这里可以训练出许多令人兴奋的模型,但是出于本文的目的,我们将做最简单的事情。 导航到“一键式监督模型”:

完成计算后,您将看到如下所示的决策树:

再说一次,我不会介绍所有可以做的事情,但是基本上要做的是根据您提供的数据创建一系列if语句,它将用于计算类别的概率。

例如,我在图像上悬停的圆圈是具有以下属性的决策路径-如果关键字中不包含“牛仔裤”或“裤子”,则该关键词可能会是置顶得分为85.71的“顶部” %。

实际上,您可以创建一个称为“整体模型”的东西,它将更加准确。 您还可以拆分数据并对其进行受控测试,以便在使用数据之前可以看到数据的准确性。 如果您想了解更多信息,请与我联系或阅读网站上的文档。

因此,我们创建了一个模型,用于将类别1中的关键字分类。 现在,我们需要对第二类执行相同的操作。

回到您的资源并再次选择您的训练数据集:

重复上述步骤,但是这次在配置数据集时取消选择“类别1”:

与之前一样,创建一键式监督模型:

Voila –您的第二个决策树:

因此,现在我们有2个训练有素的模型,可以使用机器学习以相当高的准确性对您的关键字进行分类。

到目前为止所花费的时间: 10分钟(如果您在River Islands网站上进行每种产品分类,则可能需要一个小时)

获取其余关键字

我们只训练了一个涵盖2个类别和4个子类别的模型。 假设您对River Island网站上的每种产品进行了培训(最多可能需要一个小时或两个小时,甚至可能需要一个虚拟助手来帮助您并站起来),其余的关键字研究仍在进行中这么容易。

我现在要做的只是将以下竞争对手域插入域级别的SEMRush中,并导出其整个网站的排名关键字(为澄清起见,我不会像训练数据那样进入每个产品文件夹) :

https://www.superdry.com/
https://www.topman.com/
https://www.ralphlauren.co.uk/
https://www.burton.co.uk/

而且我可以继续。

在对这些网站上的所有关键字进行了重复数据删除并去除了品牌关键字之后,我剩下了大约10万个未分类的关键字。

我可能还会采用一些标准的关键字研究技术,例如使用合并词和关键字计划器或Ahrefs关键字浏览器来获得更多关键字建议。 好处是,我们不必花很多时间来确保要导出的关键字已正确分类。 我们可以从字面上插入域和种子关键字并导出。

然后,您将把这个庞大的,丑陋的,未分类的列表转储到Google表格中:

到目前为止所花费的时间:25分钟(如果从River Islands网站获得每个产品类别,则为1小时25分钟)

使用BigML的API对关键字进行分类

在Google表格上获取BigML插件:

您需要输入用户名和API密钥,但是您可以在BigML仪表板和设置中轻松找到它们。

现在,乐趣开始了。

  1. 突出显示需要分类的数组,然后选择要使用的训练模型。 在这种情况下,我使用的是类别1(目前我认为我们一次只能做一个类别。我还没有弄清楚如何同时使用这两个类别,这就是我们训练两个不同模型的原因):

然后,单击“预测”并放手:

这可能需要一段时间,具体取决于您拥有多少个关键字,但是至少您可以继续执行其他一些任务。 您会注意到它也给出了概率得分。 我倾向于只过滤掉少于50%的内容并删除它们。 我有100,000个关键字,我不会错过几个。

  1. 接下来,我们**工作表,删除两列,并对类别2进行完全相同的操作:
  1. 一旦完成分类并删除了具有较低“置信度”的关键字,您只需要清除格式,然后运行vlookup将它们放在一起:

根据需要运行任意多个类别,然后为最终的关键字研究文档输入其他任何重要数据:

最后的笔记

因此,我们有了它–一种在不到几小时的实际工作时间内将100k关键字归类的简单方法(这意味着您必须等待ML逐个通过关键字,但是您不会正在工作)。

  • 我还没有找到同时做这两种方法的方法,但是我想有一种方法可以做到。
  • 我们使用的模型不如引擎中的某些其他选项准确。 例如,使用集成模型会产生更好的结果,尤其是在训练模型较小的情况下,但配置起来稍微复杂一些。
  • 您还可以使用引擎发现类别和紧密相关的主题。 但这是另一篇文章。

这是非常基础的,但是功能却非常强大,并且是机器学习的非常不错的入门。 玩得开心!


本文表达的观点是来宾作者的观点,不一定是Search Engine Land。 工作人员作者在此处列出。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/10302.html