1. 研究目的
本研究关注基金行业在百度搜索引擎平台上的投放状况以及差异。帮助客户寻找更多高频搜索意图词语,并了解主要竞争对手的投放态势与投放规律,引导投放策略更加精准高效。
2. 数据来源
本报告研究的数据来自于_ag亚游,ag8亚游集团,ag亚游官网-www.AG8.com自身建设的数以十亿计的海量搜索关键词词库,涵盖了网上用户对各行各业的真实相关搜索词。报告从中随机选择了与基金行业相关的 1 万多条搜索词,然后以爬虫在百度搜索结果页抓取数据为基础。抓取数据过程主要包含以下两个步骤:首先,通过对_ag亚游,ag8亚游集团,ag亚游官网-www.AG8.com“全行业核心关键词库”分析,获得所有包含“基金”的种子词,共11,970 个。然后,生成抓取命令,通过爬虫抓取种子词在百度搜索结果页面的投放情况。抓取命令充分考虑不同的时间和地域。抓取了在百度搜索首页所展示的所有 URL 排名,并考虑了不同的投放位置(左展位,右展位和顶部展位),还对主要竞争对手的创意标题做了深刻的语义分析。所有的分析都将基于这个广告数据集。
3. 相关指标分析
搜索词:指在搜索引擎平台上用户真实输入的关键词,反映了用户的搜索习惯和真实意图。搜索词不等同于账户中真实投放的关键词,但是一般情况下,两者会趋同。比如此次选择的1 万词都是搜索词。
网站曝光指数:是网站整体性指标,反应了某基金网站在众多同类型网站中能够被用户搜索并看到(这里指在搜索引擎平台上被展现的)的情况,如某网站在一段时间被用户输入完搜索词后,其广告总展现次数越多,则认为该网站的网站曝光指数较强。比如在此次样本中,广发基金在用户搜索之后的广告展现量为 6,157,泰康保险的广告展现量为 3,824,样本中各个网站总展现量之和为58,164 ,则广发基金的网站曝光指数 为6,157/58,164*100%=10.6%,泰康保险的网站曝光指数为 3,824/58,164*100%=6.6%。注意:网站曝光指数仅考虑广告展现,没有考虑广告排名,后面将单独分析排名因素。
购买词:即客户账户中真实存在的关键词。
注:我们不可能直接得到所有基金网站完整的真实投放关键词数据,但是可以根据广告显示规则,很大程度上确定对方是否推广了某关键词:即一定程度上认为完全飘红词等于购买词,所以在不能得到用户投放词的时候,我们假定完全飘红的词就是客户购买词。
购买力度:衡量某网站对全行业购买词的购买所占比例。假如全行业有1万的购买词,某网站已购买1千个,则认为该网站的购买力度值为 10%,某网站的购买力度越大,则认为该网站的广告覆盖程度越高,说明该网站的推广规模也越大。购买力度是与同行业之间的一个横向比较,和客户最终是否真实看到是两个概念,一个极端的例子是如果全行业都购买了搜索网民根本不会输入的关键词,那么即使某网站购买力度很高,但实际上能够被客户看到的几率也不高,所以某网站购买力度需要结合该网站的网站曝光指数,才能完整说明一个网站的投放策略效果。
竞争力度:衡量其他网站与某网站在关键词购买商的竞争程度。假如 A 网站购买了1,000关键词,那么他自身的竞争力度为 1,000/1,000*100%=100%;如果有B网站购买了A网站相同的关键词 100 个,则 B 网站对 A 网站的竞争力度为100/1,000*100%=10%。
广告排名:是用户搜索词下的广告排名,根据广告匹配规则,搜索词的广告排名也可以反映商家真实投放的关键词的排名。比如在百度搜索“广发基金”,就会在首位展现广发基金的广告,所以搜索词“广发基金”在广发基金投放的关键词中排名第一。虽然每个商家的广告排名不可能精确地从广告匹配规则得知,但是根据统计学规律,此类误差是可以接受的,能够反映真实投放情况。
关键词热度:是衡量关键词被用户搜索或者被多少网站购买的指标, 有两层含义:1 某词被众多推广网站购买,可以认为该词热度很高;2 从用户角度来说,一天内某词被用户大量搜索,可以认为该词热度较高。本文将使用被多少网站购买这一指标来表示关键词的热度。
4. 基金网站竞争态势分析
我们基于本研究所选定的种子词,经过多次爬取,共触发了百度搜索广告58,164 条。通过分析其URL一级域名,发现有规模不等基金行业客户共1,501 个,行业竞争非常激烈。通过分析创意标题的飘红状况,我们获得高质量有效关键词总共:2,920 个。
4.1 基金网站曝光指数


4.3 广告排名


4.5 广告标题与描述
下面我们对抓取到的所有广告标题和描述进行语义分析, 利用中文分词技术进行切分,获得频率最高的标题和描述词语。
图 6 广告标题高频词语

图 7 广告描述高频词语