忍者ブログ

ゴミSEOブログ 「Another SEO Blog 〜それより僕が伝えたいSEOは〜」から「ゴミSEOブログ」にタイトル変更しました。ゴミのようなSEOブログです。

RSS TWITTER RssTwitter

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

このエントリーをはてなブックマークに追加      

超適当なSEO用語辞典 3キーワード目:キーワード出現率(形態素解析)

このカテゴリでは超適当にSEO用語の解説をしていきたいと思います。
多少変な事が書いてあるかもしれませんが、ネット上の情報なんで、信じるか信じないかはお任せしちゃいます。


超適当なSEO用語辞典、3キーワード目は、「キーワード出現率」です。


「キーワード出現率」という言葉は、SEOとか興味が無い人はあまり聞き覚えがない言葉だと思います。僕も1990年代からインターネットをしていましたが、「キーワード出現率」という言葉を知ったのは今の会社に入社してからです。



そして本題に入りますが「キーワード出現率」というのは、HPやブログなどのページの中にどれぐらい単語が使われていて、どれぐらい特定のキーワードが記載されてるのか、その比率をあらわす物です。


極端な例をあげると、合計1000単語使われている文章で、100単語特定のキーワードが使われていたら、そのキーワード出現率は10%という事になりますね。


それでSEOの世界でキーワード出現率の話題が出て、どれぐらいのパーセンテージが良いのか、とかそんな話が出たりするのですが、以前だと5%ぐらいが無難だよねーという意見が多かったです。現在も検索エンジンで上位表示されているサイトの平均キーワード出現率を見ると、多少差はありますが5%前後である事が多いです。(中には1%以下で上位表示されているページもありますが、少数派です)



★キーワード出現率と形態素解析の話


キーワード出現率を計測するツールは無料から有料まである程度の数がネット上にあります。僕が働いている会社でもキーワード出現率を計測するツールがいくつかあります。社内限定ですが。


それで気になってくるのが、キーワード出現率を計測するツールってどうやって作られているの? という部分です。これは形態素解析を用いて文章を単語ごとに分解して、特定のキーワード出現率を計算しています。


ちなみに形態素解析は辞書と文法を基に文章を単語に分解するので、どういった形態素解析ツールを使うかによってキーワード出現率は微妙に変わってくると思われます。弊社では「MeCab」というツールが使用されています。

※Wikipediaで知ったのですが、「MeCab」の作者は現在Google勤務で、Google日本語入力の開発者の一人でもあるらしいです。ほんと、お世話になりっぱなしです。




★形態素解析以外で、キーワード出現率が変わる要因


どの形態素解析ツールを使うかによって、キーワード出現率の数値が変わってくると書きましたが、形態素解析以外でもキーワード出現率の数値が変わる要因があります。

これは完全に形態素解析ツールではなくて、各ツールの仕様の問題です。HTMLソースのどこのテキストを計測範囲に含めるかによって変わります。


・HTMLソース全て
・bodyタグ内全て
・alt属性やtitle属性などを除く
・コメントアウトを除く

などなど。無難じゃないかなと思うのは、画面に表示されているテキストだけをカウントする設定かなと思ったりします。でも各社それぞれ考え方が微妙に違うので必ず同じキーワード出現率になる事はないかもしれませんね。


※altテキストにキーワード詰め込みとかしているのをサクっと確認するにはaltテキスト内の出現率を測る機能を追加しておけば大丈夫ですね。



★形態素解析とキーワード出現率は関係するけど、形態素解析とSEOは?


それにしてもSEOで形態素解析がどうとか考えている人って居るのかな?
形態素解析の事を考える人って大抵ツールを作る人ぐらいかな?
ちなみに私は、形態素解析の事は基本的に考えずにSEOをやっています。
(たまに考えなければいけない時もありますけどね。そのページのどこにキーワードがあるんだい?って時とか。)




今回はここまでです。
いやー、この記事を書いていて最後まで「測る」と「計る」はどちらが正しいのか確かめなかったので、誤字があるかもしれませんがご容赦を。

拍手[0回]

PR
このエントリーをはてなブックマークに追加      
Comment
name
title
color
mail
comment
pass   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
コメントの修正にはpasswordが必要です。任意の英数字を入力して下さい。
   
Clear