當前位置: 北京SEO兼職 > SEO技術研究>正文

淺析搜索排名算法之中文分詞

    中文分詞,相信大家并不陌生。無論是搜索引擎開發的程序員還是有足夠經驗的SEOer。都應該對其有或多或少的了解。筆者作為搜索引擎開發的程序員,也站在SEOer角度,今天對中文分詞進行一些淺談,并淺析中文分詞在搜索引擎優化中的注意事項。
一、 中文分詞算法類別
    從中文分詞類別來看,常見的分詞算法有:正向最大匹配、逆向最大匹配、雙向最大匹配、最佳匹配法、最少分詞法、詞網格算法等等。
二、 常見分詞算法簡單剖析
1、最大匹配法(Forward Maximum Matching method, FMM法):選取包含6-8個漢字的符號串作為最大符號串,把最大符號串與詞典中的單詞條目相匹配,如果不能匹配,就削掉一個漢字繼續匹配,直到在詞典中找到相應的單詞為止。匹配的方向是從右向左。
2、逆向最大匹配法(Backward Maximum Matching method, BMM法):匹配方向與MM法相反,是從左向右。實驗表明:對于漢語來說,逆向最大匹配法比最大匹配法更有效。
雙向匹配法(Bi-direction Matching method, BM法):比較MM法與RMM法的切分結果,從而決定正確的切分。
3、最佳匹配法(Optimum Matching method, OM法):將詞典中的單詞按它們在文本中的出現頻度的大小排列,高頻度的單詞排在前,頻度低的單詞排在后,從而提高匹配的速度。
往往在實際應用中各種算法會結合使用,比如:雙向最大匹配結合(FMM+BMM),此方法是眾多分詞公司的做法。
三、 中文分詞在SEO實踐中的注意事項
    選取關鍵詞時,要注意其分詞法則,長尾關鍵詞更是如此。比如做生日蛋糕的。如果結合了地域性,往往效果會更好,比如,生日蛋糕-北京-上海-廣州-深圳。這樣用戶會更容易找到其站。輔關鍵詞排名上來了,也會對主關鍵詞排名起推動作用。
    由于筆者精力有限,今天就淺析到此。有不足的,敬請和我交流,我也會及時補充上去。

 

原創內容,請勿轉載,違者必究!

? 上一篇下一篇 ?

發表評論:

(輸入Email可以獲得評論回復通知)

◎歡迎參與討論,請在這里發表您的看法、交流您的觀點。

燃烧吧足球