主頁 > 知識庫 > mysql全文模糊搜索MATCH AGAINST方法示例

mysql全文模糊搜索MATCH AGAINST方法示例

熱門標簽:Linux服務器 網(wǎng)站排名優(yōu)化 地方門戶網(wǎng)站 服務外包 呼叫中心市場需求 AI電銷 鐵路電話系統(tǒng) 百度競價排名

mysql 4.x以上提供了全文檢索支持 MATCH ……AGAINST 模式(不區(qū)分大小寫)

建立全文索引的表的存儲引擎類型必須為MyISAM

問題是match against對中文模糊搜索支持不是太好

新建一個utf8 MyISAM類型的表并建立一個全文索引 :

CREATE TABLE articles (
  id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
  title VARCHAR(200),
  body TEXT,
  FULLTEXT (title,body)
) ENGINE=MyISAM DEFAULT >

其中FULLTEXT(title, body) 給title和body這兩列建立全文索引,之后檢索的時候注意必須同時指定這兩列。

給這個表添加點測試數(shù)據(jù)

INSERT INTO articles (title,body) VALUES
  ('MySQL Tutorial','DBMS stands for DataBase ...'),
  ('How To Use MySQL Well','After you went through a ...'),
  ('Optimizing MySQL','In this tutorial we will show ...'),
  ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'),
  ('MySQL vs. YourSQL','In the following database comparison ...'),
  ('MySQL Security','When configured properly, MySQL ...');

全文檢索測試

SELECT * FROM articles  WHERE MATCH (title,body) AGAINST ('database'); 

注意 MATCH (title,body) 里面的值必須是前面建立全文索引的兩個字段不能少。

mysql 默認支持全文檢索的字符長度是4,可以用SHOW VARIABLES LIKE 'ft_min_word_len' 來查看指定的字符長度,也可以在mysql配置文件my.ini 更改最小字符長度,方法是在my.ini 增加一行 比如:ft_min_word_len = 2,改完后重啟mysql即可。

另外,MySQL還會計算一個詞的權(quán)值,以決定是否出現(xiàn)在結(jié)果集中,具體如下:

mysql在集和查詢中的對每個合適的詞都會先計算它們的權(quán)重,一個出現(xiàn)在多個文檔中的詞將有較低的權(quán)重(可能甚至有一個零權(quán)重),因為在這個特定的集中,它有較低的語義值。否則,如果詞是較少的,它將得到一個較高的權(quán)重,mysql默認的閥值是50%,上面‘you'在每個文檔都出現(xiàn),因此是100%,只有低于50%的才會出現(xiàn)在結(jié)果集中。

全文檢索語法

SELECT * FROM articles WHERE MATCH (title,body)   AGAINST ('+apple -banana' IN BOOLEAN MODE); 

表示AND,即必須包含。- 表示NOT,即不包含。

SELECT * FROM articles WHERE MATCH (title,body)   AGAINST ('apple banana' IN BOOLEAN MODE); 

apple和banana之間是空格,空格表示OR,即至少包含apple、banana中的一個。

SELECT * FROM articles WHERE MATCH (title,body)   AGAINST ('+apple banana' IN BOOLEAN MODE); 

必須包含apple,但是如果同時也包含banana則會獲得更高的權(quán)重。

SELECT * FROM articles WHERE MATCH (title,body)   AGAINST ('+apple ~banana' IN BOOLEAN MODE);

 ~ 是我們熟悉的異或運算符。返回的記錄必須包含apple,但是如果同時也包含banana會降低權(quán)重。 但是它沒有 +apple -banana 嚴格,因為后者如果包含banana壓根就不返回。

SELECT * FROM articles WHERE MATCH (title,body)   AGAINST ('+apple +(>banana orange)' IN BOOLEAN MODE); 

返回同時包含apple和banana或者同時包含apple和orange的記錄。但是同時包含apple和banana的記錄的權(quán)重高于同時包含apple和orange的記錄。

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • Mysql全文搜索match against的用法

標簽:湘潭 湖南 蘭州 銅川 仙桃 黃山 崇左 衡水

巨人網(wǎng)絡通訊聲明:本文標題《mysql全文模糊搜索MATCH AGAINST方法示例》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266