`
kidiaoer
  • 浏览: 807569 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

如何在MySQL中获得更好的全文搜索结果

阅读更多
如何在MySQL中获得更好的全文搜索结果


很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的 LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。

MySQL针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的 MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为 MySQL使用自然语言来智能地对结果评级,以去掉不相关的项目。

这篇文章将向您讲述在MySQL中如何进行全文搜索。

1、设置基本表格

从创建例子表格开始,使用以下的SQL命令:

mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT);

以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:

mysql> INSERT INTO `reviews` (`id`, `data`) VALUES

(1, 'Gingerboy has a new single out called Throwing Rocks. It's great!');

mysql> INSERT INTO `reviews` (`id`, `data`) VALUES

(2, 'Hello all, I really like the new Madonna single.

One of the hottest tracks currently playing...I've been listening to it all day');

mysql> INSERT INTO `reviews` (`id`, `data`)

VALUES (3, 'Have you heard the new band Hotter Than Hell?

They have five members and they burn their instruments when they play in concerts.

These guys totally rock! Like, awesome, dude!');

验证数据的正确录入:

mysql> SELECT * FROM reviews;

+----+--------------------------------------------+

| id | data                                       |

+----+--------------------------------------------+

|  1 | Gingerboy has a new single out called ...  |

|  2 | Hello all, I really like the new Madon ... |

|  3 | Have you heard the new band Hotter Than... |

+----+--------------------------------------------+

3 rows in set (0.00 sec)

2、定义全文搜索字段

接下来,定义您要作为全文搜索索引的字段

mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data);

Query OK, 3 rows affected (0.21 sec)

Records: 3  Duplicates: 0  Warnings: 0

使用SHOW INDEXES命令来检查索引已经被添加了:

mysql> SHOW INDEXES FROM reviews;

+---------+---------------+--------+------+------------+---------+

| Table   | Column_name   | Packed | Null | Index_type | Comment |

----------+---------------+--------+------+------------+---------+

| reviews |  id           | NULL   |      | BTREE      |         |

| reviews |  data         | NULL   | YES  | FULLTEXT   |         |

+---------+---------------+--------+------+------------+---------+

2 rows in set (0.01 sec)

3、运行全文搜索

当您拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的全文搜索方式是带有MATCH...AGAINST语句的SELECT查询,以下是一个简单的例子,可以来查找含有单词“single”的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('single');+----+

| id |

+----+

|  1 |

|  2 |

+----+

2 rows in set (0.00 sec)

在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看­-只需用逗号来分割字段列表。

当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。

想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:

mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews;

+----+-------------------------------+

| id | MATCH (data) AGAINST ('rock') |

+----+-------------------------------+

|  1 |                             0 |

|  2 |                             0 |

|  3 |               1.3862514533815 |

+----+-------------------------------+

3 rows in set (0.00 sec)

4、使用逻辑搜索修饰符(Boolean search modifiers)

您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的IN BOOLEAN MODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single -madonna' IN BOOLEAN MODE);

+----+

| id |

+----+

|  1 |

+----+

1 row in set (0.00 sec)

这一搜索特性通常用于搜索单词片断(而不是完整的词语),这可以通过在IN BOOLEAN MODE语句中的*(星号)操作符来实现,以下的例子展示了如何查找单词中含有“hot”的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hot*' IN BOOLEAN MODE);+----+

| id |

+----+

|  3 |

|  2 |

+----+

2 rows in set (0.00 sec)

您还可以使用这种方法来查找至少一个传递到AGAINST的参数中,以下的例子查找了至少包含单词“hell”和“rocks”中的一个的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hell rocks' IN BOOLEAN MODE);

+----+

| id |

+----+

|  1 |

|  3 |

+----+

2 rows in set (0.00 sec)

以上的这些例子演示了相对于传统的SELECT...LIKE语句,进行全文搜索的更有效的方法,当您下一次需要编写MySQL数据库搜索界面的时候,您可以尝试这一方法。

责任编辑:张琎

查看本文的国际来源
分享到:
评论

相关推荐

    在MySQL中获得更好的全文搜索结果

    者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索 引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然语言来...

    在MySQL中获得更好的搜索结果

    开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然...

    mysql 搜索之简单应用

    如何在MySQL中获得更好的全文搜索结果 作者: Techrepublic.com.com 2006-04-03 11:14:53  很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,...

    mysql数据库my.cnf配置文件

    #MySQL的查询缓冲大小(从4.0.1开始,MySQL提供了查询缓冲机制)使用查询缓冲,MySQL将SELECT语句和查询结果存放在缓冲区中, # 今后对于同样的SELECT语句(区分大小写),将直接从缓冲区中读取结果。根据MySQL用户...

    mysql 模糊搜索的方法介绍

    网上查了一下,有两种方法,第一种最土的方法:使用like语句第二种听涛哥说用全文索引,就在网上搜一下: 如何在MySQL中获得更好的全文搜索结果 很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者...

    MySQL命令大全

    以下是无意中在网络看到的使用MySql的管理心得, 在windows中MySql以服务形式存在,在使用前应确保此服务已经启动,未启动可用net start mysql命令启动。而Linux中启动时可用“/etc/rc.d/init.d/mysqld start”...

    MYSQL常用命令大全

    以下是无意中在网络看到的使用MySql的管理心得, 摘自:http://www1.xjtusky.com/article/htmldata/2004_12/3/57/article_1060_1.html 在windows中MySql以服务形式存在,在使用前应确保此服务已经启动,未启动可用...

    PHP和MySQL Web开发第4版pdf以及源码

    2.10 更好的方式:数据库管理系统 2.10.1 使用普通文件的几个问题 2.10.2 RDBMS是如何解决这些问题的 2.11 进一步学习 2.12 下一章 第3章 使用数组 3.1 什么是数组 3.2 数字索引数组 3.2.1 数字索引数组的...

    PHP和MySQL WEB开发(第4版)

    2.10 更好的方式:数据库管理系统 2.10.1 使用普通文件的几个问题 2.10.2 RDBMS是如何解决这些问题的 2.11 进一步学习 2.12 下一章 第3章 使用数组 3.1 什么是数组 3.2 数字索引数组 3.2.1 数字索引数组的初始化 ...

    PHP和MySQL Web开发第4版

    2.10 更好的方式:数据库管理系统 2.10.1 使用普通文件的几个问题 2.10.2 RDBMS是如何解决这些问题的 2.11 进一步学习 2.12 下一章 第3章 使用数组 3.1 什么是数组 3.2 数字索引数组 3.2.1 数字索引数组的...

    搜啊搜索SOOUA(PHP MYSQL) v10.0 正式版.rar

    您只需要架设好网站,推广即可获得丰富的佣金; 当用户在您的网站使用功能(包括但不限于:搜索/点击导航网址/点击新闻/点击头条)都可以获得佣金。 佣金满100元后次月2-5日进行结算;   有作弊意向的请勿下载...

    Java项目:YY酒店管理系统(java+JSP+Easyui+Echars+ssm+mysql)

    酒店管理系统的目标是为用户提供高效的服务,减少手工处理的繁琐与误差,及时准确地反映酒店工作情况、经营信息,从而提高酒店工作质量,获得更好的经济效益,实现客房管理的规范化、自动化。具体目标包括: 高效...

    基于ssm_mysql_陆丰市医院分诊管理系统源码.zip

    实现了医院管理的简单化和规划化,提高了医院的工作效率,从而使医院能够以少的投入获得更好的社会效益与经济效益。 作为计算机应用的一部分,使用计算机对客户信息进行管理,具有着手工管理所无法比拟的优点....

    基于SSM+Mysql的软件学院互助答疑平台.zip

    知识分享:学生可以分享自己的学习心得、学习资源、学习方法等,帮助其他学生更好地理解和掌握知识。 标签和分类:平台支持问题的标签和分类,方便学生快速找到相关问题和答案。学生可以根据自己的兴趣和专业领域...

    多用户商城管理系统

    要求支持Rewrite,以获得更好的搜索引擎优化效果。 文当编码统一为UTF-8编码。Mysql字符集统一为UTF-8。 开发工具任选,editplus,ZEND,dremwaver以及您喜欢的任意一款开发工作,只是注意一下文档编码设为UTF8。 为了...

    java项目之农业推广项目申报与管理系统源码(ssm+mysql+jsp).zip

    (6)旅游项目推广:显示了该地区的旅游项目的信息,以便更好的了解该地区的旅游项目资源。 2、后台管理功能: (1).管理员登录:包括登录信息输入、信息提交、信息重填等操作。 (2).农产品管理:包括增加、...

    Maybecms v1.2.zip

    良好的用户体验度系统结构优化的同时内置多种SEO设置,使得网站内容更加利于搜索引擎的抓取和收录,让你的网站免费在搜索引擎中获得好的排名。 插件扩展方便 支持插件扩展,用户可自由扩展程序功能,采用基于...

Global site tag (gtag.js) - Google Analytics