SQL Server对文件进行全文检索的查询

2016-01-29 15:45 10 1 收藏

SQL Server对文件进行全文检索的查询,SQL Server对文件进行全文检索的查询

【 tulaoshi.com - SQLServer 】

因为项目需要,需要对上传的文件内容进行查询。通过MSDN了解到Windows索引服务可以实现对文件的全文检索,并可以通过SQL Server进行查询。项目将这两者结合,实现对上传文件的全文检索的解决方案。
方案概要:
1. 改变文件存储时的文件名
2. 配置索引服务器,并将索引服务器与MS SQL Server关联。
3. 修改SQL语句,将进行全文查询语句的内容加入查询条件中

文件的存储方式:
为了方便存储以及方便索引,我们将上传的文件存储到一个目录里面,为了保证上传的文件名不重复,采用GUID作为文件名,并且通过这个GUID于数据库记录相关联。同时,文件的后缀还保持原始文件的后缀,让索引服务能够识别该文档。


    配置索引服务

    进入计算机管理(Computer Management)程序(右键”我的电脑”-”管理”),并找到索引服务(Index Service)

    配置索引服务的功能
(1)     右键选择索引服务弹出一个菜单
(2)     选择New-Catalog(新建一个编录)

    设置新增加的编录
(1)     输入编录的名字(这个名字需要与数据库进行关联,要注意命名,这里假设DCSII
(2)     点Browse进入选择索引服务运行目录窗体
(3)     选择前面创建的索引运行目录(任意地方)
(4)     点确定完成本次操作

    在编录创建号以后,需要给编录增加目录
(1)     右键选择刚刚创建的编录
(2)     选择New-Directory(新建目录)

    新建索引目录
(1)     点击Browse进入目录选择页面
(2)     选择要进行全文检索文件的目录
(3)     确定完成本次操作

    完成创建后启动索引服务
    (1)启动索引服务
    (2)索引服务启动成功后索引编录的信息,可以看到编录信息就表示服务已经启动成功。

将索引服务和SQL数据库关联:
在SQL 查询分析器(SQL Query Analyer)里执行下面的存储过程
EXEC sp_addlinkedserver Dcs,   --   连接服务器的名字,到后面查询的时候要用到
  'Index Server',
  'MSIDXS',
  'DCSII'   -- 索引服务里新建的编录名字


  索引服务的性能调整方法1

(1)     右键选择索引服务
(2)     选择 All Tasks- Tune Perrformance
(3)     选择用户自定义
(4)     点击Customize进入性能调整窗体
(5)     将Index和Querying的属性移动到最右边
(6)     点确定完成操作

  性能调整方法2
    如果服务器不需要对整个系统的文件进行索引,可以停止或者删除System编录。


  MS SQL对索引服务器的调用
1. 通过sql语句查询连接服务器的内容
SELECT Q.*
FROM OpenQuery(dcs, --连接服务器名字
          'SELECT FileName, Size, DocAuthor, path   --在连接服务器里的sql语句
          FROM SCOPE()
          WHERE CONTAINS(''番号 and abc'') '
        ) AS Q
2. 因为SQL语句不支持动态输入的字符串,因此查询字符串只好在C#代码里进行拼接


实不用将文件保存到数据库外面也能实现在数据库里实现全文搜索。具体方案是在SQL Server 2000里安全全文搜索功能,用image字段存储文件内容,并新增一个字段存放文件类型,然后在通过企业管理器新建全文索引项的时候将这两个字段匹配就可以。不过从数据库的/率以及今后数据库备份和恢复的效率上来看,将文件放在数据库的设计不是太好。

来源:http://www.tulaoshi.com/n/20160129/1496360.html

延伸阅读
标签: SQLServer
  /* 'bcp' 不是内部或外部命令,也不是可运行的程序? 看看在C:\Program Files\Microsoft SQL Server\80\Tools\Binn里面有没有bcp.exe这个文件 然后看看path里面加C:\Program Files\Microsoft SQL Server\80\Tools\Binn这个目录没有. 右键我的电脑--属性--高级--环境变量--在系统变量中找到path--编辑 在变量值的最后加上: C:\Prog...
标签: SQLServer
一般情况,使用sql server中的全文索引,经过大体4个步骤:      1).安装full text search全文索引服务;      2).为数据表建立full text catalog全文索引目录;      3).进行full text catalog的population操作(使全文索引...
标签: MySQL mysql数据库
<通过MySQL内置全文检索实现中文的相关检索 关键字:MySQL 全文检索 全文索引 中文分词 二元分词 区位码 相似度 /** * @author : walkerlee * @copyright : www.neatstudio.com | www.walkerlee.net */ 转载请保留以上信息。 注:本文使用的MySQL版本为:MySQL 4.0.x 在MySQL4中,是已经开始支持全文检索(索引)的了。但是只是对英文支...
酷盘如何对文件进行操作   酷盘对文件进行操作的方法如下:
具体操作: 根据master.dbo.sysprocesses中的spid和blocked查找当前阻塞语句的主人,然后使用DBCC INPUTBUFFER ()查看阻塞语句。 例子: 打开三个查询分析器 A、B、C 创建一个测试用的表 testDia Create Table testDia(ID int); 在A执行以下语句: Begin tran Insert Into testDia Values(1); 在B执行以下语句: Select * from t...

经验教程

383

收藏

62
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部