用C#实现在Word文档中搜索文本

2016-02-19 15:52 33 1 收藏

下面是个简单易学的用C#实现在Word文档中搜索文本教程,图老师小编详细图解介绍包你轻松学会,喜欢的朋友赶紧get起来吧!

【 tulaoshi.com - 编程语言 】

  在word应用程序中搜索和替换文本是举手之劳的事情,通过word的对象模型,我们也可以使用编程方式来实现。

  Word的对象模型有比较详细的帮助文档,放在office安装程序目录,office 2003是在Program FilesMicrosoft OfficeOFFICE112052下,文档本身是为VBA提供的,在这个目录下还可以看到所有的office应用程序的VBA帮助。

  打开VBAWD10.CHM,看到word的对象模型,根据以往的使用经验,很容易在Document对象下找到Content属性,该属性会返回一个文档文字部分的Range对象,从这个对象中不难取到所有的文档内容,再用string的IndexOf()方法很容易达到目标。

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/bianchengyuyan/)
object filename="";  //要打开的文档路径string strKey="";   //要搜索的文本object MissingValue=Type.Missing;Word.Application wp=new Word.ApplicationClass();Word.Document wd=wp.Documents.Open(ref filename,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue);if (wd.Content.Text.IndexOf(strKey)=0){   MessageBox.Show("文档中包含指定的关键字!","搜索结果",MessageBoxButtons.OK);}else{   MessageBox.Show("文档中没有指定的关键字!","搜索结果",MessageBoxButtons.OK);}

  不过,这种做法是很勉强的,对小文档来说,不存在问题,对超长超大的文档来说,这样的实现方法已经暗埋bug了,而且是程序级的bug,因为正常的测试会很难发现问题,在使用中导致程序出现什么样的结果也很难量化描述。

  其实,在word中已经提供了可以用作搜索的对象Find,在对象模型上也比较容易找到,对应的说明是这样的:该对象代表查找操作的执行条件。Find 对象的属性和方法与替换对话框中的选项一致。从模型上看,Find对象是Selection的成员,从示例代码来看似乎也是Range的成员,查找Range的属性,果然如此。于是修改上面的代码:

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/bianchengyuyan/)
wd.Content.Find.Text=strKey;if (wd.Content.Find.Execute(ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue)){   MessageBox.Show("文档中包含指定的关键字!","搜索结果",MessageBoxButtons.OK);}else{   MessageBox.Show("文档中没有指定的关键字!","搜索结果",MessageBoxButtons.OK);}

  这样似乎也不是最好,因为我只要判断指定的文本是不是在文档中,而不需要知道它出现了几次,如果有多个要搜索的文本,难道每次都进行全文档搜索?假设我要搜索的文本包含在文档中,最好的情况是在文档开头就包含我要查找的文本,最坏的情况是在文档的最后包含要查找的文本,如果每次取一部分文档进行判断,符合条件就结束本次搜索,就可以避免每次搜索整个文档了。模型中的Paragraphs对象现在派上用场了,再修改一下代码:

int i=0,iCount=0;Word.Find wfnd;if (wd.Paragraphs!=null && wd.Paragraphs.Count0){  iCount=wd.Paragraphs.Count;  for(i=1;i=iCount;i++)  {    wfnd=wd.Paragraphs[i].Range.Find;    wfnd.ClearFormatting();    wfnd.Text=strKey;    if (wfnd.Execute(ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue,ref MissingValue,        ref MissingValue))    {        MessageBox.Show("文档中包含指定的关键字!","搜索结果",MessageBoxButtons.OK);        break;    }  }}

来源:http://www.tulaoshi.com/n/20160219/1610594.html

延伸阅读
标签: Web开发
篇文章描述如何获得IE浏览器当前网页的HTML文档。 Create a console application in any version of Visual Studio using .Net version 1|2|3|3.5. Add two Com object references which will allow us to manipulate IE. 用 Visual Studio 的任意版本建立一个控制台程序。 添加2个COM对象引用用来操作IE ...
在.NET框架下的C#语言,和其他.NET语言一样提供了很多强大的特性和机制.其中一些是全新的,而有些则是从以前的语言和平台上照搬过来的。然而,这种巧妙的结合产生了一些有趣的方法可以用来解决我们的问题。这篇文章将讲述如何利用这些奇妙的特性,用插件(plug-ins)机制建立可扩展的解决方案。后面也将提供一个简要的例子,你甚至可以用这个...
  手头上的一个项目报表相对比较简单,所以报表打印采用VBA引擎,通过定制Word模版,然后根据模版需要填充数据,然后OK,打印即可。 实现方法:首先需要引用VBA组建,我用的是Office2003 Professional,Dll版本号为Microsoft Word11.0, 另外当然还需要引用Interop.Word.Dll. 代码如下: #region 打开Word文档,并且返回对象wDoc,wDoc &...
WWW的工作基于客户机/服务器计算模型,由Web 浏览器(客户机)和Web服务器(服务器)构成,两者之间采用超文本传送协议(HTTP)进行通信,HTTP协议的作用原理包括四个步骤:连接,请求,应答。根据上述HTTP协议的作用原理,本文实现了GET请求的Web服务器程序的方法,通过创建TcpListener类对象,监听端口8080; 等待、接受客户机连接到端口8080...
using System; using System.IO; using System.Security.Cryptography; namespace Vavic { /// /// Security 的摘要说明。 /// public class Security { const string KEY_64 = "VavicApp"; const string IV_64 = "VavicApp"; //注意了,是8个字符,64位 public Security() { // // TODO: 在此处添加构造函数逻辑 // } publ...

经验教程

438

收藏

26
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部