字符串近似匹配算法

2016-02-19 18:01 23 1 收藏

今天图老师小编给大家介绍下字符串近似匹配算法，平时喜欢字符串近似匹配算法的朋友赶紧收藏起来吧！记得点赞哦~

【 tulaoshi.com - 编程语言】

　　字符串的近似匹配，就是答应在匹配时有一定的误差，比如在字串“以前高手好久不见”中找“以前是高手”也能成功。具体地说，错误可以有三种类型：加字符（以前也是高手）、漏字符（以前高手）和替换字符（以前石膏手）。下面的函数在text中查找子串pat，最多答应有k个错误。返回的是匹配的终点（我还没想好如何确定起点，呵呵）。
　　至于算法的原理，现在一下子说不清楚，只能说这是一个非确定性有限自动机，以后有时间的话再具体介绍。有爱好的话可以自己去看文章《Faster Approximate String Matching》, Algorithmica (1999) 23: 127-158。
　　
　　算法的限制：(m-k)*(k+2) = 64, 这里m是子串的长度。那个64是因为哦用了64位整数来编码自动机的状态。假如答应两个错误，则子串最长为18个字符，对一般应用来说足够了。
　　
　　好了，废话少说，看算法吧。看不懂？没事了，哦也是半懂半不懂的。
　　
　　char* amatch(const char* text, const char* pat, int k)
　　{
　　  int m = strlen(pat);
　　  assert(m-k0);
　　  assert((m-k)*(k+2)= 64);
　　  int j;
　　  __int64 Din = 0;
　　  __int64 M1 = 0;
　　  __int64 M2 = 0;
　　  __int64 M3 = 0;
　　  __int64 G = 1 k;
　　  int onekp1 = (1 (k+1)) - 1;
　　  for (j=0; jm-k; j++)
　　  {
　　    Din = (Din (k+2))onekp1;
　　    M1 = (M1 (k+2))1;
　　    if (j m-k-1)
　　      M2 = (M2 (k+2)) 1;
　　  }
　　  M2=(M2(k+2))onekp1;
　　  __int64 D=Din;
　　  const char* s=text;
　　  int c=*s++;
　　  while(c)
　　  {
　　    int found=0;
　　    const char* sp=pat;
　　    for(j=0;jk+1;j++)
　　    {
　　      int cp=*sp++;
　　      if(c==cp)
　　      {
　　        found=1;
　　        break;
　　      }
　　    }
　　    if(found)
　　    {
　　      do
　　      {
　　        __int64 tc = 0;
　　        const char* sp = pat;
　　        for (j=0; jm; j++)
　　        {
　　          int cp = *sp++;
　　          if (c!=cp)
　　          c=(1j);
　　        }
　　        __int64 Tc = 0;
　　        for (j=0; jm-k; j++)
　　        Tc = (Tc(k+2))((tcj)&onekp1);
　　        __int64 x = (D(k+2))Tc;
　　        D=((D1)M1)&((D(k+3))M2)&(((x+M1)^x)1)&Din;
　　        if((D & G) == 0)
　　          return (char*)s;
　　        if(D != Din)
　　          c = *s++;
　　      }
　　      while ( D != Din && c);
　　   }
　　   if (c)
　　     c = *s++;
　　}
　　return NULL;
　　}
　　

来源:http://www.tulaoshi.com/n/20160219/1616612.html

上一篇： win10多桌面如何切换
下一篇： Monty说MySQL的优化（六）

看过《字符串近似匹配算法》的人还看了以下文章更多>>

Delphi中的字符串

标签：编程语言网络编程

Delphi中的字符串 ——摘自网络一：各种字符串字符串是Object Pascal所有数据类型中最有用的类型。许多函数以字符串为传递参数。由于在Delphi中字符串的定义和使用有各种方式，包括Pascal中典型的字符串（String），Delphi支持的长字符串（ANSIString），类似于C语言的字符数组（Array of Char），指向字符的...

正则替换字符串功能

标签： Web开发

a href="1.htm"251/a 怎么用JS把251替换为 span style='background-color: #99FF99'251/span [Ctrl+A 全选注:如需引入外部Js需刷新才能执行]

oracle 字符串转成行

标签：编程语言网络编程

SELECT SUBSTR (T.RPT_ID, INSTR (T.RPT_ID,',',1,C.LV)+ 1, INSTR (T.RPT_ID,',',1,C.LV + 1)- (INSTR (T.RPT_ID,',',1,C.LV)+ 1)) &n...

测字符串长度函数

标签： ASP

'*************测字符串长度************** Function CheckStringLength(txt) txt=trim(txt) x = len(txt) y = 0 for ii = 1 to x if asc(mid(txt,ii,1)) < 0 or asc(mid(txt,ii,1)) 255 then '如果是汉字 y = y + 2 else y = y + 1 end if next CheckStringLength = y End Function '************* 截取字符串 ************** f...

mysql的字符串函数

标签： MySQL mysql数据库

对于针对字符串位置的操作，第一个位置被标记为1。 ASCII(str) 返回字符串 str 的最左面字符的ASCII代码值。如果 str 是空字符串，返回 0 。如果 str 是 NULL ，返回 NULL 。 mysql select ASCII('2'); - 50mysql select ASCII(2); - 50mysql select ASCII('dx'); - 100 也可参见ORD()函...

查看更多精彩>>