字符串哈希-白红宇

字符串哈希

阅读量：355 次

发布时间：2019-03-04

本文共 3089 字，大约阅读时间需要 10 分钟。

字符串哈希-兔子与兔子

题目：

很久很久以前，森林里住着一群兔子。

有一天，兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列（小兔子是外星生物，DNA 序列可能包含 26 个小写英文字母）。

然后我们每次选择两个区间，询问如果用两个区间里的 DNA 序列分别生产出来两只兔子，这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m，表示 m 次询问。

接下来 m 行，每行四个数字 l1,r1,l2,r2，分别表示此次询问的两个区间，注意字符串的位置从1开始编号。

输出格式

对于每次询问，输出一行表示结果。

如果两只兔子完全相同输出 Yes，否则输出 No（注意大小写）。

数据范围

1≤length(S),m≤1000000

输入样例：

aabbaabb

1 3 5 7

1 3 6 8

1 2 1 2

输出样例：

Yes

题意：

$m 个询问，每次给定两个区间，判断两个区间的子串是否相等。$

字符串哈希算法

$将给定字符串视作一个P进制的数，再对其每一个前缀进行求值并映射到hash数组中，当需要对该字符串中的子串\\进行比较时,就可以用O(1)的时间快速查询某段子串的哈希值。为了避免冲突，P通常取一些质数。$

EG:

举 例 ： 字 符 串 s t r = " a b c a b " ， 取 P = 131 ， 即 将 s t r 看 作 是 一 个 131 进 制 的 数 ， a b c d . . . 视 作 1, 2, 3, 4 . . . 。

$① 、对其每一个前缀求值, 用数组 h 来存储：$

h[1]=a=131^0×1，\\h[2]=ab=131^1×1+131^0×2，\\h[3]=abc=131^2×1+131^1×2+131^0×3,\\h[4]=abca=131^3×1+131^2×2+131^1×3+131^0×1,\\h[5]=abcab=131^4×1+131^3×2+131^2×3+131^1×1+131^0×2。

$② 、计算子串的哈希值：$

可见，h[i]=h[i-1]×131+(str[i]-'a\ '+1)。计算区间[l,r]之间字符串对应哈希值=h[r]-h[l-1]×131^{r-l+1}。\\注意：因为下标小的字符在高位，我们在作差过程中要将前缀先乘上数量级的差。因此我们用p数组存储131^i。

模板代码:

#include 
   
    #include 
    
     #include 
     
      #define ull unsigned long longusing namespace std;const int N=1e6+10;const int base=131;int n ,m;ull h[N],p[N];ull get(int l,int r){
       return h[r]-h[l-1]*p[r-l+1];}char s[N];int main(){
       scanf("%s",s+1);    n=strlen(s+1);  ///strlen(字符串首地址)    cin >> m;        p[0]=1;    for(int i=1;i<=n;i++)    {
           h[i]=h[i-1]*base+s[i]-'a'+1;        p[i]=p[i-1]*base;    }            int l1,r1,l2,r2;    while(m--)    {
           scanf("%d%d%d%d",&l1,&r1,&l2,&r2);        if(get(l1,r1)==get(l2,r2)) printf("Yes\n");        else printf("No\n");    }    return 0;}

转载地址：http://vcor.baihongyu.com/

你可能感兴趣的文章