134 lines
4.8 KiB
JavaScript
134 lines
4.8 KiB
JavaScript
/**
|
||
*https://leetcode.cn/problems/find-the-index-of-the-first-occurrence-in-a-string/?envType=study-plan-v2&envId=top-interview-150
|
||
* @param {string} haystack
|
||
* @param {string} needle
|
||
* @return {number}
|
||
*/
|
||
const strStr = function (haystack, needle) {
|
||
// return haystack.indexOf(needle); // 直接使用数组api
|
||
};
|
||
|
||
/*
|
||
暴力解法,暴力解法思路非常简单,needle和haystack所有和needle长度一致的子串,如果匹配到相同的就返回,如果没有匹配到就返回-1
|
||
*/
|
||
function f1(haystack, needle) {
|
||
// 如果要查找的子串比字符串还长,直接返回
|
||
if (haystack.length < needle.length) return -1;
|
||
const lastIndex = haystack.length - needle.length; // haystack中最后一个子串的起始下标
|
||
for (let i = 0; i <= lastIndex; i++) {
|
||
let match = true;
|
||
for (let j = 0; j < needle.length; j++) {
|
||
if (haystack[i + j] !== needle[j]) {
|
||
// 当前位置的子串不符合要求,直接结束循环
|
||
match = false;
|
||
break;
|
||
}
|
||
}
|
||
if (match) {
|
||
return i;
|
||
}
|
||
}
|
||
return -1; // 如果不匹配直接返回-1
|
||
}
|
||
|
||
/*
|
||
使用kmp来快速找出匹配的子串
|
||
*/
|
||
const kmpSearch = function (haystack, needle) {
|
||
const n = haystack.length;
|
||
const m = needle.length;
|
||
|
||
// 如果模式字符串为空,直接返回0
|
||
if (m === 0) {
|
||
return 0;
|
||
}
|
||
|
||
// 构建部分匹配表 (pi数组),用于记录模式串的匹配信息
|
||
const pi = new Array(m).fill(0);
|
||
|
||
// 计算pi数组
|
||
for (let i = 1, j = 0; i < m; i++) {
|
||
// 如果当前字符不匹配,则回溯到之前匹配的部分
|
||
while (j > 0 && needle[i] !== needle[j]) {
|
||
j = pi[j - 1]; // 回溯到上一个可能的匹配位置
|
||
}
|
||
|
||
// 如果当前字符匹配,增加匹配长度
|
||
if (needle[i] === needle[j]) {
|
||
j++;
|
||
}
|
||
|
||
// 更新pi数组
|
||
pi[i] = j;
|
||
}
|
||
|
||
// 开始搜索主字符串haystack
|
||
for (let i = 0, j = 0; i < n; i++) {
|
||
// 如果当前字符不匹配,则回溯
|
||
while (j > 0 && haystack[i] !== needle[j]) {
|
||
j = pi[j - 1]; // 回溯到上一个可能的匹配位置
|
||
}
|
||
|
||
// 如果匹配成功,继续检查下一个字符
|
||
if (haystack[i] === needle[j]) {
|
||
j++;
|
||
}
|
||
|
||
// 如果完整匹配模式串,则返回匹配的起始位置
|
||
if (j === m) {
|
||
return i - m + 1;
|
||
}
|
||
}
|
||
|
||
// 如果没有匹配成功,返回-1
|
||
return -1;
|
||
};
|
||
|
||
/*
|
||
使用kmp,上面的写法是leetcode官方提供的,我按照自己的理解也写了下面这部分实现
|
||
*/
|
||
function f2(haystack, needle) {
|
||
const n = haystack.length; // 匹配串的长度
|
||
const m = needle.length; // 模式串的长度
|
||
|
||
// 1. 如果想使用kmp来快速跳过无用的遍历,就需要计算出模式串needle的next数组
|
||
const next = new Array(m).fill(0); // 初始化所有位置的前缀值为0(值初始化第一个位置也行)
|
||
for (let i = 1, j = 0; i < m; i++) { // i指向后缀的最后一个字符,j指向前缀的最后一个字符,按照kmp对前缀的定义,i初始化为1,j初始化为0
|
||
// 如果不相等,表示i指向的这个后缀最后一个字符和j指向前缀的最后一个字符不相等,这个时候我们需要找next[j-1]这个位置的字符
|
||
// 是否等于i指向的这个字符,以abaabaf为例,假设现在j指向abaa,i指向abaf,由于j和i指向的字符不相等,所以按照要求j应该移动
|
||
// next[j-1]的位置,j-1指向的是aba,next[j-1]表示的就是最大公共前后缀的长度那就是前缀”a“和后缀”a“长度为1,所以j指向了1,
|
||
// j=1时 指向的b并不等于f,所以还要继续把j移动到当前位置的next[j-1],所以这是一个循环的过程,并且要保证j>0,不然就会出现越界错误
|
||
// 上面的描述可能有点模糊可能体现不出为什么需要把j移动到next[j-1]的位置,
|
||
// abaabaf j = 3, i = 6, 前缀abaa 后缀abaf,显然不相等 所以后缀不可能包含aba了,只能aba里面的最大工作前后缀
|
||
// abaabaf j = 1, i = 6, 前缀ab,后缀af,显然不相等,继续往前找
|
||
while (j > 0 && needle[i] !== needle[j]) {
|
||
j = next[j - 1];
|
||
}
|
||
if (needle[i] === needle[j]) { // 如果相等,表示最大相同前缀需要往后移动一位
|
||
j++;
|
||
}
|
||
// 把当前j表示的就是最大前后缀长度
|
||
next[i] = j;
|
||
}
|
||
|
||
// 经过上面的计算,我们获得了一个模式串的next数组,现在我们就可以通过这个数组快速匹配了
|
||
for (let i = 0, j = 0; i < n; i++) {
|
||
// 如果当前字符不匹配,则回溯
|
||
while (j > 0 && haystack[i] !== needle[j]) {
|
||
j = next[j - 1]; // 回溯到上一个可能的匹配位置
|
||
}
|
||
|
||
// 如果匹配成功,继续检查下一个字符
|
||
if (haystack[i] === needle[j]) {
|
||
j++;
|
||
}
|
||
|
||
// 如果完整匹配模式串,则返回匹配的起始位置
|
||
if (j === m) {
|
||
return i - m + 1;
|
||
}
|
||
}
|
||
|
||
return -1; // 没有匹配到
|
||
}
|