彻底过滤掉搜索结果中的图片地址(如 img/20241122%E5%BE%90%E5%B7%9E%E..),核心是增强 removeLinks函数,新增图片路径、图片文件、URL 编码字符的过滤规则。

核心修改点

  1. 重命名并增强 removeLinks 为 removeLinksAndImages:新增图片路径 / 文件 / 编码字符过滤
  2. 过滤所有图片相关内容:匹配 img/images 路径、.jpg/.png 等图片后缀、URL 编码字符(如 %E5)
  3. 移除所有 HTML 标签:彻底剥离 <img>/<a> 等标签,仅保留纯文本

关键修改说明

调整项原逻辑新逻辑(增强版 removeLinksAndImages)
函数命名removeLinks重命名为 removeLinksAndImages,语义更清晰
HTML 标签处理仅移除<a>标签移除所有 HTML 标签(<img>/<a>/<div>等),彻底剥离标签
图片路径过滤匹配 img/images/ 开头的路径(包括相对路径 ./img/../img/),直接清空
图片文件过滤匹配 .jpg/.png/.gif 等图片后缀的路径,彻底移除
URL 编码过滤移除 %E5%BE%90 这类 URL 编码字符,避免乱码 / 数字残留

效果验证

搜索 “22” 时,以下内容会被彻底过滤:

  • 图片路径:img/20241122%E5%BE%90%E5%B7%9E%E.. → 直接清空
  • 图片文件名:20241122_xxx.jpg → 直接清空
  • URL 编码字符:%E5%BE%90 → 直接清空
  • 仅保留文章中的纯文本内容,不会出现任何图片地址 / 数字残留