当前位置: 首页 > news >正文

wordpress在线搭建百度网站免费优化软件下载

wordpress在线搭建,百度网站免费优化软件下载,长沙网站seo优化排名,用动易做的校园网站搜索引擎架构 整个搜索引擎分为三个系统 爬虫系统 索引系统 线上搜素服务 爬虫系统 爬虫分为两个阶段: 第一阶段:根据目标网站的列表页,爬对应的文档 URL 第二阶段:根据文档 URL,下载文档内容 触发器&#xff1…

搜索引擎架构

整个搜索引擎分为三个系统

  1. 爬虫系统

  2. 索引系统

  3. 线上搜素服务

爬虫系统

爬虫分为两个阶段:

  1. 第一阶段:根据目标网站的列表页,爬对应的文档 URL

  2. 第二阶段:根据文档 URL,下载文档内容

触发器:

  • 定时任务触发

  • 消息触发

  • 管理后台手动触发某一个爬虫任务

文件服务器:

  • 存储图片和视频文件

索引系统

索引系统主要数据依赖:内容库和文件服务

依赖服务:

  1. 分词服务

  2. NLP 服务

    1. 同义词扩展

    2. 生成文档摘要

    3. 抽取文档标签

    4. 图片、文本、视频生成向量

    5. ....

  3. PageRank 服务

在线搜索服务

在线服务的主要模块:

  1. Query 理解

  2. 召回

  3. 排序

当欠召回时:

  1. 在线服务会将当前 Query 发送给离线索引系统的消息队列,让其为该 Query 完善索引数据。

  2. 索引系统收到消息后,会使用第三方搜索引擎进行检索,并且将检索的内容解析出 URL,发给爬虫系统,进行数据的补充。

  3. 如果第三方搜索引擎也没有检索到数据,可以通过 LLM 进行生成内容,将生成的内容写入 ES 索引

http://www.fp688.cn/news/161020.html

相关文章:

  • 天河区做网站公司hao123上网从这里开始官方
  • 临沂罗庄做网站公司网页设计制作网站html代码大全
  • 在百度上做网站怎么做一媒体app软件下载老版本
  • 南阳做网站收费网络销售每天做什么
  • 环保h5微网站品牌网站建设制作
  • 济南网站微信百度搜索工具
  • 最好的做网站公司有哪些越秀seo搜索引擎优化
  • 我要看一集片做网站比较靠谱的推广公司
  • 电商网站维护seo课程培训
  • 营销型网站sem投放策略看广告赚钱的平台
  • 可以免费做网站推广的平台整站优化seo公司哪家好
  • 南宁建设信息网站企业网站建设方案模板
  • 网站都有什么类型的十大基本营销方式
  • 成都网站建设推来客网站推广公司排名
  • 深圳门窗在哪里网站做推广整站优化要多少钱
  • 网站被模仿如何维权torrentkitty磁力猫引擎
  • 成都新线加做网站郑州做网站公司排名
  • asp 动态网站开发域名注册腾讯云
  • 东莞网站建设及外包国外市场网站推广公司
  • 怎么看一个网站是用什么程序做的如何介绍自己设计的网页
  • 允许发外链的网站最近一周的新闻大事10条
  • p2p做网站seo搜索引擎优化怎么做
  • h5做的公司网站国外引擎搜索
  • 做课件网站专门看网站的浏览器
  • 招生网站模板google广告投放技巧
  • 高密做网站哪家强价位抖音账号权重查询入口
  • 云服务器最便宜绍兴百度seo排名
  • 室内设计网课站长工具seo综合查询权重
  • 网站怎样推广 优帮云惠州网站营销推广
  • 陕西网站建设美化个人网站首页设计