一、搜索引擎,自带Web服务器及中文分词

  • 功能描述:通过文本关键字,快搜找到包含该关键字的文章。
  • 主要应用:网站搜索,文档库检索
  • 参考网站:baidu.com  google.com
  • 当前状态:完成
  • 演示网址: 点击演示 (如果进不去,可能是服务器暂时关闭,可以稍候再试)

二、基于图像视觉内容的图片相似度搜索引擎系统

三、文章相似度(重复)识别系统

  • 功能描述:基于搜索引擎技术,识别出某一篇文章与文档库里的一篇或多篇文章的相似度,可以判断出是否文档重复或是抄袭。高级功能可能从Internet上的网页识别相似度。
  • 主要应用:论文抄袭识别,网站论坛发贴文章重复识别。
  • 国外参考网站:turnitin.com
  • 当前状态:完成
  • 演示网址: 点击演示 (如果进不去,可能是服务器暂时关闭,可以稍候再试)

四、基于图像视觉内容的图片重复识别及自动分类

  • 功能描述:基于图像视觉内容搜索技术,识别出某一图处与图片库里图片的相似度,可以判断出是否重复或类似,并进行自动分类。
  • 主要应用:网站论坛发贴图片的重复或类似识别,或进行自动分类。
  • 当前状态:内部测试

五、相关文章自动分类系统

  • 功能描述:根据文章的相关度,自动对文章进行分类。
  • 主要应用:
  • 当前状态:开发中...

六、网站采集蜘蛛Spider,数据采集机器人

  • 功能描述:根据采集规则对给定的一个或多个网站,进行数据采集,并去除干扰噪音提取格式化数据。
  • 主要应用:
  • 当前状态:

七、中文分词

八、关于SQLET

SQLET 是由 Search (或Spider) Quester + 后缀let 缩写而成,意为小型的搜索引擎及检索查询

共同探讨 email:199909##gmail.com