拥有 信息检索 标签的文章 共 5 条数据

Solr权威指南 下卷 兰小伟著 PDF下载
编程书籍

Solr权威指南 下卷 兰小伟著 PDF下载

408次浏览 0条评论

本书以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。序 言 第11章Solr高级查询 1 11.1Solr函数查询 2 11.1.1Function语

Solr权威指南 上卷 兰小伟著 PDF下载
编程书籍

Solr权威指南 上卷 兰小伟著 PDF下载

473次浏览 0条评论

本书以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。序言 第1章 初识Solr 1 1.1 Solr是什么 1 1.2 Solr的历史 2 1.3 为

搜索引擎:原理、技术与系统 PDF下载
编程书籍

搜索引擎:原理、技术与系统 PDF下载

528次浏览 0条评论

《搜索引擎:原理技术与系统》系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。《搜索引擎:原理技术与系统》分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的web信息服务,阐述了中文网页自动分类等技术及其应用。《搜索引擎:原理技术与系统》层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。前言第一章 引论第一节 搜索引擎的概念第二节 搜索引擎的发展历史第三节 一些著名的搜索引擎上篇 Web搜索引擎基本原理和技术第二章 Web搜索引擎工作原理和体系结构第一节 基本要求第二节 网页搜集第三节 预处理第四节 查询服务第五节 体系结构第三章 Web信息的搜集第一节  引言一、超文本传输协议二、一个小型搜索引擎系统第二节 网页搜集一、定义LJRL类和Page类二、与服务器建立连接三、发送请求和接收数据四、网页信息存储的天网格式第三节 多道搜集程序并行工作一、多线程并发工作二、控制对一个站点并发搜集线程的数目第四节 如何避免网页的重复搜

深入搜索引擎:海量信息的压缩、索引和查询 PDF下载
编程书籍

深入搜索引擎:海量信息的压缩、索引和查询 PDF下载

531次浏览 0条评论

《深入搜索引擎:海量信息的压缩、索引和查询》是斯坦福大学信息检索和挖掘课程的首选教材之一,并已成为全球主要大学信息检索的主要教材。《深入搜索引擎:海量信息的压缩、索引和查询》理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。《深入搜索引擎:海量信息的压缩、索引和查询》作为斯坦福大学信息检索课程的教材之一,具有一定的阅读难度,主要面向信息检索专业高年级本科生和研究生、搜索引擎业界的专业技术人员和从事海量数据处理相关专业的技术人员。第1章 概览 1.1 文档数据库(DOCUMENT DATABASES) 1.2 压缩(COMPRESSION) 1.3 索引(INDEXES) 1.4 文档索引 1.5 MG海量文档管理系统 1.6 进一步阅读 第2章 文本压缩 2.1 模型 2.2 自适应模型 2.3 哈夫曼编码 范式哈夫曼编码 计算哈夫曼编码长度 总结 2.4 算术编码 算术编码是如何工作的 实现算术编码 保存累积计数 2.5 符号模型 部分

这就是搜索引擎:核心技术详解 张俊林著 PDF下载
编程书籍

这就是搜索引擎:核心技术详解 张俊林著 PDF下载

565次浏览 0条评论

搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。本书的最大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外,还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术,同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。另外,本书也密切关注搜索引擎发展的前沿技术:Google的咖啡因系统及Megastore等云计算新技术、百度的暗网抓取技术阿拉丁计划、内容农场作弊、机器学习排序等。诸多新技术在相关章节都有详细讲解,同时对于社会化搜索、实时搜索及情境搜索等搜索引擎的未来发展方向做了技术展望。为了增进读者的理解,全书大量引入形象的图片来讲解算法原理,相信读者会发现原来搜索引擎的核心技术理解起来比原先想象的要简单得多。目 录 第1章 搜索引擎及其技术架构 1 1.1 搜索引擎为何