-
Luncene 特殊字符查询处理
参考solr的处理方式:/***See:{@linkorg.apache.lucene.queryparser.classicqueryparsersyntax}*formoreinformationonEscapingSpecialCharacters*/publicstaticStringescapeQueryChars(Strings){StringBuildersb=newStringBu......2,722 0 2017-10-20 18:36
-
Luncene 多字段查询记录
多字段查询需要使用MultiFieldQueryParser来做解析:Stringparams[]=newString[]{par,par};Stringfields[]=newString[]{"title","context"};BooleanClause.Occurrules[]=newBooleanClause.Occur[]{BooleanClause.Occur.SHOULD,Bool......3,596 0 2017-10-18 14:27
-
jdbc更新/新增后返回记录id
简单记录下,爬虫项目中需要用到的,细节代码就不贴出来了。/***增加、删除、改*@paramsql*@paramparams*@return*@throwsSQLException*/publicstaticIntegerupdateByPreparedStatement(Stringsql,List<Object>params)throwsSQLException{intresult......2,191 4 2017-10-16 15:32
-
图片无损压缩工具
这也是博客将使用的图片压缩方法:工具类:importcom.sun.image.codec.jpeg.JPEGCodec;importcom.sun.image.codec.jpeg.JPEGEncodeParam;importcom.sun.image.codec.jpeg.JPEGImageEncoder;importjavax.imageio.ImageIO;importjavax.imag......22,940 2 2017-10-16 11:25
-
Springboot 过滤json中的特殊字符,避免xss攻击
web安全中,xss防御是比较稀疏平常的。在使用springboot中,类似于普通的参数parameter,attribute,header一类的,可以直接使用过滤器来过滤。而前端发送回来的json字符串貌似没那么方便过滤了。一般在springboot中,前端传递json,后端使用@RequestBody来接收;而后端响应json发送至前端,则会使用@ResponseBody。这里考虑用自定义js......6,334 0 2017-10-12 14:46
-
Idea下,Springboot热部署配置
1、开启idea的自动make功能:CTRL+SHIFT+A-->查找makeprojectautomatically-->选中CTRL+SHIFT+A-->查找Registry-->找到并勾选compiler.automake.allow.when.app.running2、使用spring-boot-1.3开始有的热部署功能:先在项目中添加maven依赖<depe......3,081 0 2017-10-09 10:14
-
仿Mongodb 主键 ,ObjectId 生成短随机字符
importjava.io.Serializable;importjava.lang.management.ManagementFactory;importjava.net.NetworkInterface;importjava.nio.BufferUnderflowException;importjava.nio.ByteBuffer;importjava.security.SecureRand......1,222 0 2017-09-29 17:36
-
java过滤HTML中的标签获取纯文本
publicstaticStringhtml2Text(StringhtmlStr){PatternscrpitPat;MatcherscriptMat;PatternstylePat;MatcherstyleMat;PatternhtmlPat;MatcherhtmlMat;try{//定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\......3,426 0 2017-09-27 18:29
-
java freemarker生成静态网页 简单例子
一些不常更新数据的页面可以使用freemarker生成静态页面,访问的时候直接访问静态页面即可,这样可以减少不少后端的压力。时间不多,简单记录下这个例子:项目目录如下:pom.xml添加freemarker的依赖:<dependency><groupId>org.freemarker</groupId><artifactId>freemarker&l......3,730 4 2017-09-26 19:17
-
java urlrewrite简单配置实现伪静态
考虑使用urlrewrite的原因有两个:一是美化地址栏隐藏原有的真实地址,二是实现伪静态化有利于搜索引擎收录。举个栗子:Link-Nemo的首页的某个文章的地址为:https://www.link-nemo.com/Kira/article/detail.do?a=pk3vcxFntjIwcKPEpbn使用urlrewrite之后,访问地址可以是:https://www.link-nemo.co......2,553 0 2017-09-26 17:25
-
Luncene 多线程索引解决方案记录
实际测试情况下,发现每个创建索引线程操作时,索引目录均会生成一个write.lock文件。而此时当有其他线程也在操作创建索引的时候,会抛出org.apache.lucene.store.LockObtainFailedException: Lock held by this virtual machine: F:\blogInd......3,909 0 2017-09-25 15:11
-
这一个测试资源,福利在回复之后可见
嘛哩嘛哩哄发福利啦!你看到了没?看到了没?对,就是这个啦!看到了没?哈哈,是不是很惊喜?惊不惊喜,意不意外?在写文章的时候,你可以加入如下标签即可让你的文章隐藏一些内容啦~如图中,"我是一个需要回复可见的内容"就会被提示回复可见啦~快来试试吧!15,319 14 2017-09-23 18:39
-
Lucene 创建全文检索基本原理记录
基本过程有两部分:索引和搜索。1.索引过程:1)有一系列被索引文件2)被索引文件经过语法分析和语言处理形成一系列词(Term)。3)经过索引创建形成词典和反向索引表。4)通过索引存储将索引写入硬盘。2.搜索过程:a)用户输入查询语句。b)对查询语句经过语法分析和语言分析得到一系列词(Term)。c)通过语法分析得到一个查询树。d)通过索引存储将索引读入到内存。e)利用查询树搜索索引,从而得到每个词......4,591 0 2017-09-21 09:56
-
Lucene入门样例 - 第一个demo
这两天正好有点空闲,稍稍看了一些lucene的内容。晚点可能会在link-nemo上加入相关的使用。这里先记录一个最简单的样例代码。Lucene是apache基金会里头比较有名的一个项目了,之前用过基于它的另一个全文检索框架Solr。需要的依赖jar:<groupId>org.apache.lucenegroupId>lucene-core</artifactId>5......3,444 2 2017-09-20 18:34
-
HTML操作工具 - 正则HTML中获取图片地址列表
代码:importjava.util.ArrayList;importjava.util.List;importjava.util.regex.Matcher;importjava.util.regex.Pattern;/***Html操作工具*CreatedbyNemoon2017/9/20.*/publicclassHtmlUtil{/***正常获取一段html中的图片列表*@params*@......1,684 0 2017-09-20 14:03