与基于隐马尔可夫模型的最短路径分词、N-最短路径分词相比,基于条件随机场(CRF)的分词对未登录词有更好的支持。本文(HanLP)使用纯Java实现CRF模型的读取与维特比后向解码,内部特征函数采用 双数组Trie树(DoubleArrayTrie)储存,得到了一个高性...
water
9年前 (2015-09-28) 4005℃ 0评论
0喜欢
首先下载Linux版本发布包 CRF++-0.58.tar.gz ,然后将其解压并进入解压路径中,敲入以下命令安装:
% ./configure
% make
% ...
water
9年前 (2015-09-28) 4251℃ 0评论
0喜欢
Java常用的两个PATH:CLASSPATH和java.library.path
CLASSPATH:指定JVM查找类文件的目录或jar
java.library.path:指定JVM查找动态连接库的目录(*.dll,*.so,*.dylib)
解决办法:
1.LINUX下的通...
water
9年前 (2015-09-28) 4650℃ 0评论
0喜欢
\uxxxx这种格式是Unicode写法,表示一个字符,其中xxxx表示一个16进制数字,范围所0~65535. Unicode十六进制数只能包含数字0~9、大写字母A~F或者小写字母A~F。需要注意到是:Unicode的大小端问题,一般都是小端在前,例如 \u5c0f 表示汉语...
water
9年前 (2015-09-25) 19925℃ 0评论
8喜欢
分布式搜索elasticsearch集群监控工具bigdesk
bigdesk是elasticsearch的一个集群监控工具,可以通过它来查看es集群的各种状态,如:cpu、内存使用情况,索引数据、搜索情况,http连接数等。项目git地址: 。和head一样,它也...
water
9年前 (2015-09-24) 2818℃ 0评论
0喜欢
akka2.0中文文档
http://www.gtan.com/akka_doc/index.html
scala视频教程
http://www.gtan.com/welfare05.html
转载请注明:学时网 » akka和scala学习...
water
9年前 (2015-09-14) 3075℃ 0评论
0喜欢
守望历史 为了和平
——写在中国人民抗日战争暨世界反法西斯战争胜利70周年之际
(一)这是一场跨越70年的检阅,这是一次面向未来的重温。
初秋的北京,天安门广场装饰一新,人民英雄纪念碑直指苍穹。明天,新中国第一次纪念中国人民抗日战争暨世界反法西斯战争胜利阅兵将...
water
9年前 (2015-09-02) 2660℃ 0评论
0喜欢