博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
中文分词(mmseg4j)
阅读量:6616 次
发布时间:2019-06-25

本文共 951 字,大约阅读时间需要 3 分钟。

hot3.png

package com.leixinhui.test;import java.io.IOException;import java.io.Reader;import java.io.StringReader;import com.chenlb.mmseg4j.ComplexSeg;import com.chenlb.mmseg4j.Dictionary;import com.chenlb.mmseg4j.MMSeg;import com.chenlb.mmseg4j.Seg;import com.chenlb.mmseg4j.Word;public class Test {	/**	 * @param args	 */	public static void main(String[] args) {		Reader reader = null;		Dictionary dic = null;		Seg seg = null;		MMSeg mmSeg = null;		Word word = null;				reader = new StringReader("我不做C语言程序已经有一段时间了。三聚氰胺、量规等词汇都是专业术语。");		dic = Dictionary.getInstance();		seg = new ComplexSeg(dic);		mmSeg = new MMSeg(reader, seg);				try {			while(null != (word=mmSeg.next())){				System.out.println(word.getString());			}		} catch (IOException e) {			e.printStackTrace();		} finally {			try {				if(null != reader) reader.close();			} catch (IOException e) {				e.printStackTrace();			}		}	}}

备注:使用mmseg4j-1.8.5

转载于:https://my.oschina.net/u/1757446/blog/289966

你可能感兴趣的文章
《Excel 职场手册:260招菜鸟变达人》一第 2 招 常用快捷键Windows与Mac对照
查看>>
《Greenplum企业应用实战》一第1章 Greenplum简介1.1 Greenplum的起源和发展历程
查看>>
开源世界已成围城:成本让企业蜂拥而来,也让企业退缩转投
查看>>
《Python编程快速上手——让繁琐工作自动化》——1.4 在变量中保存值
查看>>
想改进你的卷积神经网络?看看这14种设计模式!
查看>>
安装完最小化 RHEL/CentOS 7 后需要做的 30 件事情(六)
查看>>
[LeetCode]--100. Same Tree
查看>>
阿里蒋晓伟谈流计算和批处理引擎Blink,以及Flink和Spark的异同与优势
查看>>
快速掌握Redis——第二招:安装
查看>>
从Jetty、Tomcat和Mina中提炼NIO构架网络服务器的经典模式(一)
查看>>
Windows 10之 隐藏“此电脑”窗口的6个额外文件夹
查看>>
15.1异常处理
查看>>
HAProxy负载均衡web服务
查看>>
初学者学习Linux之NFS
查看>>
Rabbitmq学习(一) Rabbitmq初探
查看>>
8月第一周B2B类网站排名:阿里巴巴持续领先
查看>>
IDC评述网:12月下旬国内域名注册商净增量Top10
查看>>
5月第一周全球域名解析商Top15:万网升至第7名
查看>>
架构优化 - 应用,MQ Broker,业务处理分层
查看>>
3月第3周网络安全报告:被篡改.COM网站占74.3%
查看>>